Comparación de medias entre dos grupos en estadística aplicada, UIB

Diapositivas de UIB Universitat de Les Illes Balears sobre la comparación de medias entre dos grupos. El Pdf aborda el test T-Student, condiciones de aplicación, test de normalidad, prueba U de Mann Whitney y Wilcoxon, útil para estudiantes universitarios de Matemáticas.

Ver más

60 páginas

Tema 6. Comparación de medias entre dos grupos
22706 ESTADÍSTICAS APLICADAS A LAS CIENCIAS DE LA SALUD
Prof. Dr. Sergio Fresneda Genovard
Margalida Comas i Camps Despacho 207
Tutorías: Lunes 12.30-14.00h (contactar antes)
s.fresneda@uib.es
!"#$%&
Estadís'cas Aplicadas a
las Ciencias de la Salud
T-Student
T-Student para datos apareados
Condiciones de aplicación y test de normalidad
Prueba U de Mann Withney
Prueba de los rangos con signo de Wilcoxon
!
"
#
$
%

Visualiza gratis el PDF completo

Regístrate para acceder al documento completo y transformarlo con la IA.

Vista previa

UIB

Universitat de les Illes Balears Departament d'Infermeria i Fisioterapia

22706 - ESTADÍSTICAS APLICADAS A LAS CIENCIAS DE LA SALUD Tema 6. Comparación de medias entre dos grupos Prof. Dr. Sergio Fresneda Genovard Margalida Comas i Camps - Despacho 207 Tutorías: Lunes 12.30-14.00h (contactar antes) s.fresneda@uib.es

Índice

  1. T-Student
  2. T-Student para datos apareados
  3. Condiciones de aplicación y test de normalidad

Estadísticas Aplicadas a las Ciencias de la Salud

  1. Prueba U de Mann Withney
  2. Prueba de los rangos con signo de Wilcoxon

Análisis bivariante

Estadísticos ya vistos

Prueba paramétrica Prueba no paramétrica

Comparación de medias

2 grupos independientes

t de Student U de Mann Withney

2 grupos apareados

t de Student para datos apareados Wilcoxon

3 o más grupos

ANOVA Kruskal Wallis

Comparación de variables cualitativas

Chi cuadrado Prueba exacta de Fisher

Comparación de variables cualitativas (apareados)

Mc Nemar

Asociación entre 2 variables cuantitativas

Coeficiente de correlación de Pearson Coeficiente de correlación de Spearman

Análisis bivariante

Prueba paramétrica Prueba no paramétrica

Comparación de medias

2 grupos independientes

t de Student U de Mann Withney

2 grupos apareados

t de Student para datos apareados Wilcoxon

3 o más grupos

ANOVA Kruskal Wallis

Comparación de variables cualitativas

Chi cuadrado Prueba exacta de Fisher

Comparación de variables cualitativas (apareados)

Mc Nemar

Asociación entre 2 variables cuantitativas

Coeficiente de correlación de Pearson Coeficiente de correlación de Spearman

Diferencias de una variable numérica entre 2 grupos

Diferencias que presenta una variable numérica entre 2 grupos Procedimientos para contrastar si las diferencias numéricas obtenidas al comparar 2 tratamientos (o dos poblaciones) son lo suficientemente grandes como para que su única causa atribuible sea el azar. Este tipo de pruebas se suelen usar cuando se elige una muestra de individuos en el que un grupo ha seguido cierto tratamiento (por ejemplo, un placebo) y otro grupo que ha recibido otro tratamiento (por ejemplo, un fármaco).

Comparación de medias: Tipos de diseño

Existen 2 tipos de diseños de estudio en el que se comparan dos poblaciones:

  1. Las dos muestras se pueden extraer de dos poblaciones diferentes (por ejemplo hombres y mujeres o pacientes que toman el fármaco A o el fármaco B) - Sujetos independientes o muestras independientes. - T-student parar muestras independientes.
  2. Los dos grupos de datos provienen de poblaciones relacionadas. Por ejemplo datos de tratamiento tipo "antes" y "después", el mismo paciente toma el tratamiento A y después el tratamiento B - Muestras relacionadas. - T-student para muestras relacionadas

La cerveza y la estadística

VOLUME VI MARCH, 1908 No. 1 BIOMETRIKA. THE PROBABLE ERROR OF A MEAN. BY STUDENT. Introduction. ANY experiment may be regarded as forming an individual of a " population" of experiments which might be performed under the same conditions. A series of experiments is a sample drawn from this population. Now any series of experiments is only of value in so far as it enables us to form a judgment as to the statistical constants of the population to which the experi- ments belong. In a great number of cases the question finally turns on the value of a mean, either directly, or as the mean difference between the two quantities. If the number of experiments be very large, we may have precise information as to the value of the mean, but if our sample be small, we have two sources of uncertainty :- (1) owing to the "error of random sampling" the mean of our series of experiments deviates more or less widely from the mean of the population, and (2) the sample is not sufficiently large to determine what is the law of distribution of individuals. It is usual, however, to assume a normal distribution, because, in a very large number of cases, this gives an approximation so close that a small sample will give no real information as to the manner in which the population deviates from normality : since some law of distribution must be assumed it is better to work with a curve whose area and ordinates are tabled, and whose properties are well known. This assumption is accordingly made in the present paper, so that its conclusions are not strictly applicable to populations known not to be normally distributed ; yet it appears probable that the deviation from normality must be very extreme to lead to serious error. We are concerned here solely with the first of these two sources of uncertainty. The usual method of determining the probability that the mean of the popula- tion lies within a given distance of the mean of the sample, is to assume a normal distribution about the mean of the sample with a standard deviation equal to a/Vn, where s is the standard deviation of the sample, and to use the tables of the probability integral. Biometrika vi

- William Sealy Gosset (1876-1937) fue un estadístico británico conocido por su apodo "Student" (Guiness no le dejaban utilizar su nombre) estudió química y matemáticas y se incorporó a las destilerías Guinness en Dublín. Guinness era un negocio progresista y Gosset pretendía aplicar sus conocimientos. Escribió diferentes artículos entre ellos "El error probable de una media" en el que se incluye la famosa t de Student. El interés de Gosset en el cultivo de la cebada le llevó a especular que el diseño de experimentos debería dirigirse no sólo a mejorar la producción media, sino también a desarrollar variedades cuya producción no se viese afectada (robusta) por las variaciones en el suelo y el clima.

m1 - m2 t = Vn1 .2 $2+ s2 n2

La cerveza y la estadística

Características organolépticas de la cerveza según la variedad de cebada utilizada

5,00 4,00 Variedad de cebada N PH DE Ordenum Distichum 10 4,500 0,275 Ordenum Dexastichum 10 3,649 0,295 3,00- PH 2,00- GUINNESS DRAUGHT ¿HO y H1 ? 1,00 ,00 Ordenum Distichum Ordenum Dexastichum Variedad de cebada

Comparación de 2 medias

Se mide el nivel de acidez en los 2 grupos: A. Ordenum Dischitum B. Ordenum Dexastichum

1 2 3 4 5 6 7 8 9 10

A (mg/dl) 4,20 4,50 4,60 4,80 4,30 4,50 4,80 4,90 4,10 4,30

B (mg/dl) 3,90 3,60 3,50 3,39 4,00 4,20 4,10 3,20 3,50 3,10

Calculamos la media para cada grupo: A=4,50 B=3,64 ¿Son diferentes? ¿Es posible que las diferencias que observamos sean consecuencia del azar?

Comparación de 2 medias

Utilizaremos el estadístico t:

t = m1 - m2 s2 + s2 V n1 n2

m1-m2 = 0,86 (Diferencia entre los dos grupos) DE= 0,28 (Desviación estándar) n= 10 (Nº de observaciones)

La distribución del estadístico "t" bajo la hipótesis nula sigue una t- student. En las tablas de esta distribución se puede localizar el valor de t para dos muestras independientes de 10 cervezas (es decir con 18 grados de libertad) y un nivel de significación de 0,05 que es el habitual (nivel crítico): t(18)0,05=2,101

Calculamos el valor de t para nuestra muestra:

g.l. = n1 + n2 - 2

0,86 t = = 6,87 0,282 + 0,282 10 10

Comparación de 2 medias

g.l. = n1 + n2 - 2

Dibujamos" la hipótesis nula (la t que esperaríamos si la HO fuera cierta) y marcamos la zona crítica con la ayuda de la tabla, es decir marcamos la zona de

9 a 0.50 0.40 0.30 0.20 0.10 0.05 0.02 0.01 0.001 1 1.000 1.376 1.963 3.078 6.314 12.706 31.821 63.657 636.619 2 0.816 1.061 1.386 1.886 2.920 4.303 6.965 9.925 31.598 3 0.765 0.978 1.250 1.638 2.353 3.1.82 4.541 5.841 12.929 4 0.741 0.941 1.190 1.533 2.132 2.176 3.747 4.604 8.610 5 0.727 0.920 1.156 1.476 2.015 2.571 3.365 4.032 6.869 6 0.718 0.906 1.134 1.440 1.943 2.147 3.143 3.707 5.959 7 0.711 0.896 1.119 1.415 1.895 2.865 2.998 3.499 5.408 8 0.706 0.889 1.108 1.397 1.860 2.106 2.896 3.355 5.041 0.703 0.883 1.100 1.383 1.833 2.262 2.821 3.250 4.781 10 0.700 0.879 1.093 1.372 1.812 2.128 2.764 3.169 4.587 11 0.697 0.876 1.088 1.363 1.796 2.101 2.718 3.106 4.437 12 0.695 0.873 1.003 1.356 1.782 2.179 2.681 3.055 4.318 13 0.694 0.870 1.079 1.350 1.771 2.160 2.650 3.012 4.221 14 0.692 0.868 1.076 1.345 1.761 2.145 2.624 2.977 4.140 15 0.691 0.866 1.074 1.341 1.753 2.131 2.602 2.947 4.073 16 0.690 0.865 1.071 1.337 1.746 20120 2.583 2.921 4.015 18 0.000 1.007 2.101 2.552 2.878 3.922 20 0.687 0.860 1.064 1.325 1.725 2.086 2.528 2.845 3.850 21 0.686 0.859 1.063 1.323 1.721 2.080 2.518 2.831 3.819 22 0.686 0.858 1.061 1.321 1.717 2.074 2.508 2.819 3.792 23 0.685 0.858 1.060 1.319 1.714 2.069 2.500 2.807 3.767 24 0.685 0.857 1.059 1.318 1.711 2.064 2.492 2.797 3.745 25 0.684 0.856 1.058 1.316 1.708 2.060 2.485 2.787 3.725 26 0.684 0.856 1.058 1.315 1.706 2.056 2.479 2.779 3.707 27 0.684 0.855 1.057 1.314 1.703 2.052 2.473 2.771 3.690 28 0.683 0.855 1.056 1.313 1.701 2.048 2.467 2.763 3.674 29 0.683 0.854 1.055 1.311 1.699 2.045 2.462 2.756 3.659 30 0.683 0.854 1.055 1.310 1.697 2.042 2.457 2.750 3.646 35 0.682 0.852 1.052 1.306 1.690 2.030 2.438 2.724 3.592 40 0.681 0.851 1.050 1.303 1.684 2.021 2.423 2.705 3.551 45 0.680 0.850 1.049 1.301 1.679 2.014 2.412 2.690 3.521 50 0.679 0.849 1.047 1.299 1.676 2.009 2.403 2.678 3.497 60 0.679 0.848 1.046 1.296 1.671 2.000 2.390 2.660 3.461 80 0.678 0.846 1.043 1.292 1.664 1.990 2.374 2.639 3.417 100 0.677 0.845 1.042 1.290 1.660 1.984 2.364 2.626 3.391 8 0.674 0.842 1.036 1.282 1.645 1.960 2.326 2.576 3.291 0.689 0.863 1.069 1.333 1.740 2.567 2.898 3.965 0.688 0.861 1.066 1.328 1.729 2.539 2.861 3.883 52 12 + 2 s2 Vn1 n2

El valor de t con los datos que observamos al realizar el experimento es:

t = 0,86 = 6,87 0,282 0,282 + 10 10

Distribución t de Student

a/2 a/2

4 00 0

Calculamos nuestra t:

t = rechazo -> t=2,101 m1 - m2

¿Rechazamos o aceptamos H0?

HO H1 (2,10) (6,87)

t = = 6,87 0,282 0,282 + 10 10

0,86 (18)(0,05)=2,10 6,87 está en la región crítica (es superior a 2,10) por tanto rechazamos Ho

¿Rechazamos o aceptamos H0?

Como 6,87 > 2,10 rechazamos la hipótesis nula y por tanto afirmamos que los dos grupos son diferentes (con una probabilidad de error menor al 5%).

Conclusión: Existen diferencias estadísticamente significativas en el pH de la cerveza según el tipo de semilla que se utiliza para cultivar la cebada.

¿Non has encontrado lo que buscabas?

Explora otros temas en la Algor library o crea directamente tus materiales con la IA.