Diapositivas de UIB Universitat de Les Illes Balears sobre la comparación de medias entre dos grupos. El Pdf aborda el test T-Student, condiciones de aplicación, test de normalidad, prueba U de Mann Whitney y Wilcoxon, útil para estudiantes universitarios de Matemáticas.
Ver más60 páginas


Visualiza gratis el PDF completo
Regístrate para acceder al documento completo y transformarlo con la IA.
Universitat de les Illes Balears Departament d'Infermeria i Fisioterapia
22706 - ESTADÍSTICAS APLICADAS A LAS CIENCIAS DE LA SALUD Tema 6. Comparación de medias entre dos grupos Prof. Dr. Sergio Fresneda Genovard Margalida Comas i Camps - Despacho 207 Tutorías: Lunes 12.30-14.00h (contactar antes) s.fresneda@uib.es
Estadísticas Aplicadas a las Ciencias de la Salud
Prueba paramétrica Prueba no paramétrica
t de Student U de Mann Withney
t de Student para datos apareados Wilcoxon
ANOVA Kruskal Wallis
Chi cuadrado Prueba exacta de Fisher
Mc Nemar
Coeficiente de correlación de Pearson Coeficiente de correlación de Spearman
Prueba paramétrica Prueba no paramétrica
t de Student U de Mann Withney
t de Student para datos apareados Wilcoxon
ANOVA Kruskal Wallis
Chi cuadrado Prueba exacta de Fisher
Mc Nemar
Coeficiente de correlación de Pearson Coeficiente de correlación de Spearman
Diferencias que presenta una variable numérica entre 2 grupos Procedimientos para contrastar si las diferencias numéricas obtenidas al comparar 2 tratamientos (o dos poblaciones) son lo suficientemente grandes como para que su única causa atribuible sea el azar. Este tipo de pruebas se suelen usar cuando se elige una muestra de individuos en el que un grupo ha seguido cierto tratamiento (por ejemplo, un placebo) y otro grupo que ha recibido otro tratamiento (por ejemplo, un fármaco).
Existen 2 tipos de diseños de estudio en el que se comparan dos poblaciones:
VOLUME VI MARCH, 1908 No. 1 BIOMETRIKA. THE PROBABLE ERROR OF A MEAN. BY STUDENT. Introduction. ANY experiment may be regarded as forming an individual of a " population" of experiments which might be performed under the same conditions. A series of experiments is a sample drawn from this population. Now any series of experiments is only of value in so far as it enables us to form a judgment as to the statistical constants of the population to which the experi- ments belong. In a great number of cases the question finally turns on the value of a mean, either directly, or as the mean difference between the two quantities. If the number of experiments be very large, we may have precise information as to the value of the mean, but if our sample be small, we have two sources of uncertainty :- (1) owing to the "error of random sampling" the mean of our series of experiments deviates more or less widely from the mean of the population, and (2) the sample is not sufficiently large to determine what is the law of distribution of individuals. It is usual, however, to assume a normal distribution, because, in a very large number of cases, this gives an approximation so close that a small sample will give no real information as to the manner in which the population deviates from normality : since some law of distribution must be assumed it is better to work with a curve whose area and ordinates are tabled, and whose properties are well known. This assumption is accordingly made in the present paper, so that its conclusions are not strictly applicable to populations known not to be normally distributed ; yet it appears probable that the deviation from normality must be very extreme to lead to serious error. We are concerned here solely with the first of these two sources of uncertainty. The usual method of determining the probability that the mean of the popula- tion lies within a given distance of the mean of the sample, is to assume a normal distribution about the mean of the sample with a standard deviation equal to a/Vn, where s is the standard deviation of the sample, and to use the tables of the probability integral. Biometrika vi
- William Sealy Gosset (1876-1937) fue un estadístico británico conocido por su apodo "Student" (Guiness no le dejaban utilizar su nombre) estudió química y matemáticas y se incorporó a las destilerías Guinness en Dublín. Guinness era un negocio progresista y Gosset pretendía aplicar sus conocimientos. Escribió diferentes artículos entre ellos "El error probable de una media" en el que se incluye la famosa t de Student. El interés de Gosset en el cultivo de la cebada le llevó a especular que el diseño de experimentos debería dirigirse no sólo a mejorar la producción media, sino también a desarrollar variedades cuya producción no se viese afectada (robusta) por las variaciones en el suelo y el clima.
m1 - m2 t = Vn1 .2 $2+ s2 n2
5,00 4,00 Variedad de cebada N PH DE Ordenum Distichum 10 4,500 0,275 Ordenum Dexastichum 10 3,649 0,295 3,00- PH 2,00- GUINNESS DRAUGHT ¿HO y H1 ? 1,00 ,00 Ordenum Distichum Ordenum Dexastichum Variedad de cebada
Se mide el nivel de acidez en los 2 grupos: A. Ordenum Dischitum B. Ordenum Dexastichum
1 2 3 4 5 6 7 8 9 10
A (mg/dl) 4,20 4,50 4,60 4,80 4,30 4,50 4,80 4,90 4,10 4,30
B (mg/dl) 3,90 3,60 3,50 3,39 4,00 4,20 4,10 3,20 3,50 3,10
Calculamos la media para cada grupo: A=4,50 B=3,64 ¿Son diferentes? ¿Es posible que las diferencias que observamos sean consecuencia del azar?
Utilizaremos el estadístico t:
t = m1 - m2 s2 + s2 V n1 n2
m1-m2 = 0,86 (Diferencia entre los dos grupos) DE= 0,28 (Desviación estándar) n= 10 (Nº de observaciones)
La distribución del estadístico "t" bajo la hipótesis nula sigue una t- student. En las tablas de esta distribución se puede localizar el valor de t para dos muestras independientes de 10 cervezas (es decir con 18 grados de libertad) y un nivel de significación de 0,05 que es el habitual (nivel crítico): t(18)0,05=2,101
Calculamos el valor de t para nuestra muestra:
g.l. = n1 + n2 - 2
0,86 t = = 6,87 0,282 + 0,282 10 10
g.l. = n1 + n2 - 2
Dibujamos" la hipótesis nula (la t que esperaríamos si la HO fuera cierta) y marcamos la zona crítica con la ayuda de la tabla, es decir marcamos la zona de
9 a 0.50 0.40 0.30 0.20 0.10 0.05 0.02 0.01 0.001 1 1.000 1.376 1.963 3.078 6.314 12.706 31.821 63.657 636.619 2 0.816 1.061 1.386 1.886 2.920 4.303 6.965 9.925 31.598 3 0.765 0.978 1.250 1.638 2.353 3.1.82 4.541 5.841 12.929 4 0.741 0.941 1.190 1.533 2.132 2.176 3.747 4.604 8.610 5 0.727 0.920 1.156 1.476 2.015 2.571 3.365 4.032 6.869 6 0.718 0.906 1.134 1.440 1.943 2.147 3.143 3.707 5.959 7 0.711 0.896 1.119 1.415 1.895 2.865 2.998 3.499 5.408 8 0.706 0.889 1.108 1.397 1.860 2.106 2.896 3.355 5.041 0.703 0.883 1.100 1.383 1.833 2.262 2.821 3.250 4.781 10 0.700 0.879 1.093 1.372 1.812 2.128 2.764 3.169 4.587 11 0.697 0.876 1.088 1.363 1.796 2.101 2.718 3.106 4.437 12 0.695 0.873 1.003 1.356 1.782 2.179 2.681 3.055 4.318 13 0.694 0.870 1.079 1.350 1.771 2.160 2.650 3.012 4.221 14 0.692 0.868 1.076 1.345 1.761 2.145 2.624 2.977 4.140 15 0.691 0.866 1.074 1.341 1.753 2.131 2.602 2.947 4.073 16 0.690 0.865 1.071 1.337 1.746 20120 2.583 2.921 4.015 18 0.000 1.007 2.101 2.552 2.878 3.922 20 0.687 0.860 1.064 1.325 1.725 2.086 2.528 2.845 3.850 21 0.686 0.859 1.063 1.323 1.721 2.080 2.518 2.831 3.819 22 0.686 0.858 1.061 1.321 1.717 2.074 2.508 2.819 3.792 23 0.685 0.858 1.060 1.319 1.714 2.069 2.500 2.807 3.767 24 0.685 0.857 1.059 1.318 1.711 2.064 2.492 2.797 3.745 25 0.684 0.856 1.058 1.316 1.708 2.060 2.485 2.787 3.725 26 0.684 0.856 1.058 1.315 1.706 2.056 2.479 2.779 3.707 27 0.684 0.855 1.057 1.314 1.703 2.052 2.473 2.771 3.690 28 0.683 0.855 1.056 1.313 1.701 2.048 2.467 2.763 3.674 29 0.683 0.854 1.055 1.311 1.699 2.045 2.462 2.756 3.659 30 0.683 0.854 1.055 1.310 1.697 2.042 2.457 2.750 3.646 35 0.682 0.852 1.052 1.306 1.690 2.030 2.438 2.724 3.592 40 0.681 0.851 1.050 1.303 1.684 2.021 2.423 2.705 3.551 45 0.680 0.850 1.049 1.301 1.679 2.014 2.412 2.690 3.521 50 0.679 0.849 1.047 1.299 1.676 2.009 2.403 2.678 3.497 60 0.679 0.848 1.046 1.296 1.671 2.000 2.390 2.660 3.461 80 0.678 0.846 1.043 1.292 1.664 1.990 2.374 2.639 3.417 100 0.677 0.845 1.042 1.290 1.660 1.984 2.364 2.626 3.391 8 0.674 0.842 1.036 1.282 1.645 1.960 2.326 2.576 3.291 0.689 0.863 1.069 1.333 1.740 2.567 2.898 3.965 0.688 0.861 1.066 1.328 1.729 2.539 2.861 3.883 52 12 + 2 s2 Vn1 n2
El valor de t con los datos que observamos al realizar el experimento es:
t = 0,86 = 6,87 0,282 0,282 + 10 10
Distribución t de Student
a/2 a/2
4 00 0
Calculamos nuestra t:
t = rechazo -> t=2,101 m1 - m2
HO H1 (2,10) (6,87)
t = = 6,87 0,282 0,282 + 10 10
0,86 (18)(0,05)=2,10 6,87 está en la región crítica (es superior a 2,10) por tanto rechazamos Ho
Como 6,87 > 2,10 rechazamos la hipótesis nula y por tanto afirmamos que los dos grupos son diferentes (con una probabilidad de error menor al 5%).
Conclusión: Existen diferencias estadísticamente significativas en el pH de la cerveza según el tipo de semilla que se utiliza para cultivar la cebada.