Diapositivas de Universidad sobre Estadística Descriptiva: descripción de variables o datos cuantitativos. El Pdf aborda la descripción y representación gráfica de datos cuantitativos, incluyendo población, muestra, cálculo de la mediana y cuartiles, útil para estudiantes de Matemáticas a nivel universitario.
Ver más53 páginas


Visualiza gratis el PDF completo
Regístrate para acceder al documento completo y transformarlo con la IA.
TEMA 3. LABORATORIO DE ESTADÍSTICA Evelina Haroyan Darbinyan Curso académico 2023-2024 | SlideSalad.com
POBLACIÓN μ = 173.2 Parámetro media -> Selección al azar + T Muestra 1 x1 = 172.1 Muestra 2 X2= 174.1 Muestra j X=173.7 .. 1 n 1 Estadístico media
La estadística ha establecido una serie de medidas o índices para describir distribuciones de datos cuantitativos. Por ejemplo: queremos saber la media de edad de esta clase: 18, 19, 20, 25, 39, 18, 18, 18, 19, 20, 21. La media, es un índice para describir la distribución de la edad en esta clase de n= 11 sujetos. Los índices que nos permitirán sintetizar una distribución de datos cuantitativos y se pueden construir de dos modos: Índices basados en momentos Índices basados en ordenaciones
Medidas basadas en momentos Medidas de tendencia central Medidas de dispersión Medidas de forma: asimetría Medidas de forma: apuntamiento (o curtosis)
f . - - μΑ Las distribuciones A y B tienen la misma forma pero se diferencian por su tendencia central (posición) representada por las medias u Media: La media (mean) es una medida de tendencia central que se define como la suma de cada uno de los valores (xi) dividida por el número de observaciones (n). Cuando se calcula en una muestra de n sujetos, el estimador de la media u de la población, se simboliza por x (cuando es de una muestral de n sujetos). x = (x1+X2+ ... + xn) n EJEMPLO: una hipotética muestra aleatoria de cinco sujetos: 48, 54, 58, 60 y 60 kg ¿Cuál es la media? 48+54+58+60+60 / 5= 656 kg
EJERCICIOS 1. Una hipotética muestra aleatoria de 11 sujetos miden lo siguiente: 170, 170, 163, 164, 190, 198, 176, 182, 184, 155, 161 n= 11 Calcular la media. X= (170+170+163+164+190+198+176+182+184+155+161)/11 = 173,9 2. En la distribución de número de hermanos de esta clase, se encuentran los siguientes resultados: n= 7 personas con 0, 1, 2, 3, 0, 0 4, 2 La media es X= (0+1+2+3+0+0+4+2)/7= 1, 7 hermanos por persona.
1. VARIANCIA: es una medida de la variabilidad de los datos de una muestra. Cómo de dispersos son los valores de una muestra. La variancia (variance) es una medida de dispersión que se define como la media de la suma de cuadrados de las diferencias entre cada valor de la variable (x;) y la media aritmética de la distribución ( x). s2 = (x1-X)2+(x2-X)2+ ... +(x) -x)2 n-1 Cuando la variancia es el parámetro poblacional, se designa con o2 Cuando queremos designar la variancia en una muestra de tamaño n, utilizamos s2 OB OA A Las distribuciones A y B tienen igual media pero se diferencian por su dispersión (variabilidad) representada por las desviaciones estándar o
1. VARIANCIA. Ejercicios: en la siguiente distribución de pesos: 48,54,58,60, 60 kg de n= 5 sujetos, calcular la variancia. 1º paso: calcular la media. La media de esta muestra es: 56 kg 2º paso: calcular la diferencia entre cada valor (48,54,58,60, 60 ) y la media de la muestra (56) (48-56)2 + (54-56)2 + (58-60)2+ (60-56)2+ (60-56)2 = 104 3º paso: dividimos la suma de cuadrados entre n-1. Si n= 5 n-1= 4 s2 = 26 kg2 tiene las unidades de medida de la variable al cuadrado. s2 = (x1-X)2+(x2-X)2+ ... +(x) -X)" n-1 s2 = (-8)2 +(-2)2 + 22 + 42 + 42 = 26 kg2 104 5-1 4
2. DESVIACIÓN ESTÁNDAR (SD o standard deviation) (DE o desviación estándar). Puesto que la variancia tiene como unidades de medida el cuadrado (s2), es más fácil itnerpretar la desviación estándar. La desviación estándar ES LA RAÍZ CUADRADA POSITIVA de la variancia y tiene las mismas unidades de medida que la variable que estemos describiendo. Se simboliza con la letra o (sigma) si es el parámetro poblacional. Se simboliza con la letra s, si es un parámetro muestral. Variancia del ejemplo anterior: s2= 26 kg2 Desviación estándar: S= V26. = 5.009 La desviación estándar es la medida de dispersión que acompaña la media y es muy frecuente su uso en publicaciones científicas. Siempre que indiquemos la media, se debe acompañar de la DE o (SD).
EJERCICIO Calcular la media, la variancia y la desviación estándar de las tallas de la siguiente muestra de 5 chicas aplicando las fórmulas: 154; 158; 158; 162; 168 cm 1. ¿ Con qué letra se designa cada uno de estos parámetros poblaciones? 2. ¿ Con qué letra se designan en una muestra? 3. ¿ Cuánto vale la media, variancia, y desviación estándar de esta muestra?
3. COEFICIENTE DE VARIACIÓN (Coefficient variation). Los valores de la variancia y la desviación estándar dependen de las unidades de medida de la variable, lo que imposibilita comparar entre sí índices de dispersión que tengan unidades diferentes. El índice de dispersión relativa, que no depende de las unidades de medida es EL COEFICIENTE DE VARIACIÓN. Se define como el cociente entre la desviación estándar y la media, generalmente expresado en tantos por cien: CV = 100 x 2% x Este cociente, que carece de unidades de medida, representa el valor de la desviación estándar medida en unidades de magnitud igual a la media, es decir, el valor de la desviación estándar relativa al valor de la media.
3. COEFICIENTE DE VARIACIÓN - EJERCICIOS CV =100 x S x 1. Los siguientes valores de la tabla presentan las características de variabilidad de la altura (en cm) y del peso (kg) en dos momentos diferentes de la vida. Queremos calcular cómo de variable es cada una de las variables: PESO O TALLA, tanto a los 2 años de edad como a los 17 años de edad. Edad (años) Peso (kg) x S Talla (cm) x S 2 17 12.4 60.8 2.05 6.69 87.0 147.3 4.1 5.9 Coeficientes de variación (100s/x) Peso Talla 100×2.05/12.4 = 16.5% 100×6.69/60.8 = 11.0% 100×4.1/87.0 =4.7% 100×5.9/147.3 =4.0%
3. COEFICIENTE DE VARIACIÓN - EJERCICIOS CV =100 x S x 1. Los siguientes valores de la tabla presentan las características de variabilidad de la altura (en cm) y del peso (kg) en dos momentos diferentes de la vida. Queremos calcular cómo de variable es cada una de las variables: PESO O TALLA, tanto a los 2 años de edad como a los 17 años de edad. Las magnitudes de la desviación estándar tienen diferentes unidades de medida y no son comparables, porque el peso está en kg y la altura en cm. ¿Qué es más variable, el peso o la talla? ¿ Estos parámetros son más variables a los 2 años o a los 17 años? Edad (años) Peso (kg) x S Talla (cm) x S 2 17 12.4 60.8 2.05 6.69 87.0 147.3 4.1 5.9 Coeficientes de variación (100s/x) Peso Talla 100×2.05/12.4 =16.5% 100×6.69/60.8 =11.0% 100×4.1/87.0 4.7% 100×5.9/147.3 =4.0%
3. COEFICIENTE DE VARIACIÓN - Ejemplo y eso de CV CV=100 x S $ % x Este coeficiente se usa en los laboratorios de análisis clínicos para comparar reproducibilidades ya que relaciona la desviación estándar con la magnitud de la media. Supongamos que disponemos de un método a través de ultrasonidos para medir el tamaño de tumores de mama y el resultado de medir 10 veces un mismo tumor tiene una desviación estándar de s = 2 mm. Si esta variabilidad corresponde a mediciones de tumores pequeños (con una media, x = 10 mm), El coeficiente de variación CV= - x 100% = 20% de variabilidad para medir tumores es elevado. 0 (Mido 10 veces lo mismo y cada vez me da un valor muy diferente, un valor muy variable). Pero si corresponde a tumores grandes (x = 100 mm) El coeficiente de variación CV -2 100 x 100%. = 2 % de variabilidad para medir tumores es bajo. (En este caso, mido lo mismo 10 veces, y cada medición me da un valor muy similar, poco variable, por lo tanto con un coeficiente de variación BAJO).
ASIMETRÍA Sirven para tener una idea acerca de la forma de una distribución de frecuencias. Si la asimetría es positiva, significa que hay una cola más larga en sentido positivo, a la derecha de la media. Si la asimetría es negativa, significa que hay más valores diferentes al cero, pero a la izquierda de la media. 1 0 0 Negativa YIB < 0 M Positiva KYIA>0 Las distribuciones A y B tienen igual media u y desviación estándar o pero se diferencian por su asimetría representada por los coeficientes de simetría yı
ASIMETRÍA: En casos en los que la distribución presenta una fuerte asimetría, es más recomendable presentar los datos con una mediana que con una media, dado que son valores más robustos, (representan mejor la realidad sin estar afectados por la asimetría de la distribución). Asimetría negativa: cola izquierda más alargada Distribución simétrica Asimetría positiva: cola derecha más alargada 1 μ Md μ Md Md μ
Medida de forma que mide cuán apuntada o achatada está una curva o distribución. Se utiliza para observar la existencia de datos anómalos, no normales o alejados. Una mayor curtosis no implica la existencia de mayor variabilidad o variancia de datos Leptocúrtica (y2A > 3) 1 Platicúrtica (\2B < 3) -> Mesocúrtica (Normal) (Yzc = 3) Las distribuciones A y B son simétricas y tienen igual media u y desviación estándar o pero se diferencian por su apuntamiento representado por los coef. de apuntamiento y2