Diapositivas sobre Estadística Descriptiva II, enfocadas en el análisis de datos y las medidas de variabilidad. El Pdf, un recurso de nivel universitario para la asignatura de Matemáticas, aborda conceptos clave como el rango y la formulación de hipótesis, con ejemplos numéricos para facilitar la comprensión.
Ver más30 páginas


Visualiza gratis el PDF completo
Regístrate para acceder al documento completo y transformarlo con la IA.
Los análisis de los datos dependen de dos factores fundamentales
En primer lugar el investigador busca describir sus datos y posteriormente efectuar análisis estadísticos para relacionar sus variables. Es decir, realiza análisis de estadística descriptiva para cada una de las variables de la matriz (ítems o indicadores) y luego para cada una de las variables del estudio, finalmente aplica cálculos estadísticos para probar sus hipótesis. Esta segunda parte la veremos más adelante. Ahora veremos la PARTE DESCRIPTIVA,
La primera tarea es describir los datos, los valores o las puntuaciones obtenidas para cada variable. Por ejemplo, si aplicamos a 1000 personas el cuestionario sobre la ansiedad en la cuarentena, ¿cómo pueden describirse estos datos? Esto se logra al describir la distribución de las puntuaciones O frecuencias de cada variable.
Una distribución de frecuencias es un conjunto de puntuaciones respecto de una variable ordenadas en sus respectivas categorías y generalmente se presenta como una tabla (O'Leary, 2014 y Nicol, 2006). Existen distintas formas de calcular la distribución de frecuencias:
Relación entre la frecuencia absoluta de cada valor y el tamaño muestral n. Suma de las frecuencias relativas = tiene que ser la unidad.
Aparición acumulada de los valores iguales o inferiores a Xi
Cociente entre su Fi y la magnitud muestral
Tantos por cien en lugar de tantos por uno. La suma de los porcentajes deberá ser el 100%.
En un estudio entre 200 personas latinas que viven en el estado de California, Estados Unidos, se les preguntó: ¿cómo prefiere que se refieran a usted en cuanto a su origen étnico? Las respuestas fueron: Tabla 10.4 Ejemplo de una distribución de frecuencias Variable: preferencias al referir el origen étnico (nombrada en SPSS: prefoe)
| Categorías | Códigos (valores) | Frecuencias |
| Hispano | 1 | 52 |
| Latino | 2 | 88 |
| Latinoamericano | 3 | 6 |
| Americano | 4 | 22 |
| Otros | 5 | 20 |
| No respondieron | 6 | 12 |
| Total | 200 |
De las 200 personas encuestadas, 52 respondieron que son hispanas
De las 200 personas encuestadas, 6 respondieron que son latinoamericanas
Las distribuciones de frecuencias pueden completarse agregando los porcentajes de casos en cada categoría, los porcentajes válidos (excluyendo los valores perdidos, o sea, los casos en que la personas dejó vacío el ítem) y los porcentajes acumulados (porcentaje de lo que se va acumulando en cada categoría, desde la más baja hasta la más alta). El porcentaje acumulado constituye lo que aumenta en cada categoría de manera porcentual y progresiva (en orden de aparición de las categorías), tomando en cuenta los porcentajes válidos.
Variable: cooperación del personal con el proyecto de calidad de la empresa
| Categorías | Códigos | Frecuencias | Porcentaje válido | Porcentaje acumulado |
| Si se ha obtenido la cooperación | 1 | 91 | 74.6 | 74.6 |
| No se ha obtenido la cooperación | 2 | 5 | 4.1 | 78.7 |
| No respondieron | 3 | 26 | 21.3 | 100.0 |
| Total | 122 | 100.0 |
1 91 personas eligieron la categoría "sí se ha obtenido la cooperación" (por eso la frecuencia es 91). Eso indica que del total de las respuestas (que fueron 122) 74.6% respondieron esta categoría. Ese es el porcentaje válido. Al mismo tiempo si tomo en cuenta esta categoría de respuesta se ha acumulado 74.6% de las respuestas totales. 2 5 personas eligieron la categoría "no se ha obtenido la cooperación" (por eso la frecuencia es 5), eso indica que del total de las respuestas (que fueron 122) el 4.1% corresponde a esta categoría, ese es el porcentaje válido. Esto acumula 78.7% (74.6% de la categoría anterior y 4.1% de la categoría en cuestión). 3 26 de las 122 no respondieron esta variable por eso los cargamos en "no respondieron" y su frecuencia es 26. Estos representan el 21.3% de las respuestas. Y siempre en la última categoría se acumula el total porcentaje (100%).
Aparte de tablas, se suelen utilizar gráficos para mostrar la distribución de frecuencias.
Histogramas Gráficas circulares Otros tipos de gráficas Opinión acerca del actual alcalde del municipio de San Martin Aurelio Cooperación de todo el personal (o la mayoría) para el proyecto de calidad (122 = 100%) Control paterno sobre el uso que los niños hacen de la televisión. 44.4 47.1% 52.9% Regañan cuando el niño ve mucha televisión 31.1 No 4.1% No respondieron 21.3% 40.4% 59.6% A veces castigan al niño sin ver televisión 64.4% 35.6% Prohiben que vea algunos programas Si 74.6% 1.9 68.4% 31.6% Imponen la hora de irse a la cama Muy desfavorable Desta- vorable Neutral Favorable Muy favorable Hay control No hay control Solamente la tercera parte de los ciudadanos expresa una opinión positiva respecto al alcalde (favorable o muy favorable). Prácticamente tres cuartas partes han obtenido la cooperación de todo el personal para el proyecto de la empresa. Pero llama la atención que poco más de una quinta parte no quiso comprometerse con su respuesta. Los cinco motivos de no cooperación con dicho proyecto fueron: absentismo, falta de interés, rechazo al cambio, falta de concientización y conformismo. 2.3 20.3
Las medidas de tendencia central son puntos en una distribución obtenida, los valores medios o centrales de ésta, y nos ayudan a ubicarla dentro de la escala de medición de la variable analizada. Son medidas que buscan posiciones (valores) con respecto a los cuales los datos muestran una tendencia a agruparse. Es el estudio del centro de la distribución observada. I Las principales medidas de tendencia central son tres:
Se utiliza con cualquier nivel de medición (nominal, ordina, intervalo y de razón)
Se utiliza en los niveles de medición ordinal, por intervalos y de razón. No se usa con variables nominales.
se utiliza en los niveles de medición por intervalos y de razón. No se usa con variables nominales y ordinales.
Es la categoría o puntuación que ocurre con mayor frecuencia. Se utiliza con cualquier nivel de medición.
La moda es "1" (sí se ha obtenido la cooperación) porque es la opción de respuesta que Más eligieron los participantes en la variable "cooperación del personal .. ", o sea el valor que ocurrió con más frecuencia. Tabla 10.7 Ejemplo de una distribución de frecuencias con todos sus elementos Variable: cooperación del personhii con el proyecto de calidad de la empresa
| Categorias | Códigos | Frecuencias | Porcentaje válido | Porcentaje acumulado |
| Si se ha obtenido la cooperación | 1 | 91 | 74.6 | 74.6 |
| No se ha obtenido la cooperación | 5 | 4.1 | 78.7 | |
| No respondieron | 3 | 26 | 21.3 | 100.0 |
| Total | 122 | 100.0 |
Indican la dispersión de los datos en la escala de medición de la variable considerada y responden a la pregunta: ¿ dónde están diseminadas las puntuaciones o los valores obtenidos? ¿ Cuán fiable es la medida de tendencia central? Las medidas de tendencia central son valores en una distribución y las medidas de la variabilidad son intervalos que designan distancias o un número de unidades en la escala de medición.
Indican por medio de un número si las diferentes puntuaciones de una variable están muy alejadas de la media.
Las medidas de la variabilidad más utilizadas son