Diapositivas de la Universidad Europea Del Atlántico sobre Estadística Tema 1: Organización y Representación de Variables. El Pdf, enfocado en Matemáticas para Universidad, ilustra la representación de datos mediante tablas de frecuencia, tablas cruzadas y diversos gráficos como diagramas de sectores y de barras.
Ver más26 páginas


Visualiza gratis el PDF completo
Regístrate para acceder al documento completo y transformarlo con la IA.
research coefficient data computing regression learning sis near e mation dom £ ana statistics max num TEMA 1 bability modeling analytics expectation . likelihood trend. deviation management 2. Organización y Representación de Variables 5 &consulting series 5 covariate duration simul work caus equation variance distribution graphical standard spatial visualization methods predictive normal parameter time @function chineA Universidad Europea del Atlántico research coefficient ng 0 Ission SIS linear S ce imation lom
data. Tablas de FrecuenciaStatistics Representación de datos mediante: g maximum analytics series Tablas Cruzadas consulting expectation likelihood covariate duration quantit ve ma Stical St Gráficos simulation workshops causal equationg distribution variance graphical standard trend deviation management 0 spatial visualization methods* predictive normal parameter @function timeA Universidad Europea del Atlántico
Datos Primarios o Brutos: los datos tal y como han sido recolectados en el estudio estadístico Datos Ordenados: Disposición en orden creciente o decreciente de los datos numéricos primarios susceptibles de ordenación. · Variables cuantitativas y cualitativas ordinales Rango, Amplitud de los datos o Recorrido: Diferencia entre el mayor valor observado y el menor valor observado Nº de Modalidades · Variables cuantitativas discretas/Continuas Rango = Vmáx-VmínA Universidad Europea del Atlántico
· Los datos obtenidos en un estudio estadístico se pueden presentar de manera ordenada en tablas de frecuencias o en gráficos · Las tablas de frecuencias y las representaciones gráficas son dos maneras equivalentes de presentar la información. · Las dos exponen ordenadamente la información de cierta variable recogida de una muestra Género Frec. Hombre 4 Mujer 6 7 6 5 4 3 2 1 0 Hombre MujerA Universidad Europea del Atlántico
¿Para qué sirve una tabla de frecuencias? : Ordena los datos de nuestro estudio y nos permite acceder cierta información ¿Cuántos individuos tienen menos de 2 hijos? - frec. familias sin hijos + frec. familias con 1 hijo = 419 + 255 = 674 individuos ¿Qué porcentaje de individuos tiene 6 hijos o menos? - 97,3% ¿Qué cantidad de hijos es tal que al menos el 50% de la población tiene una cantidad inferior o igual? Encuesta a 1509 familias sobre el nº de hijos que tienen Xi (nº de hijos) ni fi (%) F; (%) 0 419 27,8 27,8 1 255 16,9 44,7 2 375 24,9 69,5 ≥50% 3 215 14,2 83,8 4 127 8,4 92,2 5 54 3,6 95,8 6 24 1,6 97,3 7 23 1,5 98,9 Ocho+ 17 1,1 100,0 Total 1509 100,0 - 2 hijosA Universidad Europea del Atlántico
Una tabla de frecuencias resume la información contenida en los datos (xi) de una muestra de tamaño = n. Las columnas de la tabla muestran distintas frecuencias dependiendo de si los datos son discretos o continuos. Determinar el número de clases o categorías. Determinar el número de observaciones en cada clase. Calcular las frecuencias relativas, relativas acumuladas y absolutas acumuladas. VARIABLES CUANTITATIVAS DISCRETAS La tabla freformenteraciab sodutaan( Nº ocurrencias) f; : Frecuencia relativa Fi : Frecuencia relativa acumulada Ni : Frecuencia absoluta acumulada fi = ni n j≤i N, = > Ki Ki njA Universidad Europea del Atlántico
EJEMPLO: Encuesta a 60 familias sobre el nº de hijos. Representar tabla de frecuencias 0 2 2 4 0 3 3 2 5 2 3 2 4 3 4 DATOS 3 1 4 1 1 0 4 1 1 4 2 4 2 Q 3 1 3 0 5 2 2 3 0 3 0 5 1 1 4 0 3 2 3 2 3 3 1 2 4 2 3 1 3 1 4 TABLAA Universidad Europea del Atlántico
EJEMPLO: Encuesta a 60 familias sobre el nº de hijos. Representar tabla de frecuencias 0 2 2 4 0 3 3 2 5 2 3 2 4 3 4 DATOS xi 3 1 4 1 1 0 4 1 1 4 2 4 2 Q 3 1 3 0 5 2 2 3 0 3 0 5 1 1 4 0 3 2 3 2 3 3 1 2 4 2 3 1 3 1 4 TABLA modalidades: posibles nº hijos) ni : Nº veces que aparece cada modalidad en los datos f; : Frecuencia relativa Fi : Frecuencia relativa acumulada N; : Frecuencia absoluta acumulada
| Hijos | ni | fi | Fi |
|---|---|---|---|
| 0 | 8 | 0.13 | 0.13 |
| 1 | 11 | 0.18 | 0.31 |
| 2 | 13 | 0.22 | 0.53 |
| 3 | 15 | 0.25 | 0.78 |
| 4 | 10 | 0.17 | 0.95 |
| 5 | 3 | 0.05 | 1 |
N = Ki > ji En ji fi= ni nA Universidad Europea del Atlántico
VARIABLES CUANTITATIVAS CONTINUAS (con infinitos valores posibles): los datos hay que agruparlos obligatoriamente por clases o categorías. El número de clases no deberá ser demasiado pequeño ni demasiado grande para poder visualizar la verdadera naturaleza de la distribución: (5<C20). La tabla deberá incluir: (Li-1, Li) : Límites de clase (Valor inferior y superior de la clase) Ai: Amplitud o rango de clase (Li-Li-1) xi : marcas de clase (Valor medio de los límites) n; : frecuencia absoluta (Nº de ocurrencias de cada posible valor) f; : Frecuencia relativa F; : Frecuencia relativa acumulada Ni : Frecuencia absoluta acumulada fi = - n ni - n Ni = > nj ji Ki jsiA Universidad Europea del Atlántico
Para el cálculo del número de clases (C) utilizamos alguno de los siguientes criterios: · Criterio 1 : C=SN · Criterio 2 (Sturges): C=1+log2(N) log10(N) C=1+ log10(2) · Criterio 3: C=0,1N · Criterio 4: Criterio propio (N= tamaño de la muestra) Nº Clases aplicando Sturges
| Tamaño de Muestra | Clases |
|---|---|
| 0- 22 | 5 |
| 23 - 45 | 6 |
| 46- 90 | 7 |
| 91 - 181 | 8 |
| 182 - 362 | 9 |
| 363 - 724 | 10 |
| 725 -1448 | 11 |
| 1449 - 2896 | 12 |
| 2897 - 5792 | 13 |
| 5793 - 11585 | 14 |
| 11586 - 23170 | 15 |
| 23171 - 46340 | 16 |
| 46341 - 92681 | 17 |
| 92682 - 185363 | 18 |
| 185364 - 370727 | 19 |
| 370728 - 00 | 20 |
A Universidad Europea del Atlántico
Reglas Generales para Agrupar Datos Cuantitativos: Calcule el recorrido de los datos primarios a partir de los valores mayores y menores. (Diferencia entre el valor mayor y el menor). Determine el número de clases y la amplitud del intervalo Determine los límites de clase para cada clase y verifique que los límites de clase reales no coinciden con las observaciones. Calcular las frecuencias relativas, relativas acumuladas y absolutas acumuladas. Determine el número de observaciones que caen dentro de cada intervalo de clase. Determine las marcas de clase para cada intervalo de clase.A Universidad Europea del Atlántico
EJEMPLO: Notas del Examen final de Estadística I en el curso 19/20. DATOS 4,3 6,4 5,0 7,5 6,9 4,4 5,5 8,3 5,8 2,7 2,8 8,2 1,4 6,4 0,2 7,4 5,9 5,6 0,0 6,9 5,8 6,2 9,4 8,4 5,8 7,3 5,9 2,7 6,9 9,7 5,0 6,8 5,2 9,3 5,0 0,4 5,0 6,8 6,3 5,6 7,1 0,7 Para n=42 datos Según criterio 1= 6,5 clases Según criterio 2=6 clases Según criterio 3=4,2 clasesA Universidad Europea del Atlántico
EJEMPLO: Notas del Examen final de Estadística I en el curso 19/20. DATOS 4,3 6,4 5,0 7,5 6,9 4,4 5,5 8,3 5,8 2,7 2,8 8,2 1,4 6,4 0,2 7,4 5,9 5,6 0,0 6,9 5,8 6,2 9,4 8,4 5,8 7,3 5,9 2,7 6,9 9,7 5,0 6,8 5,2 9,3 5,0 0,4 5,0 6,8 6,3 5,6 7,1 0,7 TABLA
| Li-1 | L | × | n; | f, | F | N |
|---|---|---|---|---|---|---|
| 0,0 | 1,6 | 0,8 | 5 | 0.12 | 0.12 | 5 |
| 1,7 | 3,3 | 2,5 | 3 | 0.07 | 0.19 | 8 |
| 3,4 | 5,0 | 4,2 | 6 | 0.14 | 0.33 | 14 |
| 5,1 | 6,7 | 5,9 | 13 | 0.31 | 0.64 | 27 |
| 6,8 | 8,4 | 7,6 | 12 | 0.29 | 0.93 | 39 |
| 8,5 | 10,0 | 9,3 | 3 | 0.07 | 1.00 | 42 |
(Li-1,Li) : Límites de clase (Valor inferior y superior) Xi : marcas de clase (Valor medio de los límites) n; : frecuencia absoluta (Nº de ocurrencias) f; : Frecuencia relativa (%) Fi : Frecuencia relativa acumulada (%) Ni : Frecuencia absoluta acumulada fi == ni n 1 n Ens jsi Ki / 1 Ki Según Sturges 6 clases (42 datos)A Universidad Europea del Atlántico
Representación de Datos mediante Tablas Cruzadas para varias variables Una tabulación cruzada es un resumen tabular de la relación de los datos de dos variables, los cuales deben estar agrupados en clases o categorías. Este tipo de representación se puede emplear directamente para relacionar dos variables cualitativas y/o cuantitativas discretas y para variables cuantitativas continuas tras ser agrupadas en clase. Precio (en $)
| Calidad | 10 - 19 | 20 - 29 | 30 - 39 | 40 - 49 | Total |
|---|---|---|---|---|---|
| Buena | 42 | 40 | 2 | 0 | 84 |
| Muy Buena | 34 | 64 | 46 | 6 | 150 |
| Excelente | 2 | 14 | 28 | 22 | 66 |
| Total | 78 | 118 | 76 | 28 | 300 |
A Universidad Europea del Atlántico
Cualitativos · Diagrama de Barras · Gráfico de Tarta · Gráfico de Mosaicos Cuantitativos · Diagrama de Barras · Histograma · Diagrama de Líneas · Gráfico de Series · Gráfico de Caja · Gráfico de Dispersión Mixtos · Gráfico de Barras y Líneas · Gráfico de Burbujas 1A Universidad Europea del Atlántico
GRAFICOS: VARIABLES CUALITATIVAS DIAGRAMA DE BARRAS: La altura de la barra corresponde a la frecuencia relativa en %. Eje X (Eje de modalidades Eje Y (Eje de fi% ) Porcentaje de la población 50% 43% 38% 40% 30% 20% 14% 10% 5% 0% A B AB O Grupo sanguíneoA Universidad Europea del Atlántico
GRAFICOS: Variables cualitativas DIAGRAMA DE SECTORES (tarta): Son fáciles de entender. Cada área representa una modalidad y debe ser proporcional a la frecuencia absoluta o relativa. Variables con pocos valores (2-5) 38% A 43% B AB 5% 14% DA Universidad Europea del Atlántico
GRAFICOS: Variables cualitativas GRAFICO DE MOSAICOS: Representan las relaciones entre variables en función de los datos recogidos de varias variables analizadas a la vez sobre un mismo individuo Distribución de sexos por grupos H Sexo M 1 2 3 4 GruposA Universidad Europea del Atlántico
GRAFICOS: VARIABLES CUANTITATIVAS DIAGRAMA DE BARRAS (VARIABLES CUANTITATIVAS DISCRETAS) Puede tomarse cada posible valor (modalidad) de la variable como si fuese una categoría de resultado, utilizandose en este caso un diagrama de barras de forma similar a cuando los datos son de tipo cualitativos. 60 40 Frecuencia 20 0 17 18 19 20 21 22 23 24 25 EdadA Universidad Europea del Atlántico
GRAFICOS: VARIABLES CUANTITATIVAS CONTINUAS HISTOGRAMA : Forma de representación equivalente mediante gráficas de las tablas de frecuencia para datos cuantitativos agrupados. En ese sentido, un histograma presentará entre 5 y 20 barras (según C) las cuales inician y terminan en los límites reales de cada clase. De esa forma, la presentación de las barras es continua al igual que los datos. 30 25 20 Porcentaje 15 10- 5 0 30 35 40 C_Cuello