Diapositivas sobre Boxplot, diagrama de caja o diagrama de cajas y bigotes. El Pdf explica los boxplot, diagramas estadísticos que representan la distribución de datos mediante mediana, cuartiles y valores extremos, con ejemplos prácticos y guía para construirlos con SPSS. Este material de Matemáticas para Universidad, producido en 2024, es útil para el estudio autónomo de conceptos estadísticos.
Ver más10 páginas


Visualiza gratis el PDF completo
Regístrate para acceder al documento completo y transformarlo con la IA.
Un boxplot, diagrama de caja o cajón con bigotes corresponde a una representación gráfica basada en la información entregada por la mediana, cuartiles y valores mínimo y máximo de un conjunto de datos. Estos 5 valores que dan origen a un boxplot suelen denominarse las 5 medidas de resumen de un conjunto de observaciones.
Q1 ¿Qué necesitamos para construirlo? Valor mínimo Q2 Valor máximo Q3
Un boxplot o diagrama de caja es una representación gráfica que muestra: Mediana (Q2): El valor central de los datos. ·Cuartil Inferior (Q1): Marca el 25% de los datos inferiores. Cuartil Superior (Q3): Marca el 75% de los datos superiores. Valor Mínimo y Valor Máximo de la distribución de datos. Propósito: Muestra la dispersión y los valores atípicos de un conjunto de datos mediante estas cinco medidas de resumen.Notas sexto A
Estadístico Valor Mínimo 3.7 Primer cuartil 4,6 Mediana 5,1 Tercer cuartil 5,4 Máximo 6,1
Máximo = 6,1 Q3 = 5,4 Mediana = 5,1 Q1 = 4,6 Mínimo = 3,7
Identifica diferencias entre los siguientes diagramas de cajas: Notas sexto A Máximo = 6,1 Q3 = 5,4 Mediana = 5,1 Q = 4,6 Mínimo = 3,7 Notas en la segunda evaluación del sexto A 7,0 6,5 6,0 Nota 5,5 5,0 - 4,5 4,0 Los diagramas de cajas son complementarios a los histogramas, de manera que permiten describir de mejor manera la información
Para analizar las diferencias entre los dos diagramas de caja o "boxplots," observa los siguientes aspectos:
Esta comparación permite identificar mejoras y cambios en la dispersion y el rango de las calificaciones entre dos evaluaciones de un mismo grupo.
Notas sextos básicos 7 6 5 4 - Nota 3 - 2- 1 - O 6° A 6° B 6º C
Los diagramas de caja o boxplots (como el de la imagen) se utilizan para:
En resumen, los boxplots son útiles para una visión rápida y detallada de la estructura y características de los datos en distintos grupos.
Los diagramas de caja y bigotes (o boxplots) son una herramienta visual que permite entender de forma rápida cómo están distribuidos los datos y compararlos entre diferentes grupos.
En SPSS hay diferentes maneres de construir un diagrama de cajas 1 Gráficos Utilidades Ampliaciones Ventana Ayuda 4 Diagramas de cajas Generador de gráficos ... PSS Statistics Editor de datos Simples Selector de plantillas de tablero ... + Comparar subgrupos Agrupados + Gráfico de Weibull ... ón Medida Ro Los datos del gráfico son Barras ... Resúmenes para grupos de casos Barras 3D ... Resúmenes para distintas variables Líneas ... Areas ... ? Cancelar Definir Circular ... Máximos y mínimos ... 3 mi Diagramas de cajas ... Barras de error ... Pirámide de población ... Dispersión/Puntos ... Histograma ... 2 Cuadros de diálogo antiguos
En SPSS hay diferentes maneres de construir un diagrama de cajas 1 Gráficos Utilidades Ampliaciones Generador de gráficos ... 2 Selector de plantillas de tablero ... Mapa de relaciones ... + Grafico de Weibull .. Comparar subgrupos + Gráficos de variables de regresión Barras ... LI Barras 3D ... I íneas Filtrar por Puse en la pestar & Elemiertos basicas para crear un grafico mediante elementos Categoria 1 :: Categoria 2 3 Galeria Elementos básicos Grupos/ID de puntos Titulosinotas al pre Elija entre: Favorito Daras İnşa Circular Polar Dispersión Puntos Histograma Maximus minimos Diagramas de cajas Ejes doble's Aceptar Pega Restablecer Cancelar Ayuda
I. Posició v Quartils (Q) V Decils (D) V Percentils o Centils (P, C) I. Dispersió V Rang (R) v Variança (S2) V Desviació Típica (S) v Rang Interquartil-lic (Rq) El Rango (R)cient de Variació (CV) I. Tendencia Central Mitjana Aritmetica (x ) v Mediana (Md) Moda (Mo) I. Forma v Assimetria (As) V Curtosi (Cu) Meck Moda 1 Nella Mediana Mediana Media Bimenca Mediana Apmeinca haca Jsmetrica hacia la cquerda O Amplitud = Es la diferencia entre el valor más alto de la variable y el más bajo
El rango es útil cuando se necesita una medida rápida y general de la dispersión. Sin embargo, para un análisis más profundo de la variabilidad de los datos, es mejor complementarlo con otras medidas, como la desviación estándar o el rango intercuartílico (IQR), que son menos sensibles a los valores extremos y proporcionan más información sobre la distribución interna de los datos.
Com es calcula? SENSE INTERVALS: R = VMÀX - VMÍN AMB INTERVALS: R = Vmax - Vmín + 1
WORKINIIWI de gráficos La vista previa del gráfico utiliza datos de ejemplo 4 conse Diagrama de cajas Simple iénero] ad la uni .. 0 n [For .. ente e .. Nacer > ¿Eje Y? 1 2 02. Σ (Χ-Χ)2 Σ (Χ-Χ)2 x fi
Rango Interquartílico (RQ o RI) Es la diferencia entre tercero y el primer cuartil. Nos da información sobre el 50% central de la distribución. Nos permite obtener información cuando los valores extremos no son mu significativos RT - O - O.
Varianza (S2) Cuanto más alto es el resultado obtenido, mayor será la dispersión Es el promedio (se hace la media) de las diferencias al cuadrado de cada uno de los valores que puede tener la variable, respecto de la media. Dades sense agrupar Dades agrupades ¿Ele X? Selecciona las variables y acepta Dar doble click o trasladar a caja de visualización
Desviación típica / estándar (S, Sd o O) El resultado de la Varianza(S2) al estar elevado al cuadrado, no está en las mismas unidades que la variable -- DIFICULTA LA INTERPRETACIÓN Para superar estas dificultades, disponemos de la Desviación típica o estándar (S o Sd) Para calcularla tan solo cogemos el resultado de S2 y le aplicamos la raíz cuadrada Sd = VS2
Cálculo de la varianza y desviación estándar (muestras) Ejemplo: Edad de los hombres que han entrado al servicio de oncología durante el año 1980 52 55 57 58 58 Σ, (Χ-Χ)2 S2 = n-1 T 48 49 50 5 52 53 54 55 56 57 58 59 60
· Sumamos las edades: 52 + 55 + 57 + 58 + 58 = 280. · Dividimos por el número de observaciones (n = 5): X = 280 = 56.
· Para cada edad, restamos la media y elevamos al cuadrado: . (52 - 56)2 = (-4)2 = 16 . (55 - 56)2 = (-1)2 = 1 · (57 - 56)2 = (1)2 = 1
· Sumamos todos los valores calculados: 16 + 1 + 1 + 4 + 4 = 26.
· Dividimos la suma de las desviaciones al cuadrado entre n - 1 (4 en este caso, porque es una muestra): · S2 = 26 = 6.5.
· La desviación estándar es la raíz cuadrada de la varianza: · S = 16.5 ~2.55.
. (58 - 56)2 = (2)2 = 4 · (58 - 56)2 = (2)2 = 4 (52-56)2+(55-56)2+(57-56)2+(58-56)2+(58-56)2 (-4)2+(-1)2+12 + 22 + 22 26 S 2 5-1 4 4 S = V6,5 = 2,5495
Paso 1: Calcular la media de la muestra Sumamos todas las edades y dividimos por el número total de datos. Paso 2: Calcular la desviación de cada valor respecto a la media Restamos la media de cada edad y luego elevamos el resultado al cuadrado. Paso 3: Calcular la varianza de la muestra Sumamos todos los valores obtenidos y dividimos entre n-1 (dado que es una muestra, no la población completa). Paso 4: Calcular la desviación estándar de la muestra La desviación estándar es la raíz cuadrada de la varianza.
Resumen de resultados ·Media: 56 ·Varianza: 6.5 ·Desviación estándar: 2.55 Interpretación La desviación estándar de 2.55 indica cuánto se desvían, en promedio, las edades de los hombres que ingresaron al servicio de oncología respecto a la media de 56 años. Esto nos da una idea de la variabilidad en las edades de los pacientes, mostrando que no varían mucho de la media. = = = 6,5