Boxplot, diagrama de caja o diagrama de cajas y bigotes

Diapositivas sobre Boxplot, diagrama de caja o diagrama de cajas y bigotes. El Pdf explica los boxplot, diagramas estadísticos que representan la distribución de datos mediante mediana, cuartiles y valores extremos, con ejemplos prácticos y guía para construirlos con SPSS. Este material de Matemáticas para Universidad, producido en 2024, es útil para el estudio autónomo de conceptos estadísticos.

Ver más

10 páginas

Visualiza gratis el PDF completo

Regístrate para acceder al documento completo y transformarlo con la IA.

Vista previa

Boxplot, Diagrama de Caja o Cajón con Bigotes

Un boxplot, diagrama de caja o cajón con bigotes corresponde a una representación gráfica basada en la información entregada por la mediana, cuartiles y valores mínimo y máximo de un conjunto de datos. Estos 5 valores que dan origen a un boxplot suelen denominarse las 5 medidas de resumen de un conjunto de observaciones.

¿Qué necesitamos para construir un Boxplot?

Q1 ¿Qué necesitamos para construirlo? Valor mínimo Q2 Valor máximo Q3

¿Qué es un Boxplot, Diagrama de Caja o Cajón con Bigotes?

Un boxplot o diagrama de caja es una representación gráfica que muestra: Mediana (Q2): El valor central de los datos. ·Cuartil Inferior (Q1): Marca el 25% de los datos inferiores. Cuartil Superior (Q3): Marca el 75% de los datos superiores. Valor Mínimo y Valor Máximo de la distribución de datos. Propósito: Muestra la dispersión y los valores atípicos de un conjunto de datos mediante estas cinco medidas de resumen.Notas sexto A

Estadístico de Notas Sexto A

Estadístico Valor Mínimo 3.7 Primer cuartil 4,6 Mediana 5,1 Tercer cuartil 5,4 Máximo 6,1

Valores de Notas Sexto A

Máximo = 6,1 Q3 = 5,4 Mediana = 5,1 Q1 = 4,6 Mínimo = 3,7

Diferencias entre Diagramas de Cajas

Identifica diferencias entre los siguientes diagramas de cajas: Notas sexto A Máximo = 6,1 Q3 = 5,4 Mediana = 5,1 Q = 4,6 Mínimo = 3,7 Notas en la segunda evaluación del sexto A 7,0 6,5 6,0 Nota 5,5 5,0 - 4,5 4,0 Los diagramas de cajas son complementarios a los histogramas, de manera que permiten describir de mejor manera la información

Análisis de Diferencias entre Diagramas de Caja

Para analizar las diferencias entre los dos diagramas de caja o "boxplots," observa los siguientes aspectos:

  1. Mediana:
    1. En el primer diagrama (Notas sexto A), la mediana es de 5,1.
    2. En el segundo diagrama (Notas en la segunda evaluación del sexto A), la mediana está cerca de 6,5.
    3. Esto indica que en la segunda evaluación, la mediana de las notas es más alta, lo que sugiere una mejora en el rendimiento general.
  2. Rango intercuartílico (IQR):
    1. En el primer diagrama, el Q1 (primer cuartil) es 4,6 y el Q3 (tercer cuartil) es 5,4, lo que da un IQR de 0,8.
    2. En el segundo diagrama, aunque no están numerados los valores exactos, visualmente el rango intercuartílico es mayor.
    3. Un IQR mayor en la segunda evaluación indica una mayor variabilidad entre las notas de la mayoría de los estudiantes en ese conjunto.
  3. Extremos (mínimo y máximo):
    1. En el primer diagrama, el mínimo es 3,7 y el máximo es 6,1.
    2. En el segundo diagrama, el mínimo es alrededor de 4,0 y el máximo cerca de 7,0.
    3. El rango total de las notas es mayor en el segundo gráfico, lo que muestra un incremento en la dispersión de las notas.
  4. Interpretación general:
    1. En general, el segundo diagrama muestra que en la segunda evaluación hubo una mejora en la mediana y una mayor variabilidad en las calificaciones. Esto puede indicar que aunque algunos estudiantes mejoraron significativamente sus notas, otros se mantuvieron en niveles más bajos, ampliando la dispersión de los resultados.

Esta comparación permite identificar mejoras y cambios en la dispersion y el rango de las calificaciones entre dos evaluaciones de un mismo grupo.

Notas Sextos Básicos

Notas sextos básicos 7 6 5 4 - Nota 3 - 2- 1 - O 6° A 6° B 6º C

Usos de los Diagramas de Caja o Boxplots

Los diagramas de caja o boxplots (como el de la imagen) se utilizan para:

  1. Visualizar la dispersión y la distribución de los datos:
    1. Muestran cómo se distribuyen los valores en una variable.
    2. Permiten ver la concentración de datos y las variaciones entre diferentes grupos.
  2. Comparar grupos:
    1. En este ejemplo, se observan las notas de tres grupos (6°A, 6°B y 6°℃).
    2. El diagrama facilita la comparación entre grupos en términos de su mediana, rango intercuartílico y dispersión de los valores.
  3. Identificar valores atípicos (outliers):
    1. Los valores fuera de los "bigotes" (líneas que se extienden desde la caja) se consideran atípicos o extremos. En el ejemplo, hay un valor atípico en el grupo 6°B.
  4. Evaluar la simetría y sesgo:
    1. La posición de la mediana dentro de la caja y la longitud de los bigotes pueden indicar si la distribución es simétrica o si está sesgada hacia algún lado.
  5. Observar la homogeneidad o heterogeneidad de los datos:
    1. La longitud de la caja (rango intercuartílico) y la amplitud de los bigotes permiten ver si los datos de un grupo están más concentrados (homogéneos) o si están más dispersos (heterogéneos).

En resumen, los boxplots son útiles para una visión rápida y detallada de la estructura y características de los datos en distintos grupos.

Componentes de los Diagramas de Caja y Bigotes

Los diagramas de caja y bigotes (o boxplots) son una herramienta visual que permite entender de forma rápida cómo están distribuidos los datos y compararlos entre diferentes grupos.

  1. La Caja (Box):
    1. La caja representa el rango donde se encuentran el 50% de los datos centrales, llamado rango intercuartílico.
    2. Dentro de la caja, verás una línea más oscura: esa es la mediana, o el valor que divide la mitad superior de la mitad inferior de los datos.
    3. Si la mediana está en el centro de la caja, indica que los datos están distribuidos de manera bastante simétrica. Si está más hacia un lado, los datos están sesgados (concentrados en una dirección).
  2. Los Bigotes (Whiskers):
    1. Las líneas que salen de la caja hacia arriba y hacia abajo son los "bigotes". Ellos muestran hasta donde llegan la mayoría de los datos, excluyendo los valores atípicos (outliers).
    2. En términos simples, los bigotes nos indican el rango de los valores sin incluir aquellos que están demasiado lejos.
  3. Valores Atípicos (Outliers):
    1. Los puntos que quedan fuera de los bigotes son los valores "atípicos". Son valores inusuales o extremos que están más lejos de lo normal en la distribución.
    2. En el gráfico, por ejemplo, el grupo "6°B" tiene un punto fuera de los bigotes. Eso significa que un estudiante sacó una nota que se sale de lo común comparado con el resto de los estudiantes de su grupo.
  4. Comparación entre Grupos:
    1. Al observar varias cajas juntas, como en el ejemplo de las notas de los cursos 6°A, 6ºB y 6°℃, podemos ver rápidamente qué grupo tiene las notas más altas, qué grupo tiene más variación en las notas y cuál tiene menos.
    2. Por ejemplo, el grupo 6°℃ tiene una caja más grande, lo que indica que las notas están más dispersas. Además, la mediana está más alta que en los otros dos grupos, lo que sugiere que las notas de este grupo son en promedio más altas.
  5. Para qué sirven en la práctica:
    1. Imagina que eres un profesor y quieres entender rápidamente el rendimiento de tus tres clases. Con un diagrama de caja, puedes ver de un vistazo cual grupo es más homogéneo (todos sacaron notas parecidas) y cual es más variado (hay estudiantes con notas muy altas y otros con notas bajas).
    2. También puedes identificar si hay estudiantes que necesitan apoyo extra, como los que estan representados por los puntos fuera de los bigotes en 6°B, ya que su rendimiento es significativamente diferente del resto.

Construcción de Diagramas de Cajas en SPSS

En SPSS hay diferentes maneres de construir un diagrama de cajas 1 Gráficos Utilidades Ampliaciones Ventana Ayuda 4 Diagramas de cajas Generador de gráficos ... PSS Statistics Editor de datos Simples Selector de plantillas de tablero ... + Comparar subgrupos Agrupados + Gráfico de Weibull ... ón Medida Ro Los datos del gráfico son Barras ... Resúmenes para grupos de casos Barras 3D ... Resúmenes para distintas variables Líneas ... Areas ... ? Cancelar Definir Circular ... Máximos y mínimos ... 3 mi Diagramas de cajas ... Barras de error ... Pirámide de población ... Dispersión/Puntos ... Histograma ... 2 Cuadros de diálogo antiguos

Creación de Gráficos en SPSS

En SPSS hay diferentes maneres de construir un diagrama de cajas 1 Gráficos Utilidades Ampliaciones Generador de gráficos ... 2 Selector de plantillas de tablero ... Mapa de relaciones ... + Grafico de Weibull .. Comparar subgrupos + Gráficos de variables de regresión Barras ... LI Barras 3D ... I íneas Filtrar por Puse en la pestar & Elemiertos basicas para crear un grafico mediante elementos Categoria 1 :: Categoria 2 3 Galeria Elementos básicos Grupos/ID de puntos Titulosinotas al pre Elija entre: Favorito Daras İnşa Circular Polar Dispersión Puntos Histograma Maximus minimos Diagramas de cajas Ejes doble's Aceptar Pega Restablecer Cancelar Ayuda

Medidas Estadísticas

I. Posició v Quartils (Q) V Decils (D) V Percentils o Centils (P, C) I. Dispersió V Rang (R) v Variança (S2) V Desviació Típica (S) v Rang Interquartil-lic (Rq) El Rango (R)cient de Variació (CV) I. Tendencia Central Mitjana Aritmetica (x ) v Mediana (Md) Moda (Mo) I. Forma v Assimetria (As) V Curtosi (Cu) Meck Moda 1 Nella Mediana Mediana Media Bimenca Mediana Apmeinca haca Jsmetrica hacia la cquerda O Amplitud = Es la diferencia entre el valor más alto de la variable y el más bajo

Utilidad del Rango

El rango es útil cuando se necesita una medida rápida y general de la dispersión. Sin embargo, para un análisis más profundo de la variabilidad de los datos, es mejor complementarlo con otras medidas, como la desviación estándar o el rango intercuartílico (IQR), que son menos sensibles a los valores extremos y proporcionan más información sobre la distribución interna de los datos.

Cálculo del Rango

Com es calcula? SENSE INTERVALS: R = VMÀX - VMÍN AMB INTERVALS: R = Vmax - Vmín + 1

Diagrama de Cajas Simple

WORKINIIWI de gráficos La vista previa del gráfico utiliza datos de ejemplo 4 conse Diagrama de cajas Simple iénero] ad la uni .. 0 n [For .. ente e .. Nacer > ¿Eje Y? 1 2 02. Σ (Χ-Χ)2 Σ (Χ-Χ)2 x fi

Rango Intercuartílico (RQ o RI)

Rango Interquartílico (RQ o RI) Es la diferencia entre tercero y el primer cuartil. Nos da información sobre el 50% central de la distribución. Nos permite obtener información cuando los valores extremos no son mu significativos RT - O - O.

Varianza (S2)

Varianza (S2) Cuanto más alto es el resultado obtenido, mayor será la dispersión Es el promedio (se hace la media) de las diferencias al cuadrado de cada uno de los valores que puede tener la variable, respecto de la media. Dades sense agrupar Dades agrupades ¿Ele X? Selecciona las variables y acepta Dar doble click o trasladar a caja de visualización

Desviación Típica / Estándar (S, Sd o O)

Desviación típica / estándar (S, Sd o O) El resultado de la Varianza(S2) al estar elevado al cuadrado, no está en las mismas unidades que la variable -- DIFICULTA LA INTERPRETACIÓN Para superar estas dificultades, disponemos de la Desviación típica o estándar (S o Sd) Para calcularla tan solo cogemos el resultado de S2 y le aplicamos la raíz cuadrada Sd = VS2

Cálculo de la Varianza y Desviación Estándar (Muestras)

Cálculo de la varianza y desviación estándar (muestras) Ejemplo: Edad de los hombres que han entrado al servicio de oncología durante el año 1980 52 55 57 58 58 Σ, (Χ-Χ)2 S2 = n-1 T 48 49 50 5 52 53 54 55 56 57 58 59 60

Pasos para Calcular la Varianza y Desviación Estándar

  1. Calcular la Media (X):

    · Sumamos las edades: 52 + 55 + 57 + 58 + 58 = 280. · Dividimos por el número de observaciones (n = 5): X = 280 = 56.

  2. Calcular las Desviaciones al Cuadrado:

    · Para cada edad, restamos la media y elevamos al cuadrado: . (52 - 56)2 = (-4)2 = 16 . (55 - 56)2 = (-1)2 = 1 · (57 - 56)2 = (1)2 = 1

  3. Sumar las Desviaciones al Cuadrado:

    · Sumamos todos los valores calculados: 16 + 1 + 1 + 4 + 4 = 26.

  4. Calcular la Varianza (S2):

    · Dividimos la suma de las desviaciones al cuadrado entre n - 1 (4 en este caso, porque es una muestra): · S2 = 26 = 6.5.

  5. Calcular la Desviación Estándar (S):

    · La desviación estándar es la raíz cuadrada de la varianza: · S = 16.5 ~2.55.

Cálculo Detallado de Varianza y Desviación Estándar

. (58 - 56)2 = (2)2 = 4 · (58 - 56)2 = (2)2 = 4 (52-56)2+(55-56)2+(57-56)2+(58-56)2+(58-56)2 (-4)2+(-1)2+12 + 22 + 22 26 S 2 5-1 4 4 S = V6,5 = 2,5495

Pasos Resumidos para el Cálculo

Paso 1: Calcular la media de la muestra Sumamos todas las edades y dividimos por el número total de datos. Paso 2: Calcular la desviación de cada valor respecto a la media Restamos la media de cada edad y luego elevamos el resultado al cuadrado. Paso 3: Calcular la varianza de la muestra Sumamos todos los valores obtenidos y dividimos entre n-1 (dado que es una muestra, no la población completa). Paso 4: Calcular la desviación estándar de la muestra La desviación estándar es la raíz cuadrada de la varianza.

Resumen de Resultados y Interpretación

Resumen de resultados ·Media: 56 ·Varianza: 6.5 ·Desviación estándar: 2.55 Interpretación La desviación estándar de 2.55 indica cuánto se desvían, en promedio, las edades de los hombres que ingresaron al servicio de oncología respecto a la media de 56 años. Esto nos da una idea de la variabilidad en las edades de los pacientes, mostrando que no varían mucho de la media. = = = 6,5

¿Non has encontrado lo que buscabas?

Explora otros temas en la Algor library o crea directamente tus materiales con la IA.