Diagrama de caja y bigotes

Un diagrama de caja o gráfico de caja, también denominado diagrama de caja y bigotes o box plot, es un diagrama que pretende representar una variable estadística cuantitativa continua, de forma que puedan establecerse con precisión el valor central, la dispersión  y otras características como asimetría y curtosis. Asimismo, establece un criterio para la consideración de outliers o datos atípicos.

Se construcción se realiza desarrollando estos pasos de forma secuencial:

  1. Se calculan la mediana y el primer y tercer cuartil.
  2. Con los valores anteriores se construye en un eje graduado horizontal o vetical la denominada caja, que tiene como límites a izquierda y derecha el primer y tercer cuartil respectivamente. La mediana se representa dentro de la caja con una línea que divide la caja en dos.
  3. Se calcula la distancia 1.5IQR, siendo IQR el recorrido intercuartílico o la diferencia entre el tercer y el primer cuartil. 
  4. A partir de los extremos de la caja se extienden líneas a un lado y otro de la caja hasta llegar a los datos más pequeños (a la izquierda) o más grandes (a la derecha), pero hasta una longitud máxima de 1.5IQR.
  5. En el caso de que los bigotes se hayan extendido hasta su longitud máxima de 1.5IQR, los datos que se sitúen fuera de esos límites tienen la consideración de outliers o datos atípicos.

Una versión del gráfico caja lleva los bigotes hasta el dato menor y mayor, sin establecer una longitud máxima para estos. 

Ejemplo de aplicación

diagrama_caja.png

Se han registrado las siguientes observaciones de temperaturas máximas diarias en marzo en un estación determinada, medidas en grados Celsius:

10.8 12.5 17.0 17.4 18.1 18.6 19.0 20.5 21.2 21.6 22.2 23.5

Se han calculado con el software R el primer cuartil, la mediana y el tercer cuartil:

$$Q_1=17.3\ ; \ Me=18.8; \ Q_3=21.3$$

Calculamos 1.5IQR=1.5x(21.3-17.3)=6

El bigote superior se extiende del tercer cuartil a la derecha hasta 21.3+6=27.3. Como los datos se agotan antes de llegar a ese valor, el bigote "se corta" en el valor máximo: 23.5.

El bigote inferior se extiende desde el primer cuartil a la izquierda hasta 17.3-6=11.3. Mas allá sigue habiendo datos, de modo que prolongamos el bigote en toda esa longitud hasta 11.3. El dato que queda fuera se considera dato atípico.



Como citar: Sarasola, Josemari (2024) en ikusmira.org
"Diagrama de caja y bigotes" (en línea)   Enlace al artículo
Última actualización: 06/05/2025

¿Tienes preguntas sobre este artículo?

Envíanos tu pregunta e intentaremos responderte lo antes posible.

Nombre
Email
Tu pregunta
Sigue aprendiendo en Audible

Apoya nuestro contenido registrándote en Audible, sigue aprendiendo gratis a través de este link!


Varianza muestral

Este artículo es sobre la varianza muestral sin corregir para una serie de datos. Se denomina también varianza poblacional, aunque en Ikusmira utilizaremos el término de varianza poblacional para hacer referencia a la varianza de una distribución de probabilidad. Quizás estés interesado mñas exacta...

Diseño muestral

El diseño muestral es el conjunto de deciciones y acciones que tienen como objetivo que la muestra sea representativa de la población que se quiere analizar. El aspecto fundamental a decidir en un diseño muestral es el tipo de muestreo que se desea realizar. ...

Distribución uniforme continua

Imagen: En una distribución uniforme continua, la probabilidad de que valor aleatorio resultante se encuentre en un intervalo c,d es el área rosada: (c-d)/(b-a). Todos los intervalos de igual longitud tienen la misma probabilidad.  La distribución uniforme continua es una distribución de pro...

Frecuencia acumulada relativa

Para una variable estadística cuantitativa, la frecuencia acumulada relativa, frecuencia relativa acumulada  o porcentaje acumulado es el porcentaje de elementos sobre el tamaño de  la muestra inferior o igual a un valor dado de una variable estadística cuantitativa. Por ejemplo, para...