Diagrama de caja y bigotes

Un diagrama de caja o gráfico de caja, también denominado diagrama de caja y bigotes o box plot, es un diagrama que pretende representar una variable estadística cuantitativa continua, de forma que puedan establecerse con precisión el valor central, la dispersión  y otras características como asimetría y curtosis. Asimismo, establece un criterio para la consideración de outliers o datos atípicos.

Se construcción se realiza desarrollando estos pasos de forma secuencial:

  1. Se calculan la mediana y el primer y tercer cuartil.
  2. Con los valores anteriores se construye en un eje graduado horizontal o vetical la denominada caja, que tiene como límites a izquierda y derecha el primer y tercer cuartil respectivamente. La mediana se representa dentro de la caja con una línea que divide la caja en dos.
  3. Se calcula la distancia 1.5IQR, siendo IQR el recorrido intercuartílico o la diferencia entre el tercer y el primer cuartil. 
  4. A partir de los extremos de la caja se extienden líneas a un lado y otro de la caja hasta llegar a los datos más pequeños (a la izquierda) o más grandes (a la derecha), pero hasta una longitud máxima de 1.5IQR.
  5. En el caso de que los bigotes se hayan extendido hasta su longitud máxima de 1.5IQR, los datos que se sitúen fuera de esos límites tienen la consideración de outliers o datos atípicos.

Una versión del gráfico caja lleva los bigotes hasta el dato menor y mayor, sin establecer una longitud máxima para estos. 

Ejemplo de aplicación

diagrama_caja.png

Se han registrado las siguientes observaciones de temperaturas máximas diarias en marzo en un estación determinada, medidas en grados Celsius:

10.8 12.5 17.0 17.4 18.1 18.6 19.0 20.5 21.2 21.6 22.2 23.5

Se han calculado con el software R el primer cuartil, la mediana y el tercer cuartil:

$$Q_1=17.3\ ; \ Me=18.8; \ Q_3=21.3$$

Calculamos 1.5IQR=1.5x(21.3-17.3)=6

El bigote superior se extiende del tercer cuartil a la derecha hasta 21.3+6=27.3. Como los datos se agotan antes de llegar a ese valor, el bigote "se corta" en el valor máximo: 23.5.

El bigote inferior se extiende desde el primer cuartil a la izquierda hasta 17.3-6=11.3. Mas allá sigue habiendo datos, de modo que prolongamos el bigote en toda esa longitud hasta 11.3. El dato que queda fuera se considera dato atípico.



Como citar: Sarasola, Josemari (2024) en ikusmira.org
"Diagrama de caja y bigotes" (en línea)   Enlace al artículo
Última actualización: 06/05/2025

¿Tienes preguntas sobre este artículo?

Envíanos tu pregunta e intentaremos responderte lo antes posible.

Nombre
Email
Tu pregunta
Sigue aprendiendo en Audible

Apoya nuestro contenido registrándote en Audible, sigue aprendiendo gratis a través de este link!


Momentos centrales

En estadística, los momentos centrales de una distribución son medidas que indican cómo es la distribución de los datos (en el caso de los momentos muestrales) o la distribución de probabilidad (en el caso de momentos poblacionales) alrededor de la media o valor central, indicando de esta modo ciert...

Datos blandos

Datos blandos son aquellos datos recogidos  a través de entrevistas, testimonios, encuestas de actitudes u otro tipo de fuente directa que tiene un marcado carácter subjetivo, y por tanto no tienen la fiabilidad que pueden tener datos recogidos a través de la observación directa....

Distribución de frecuencias agrupada en intervalos

Una distribución de frecuencias agrupada en intervalos, distribución de frecuencias de datos agrupados en intervalos o distribución de frecuencias por intervalos es una tabla que muestra el número de datos (frecuencia absoluta) y porcentaje de datos sobre el tamaño de muestra (frecuencia relati...

Medio rango intercuartil

El medio rango intercuartil (en inglés, midhinge) es una medida de tendencia central calculada como la media aritmética del primer y tercer cuartil, valores que a su vez indican los valores de la distribución que dejan por debajo y encima de esos valores el 25% de los datos o una probabilidad del 0....