Diagrama de caja y bigotes

Un diagrama de caja o gráfico de caja, también denominado diagrama de caja y bigotes o box plot, es un diagrama que pretende representar una variable estadística cuantitativa continua, de forma que puedan establecerse con precisión el valor central, la dispersión  y otras características como asimetría y curtosis. Asimismo, establece un criterio para la consideración de outliers o datos atípicos.

Se construcción se realiza desarrollando estos pasos de forma secuencial:

  1. Se calculan la mediana y el primer y tercer cuartil.
  2. Con los valores anteriores se construye en un eje graduado horizontal o vetical la denominada caja, que tiene como límites a izquierda y derecha el primer y tercer cuartil respectivamente. La mediana se representa dentro de la caja con una línea que divide la caja en dos.
  3. Se calcula la distancia 1.5IQR, siendo IQR el recorrido intercuartílico o la diferencia entre el tercer y el primer cuartil. 
  4. A partir de los extremos de la caja se extienden líneas a un lado y otro de la caja hasta llegar a los datos más pequeños (a la izquierda) o más grandes (a la derecha), pero hasta una longitud máxima de 1.5IQR.
  5. En el caso de que los bigotes se hayan extendido hasta su longitud máxima de 1.5IQR, los datos que se sitúen fuera de esos límites tienen la consideración de outliers o datos atípicos.

Una versión del gráfico caja lleva los bigotes hasta el dato menor y mayor, sin establecer una longitud máxima para estos. 

Ejemplo de aplicación

diagrama_caja.png

Se han registrado las siguientes observaciones de temperaturas máximas diarias en marzo en un estación determinada, medidas en grados Celsius:

10.8 12.5 17.0 17.4 18.1 18.6 19.0 20.5 21.2 21.6 22.2 23.5

Se han calculado con el software R el primer cuartil, la mediana y el tercer cuartil:

$$Q_1=17.3\ ; \ Me=18.8; \ Q_3=21.3$$

Calculamos 1.5IQR=1.5x(21.3-17.3)=6

El bigote superior se extiende del tercer cuartil a la derecha hasta 21.3+6=27.3. Como los datos se agotan antes de llegar a ese valor, el bigote "se corta" en el valor máximo: 23.5.

El bigote inferior se extiende desde el primer cuartil a la izquierda hasta 17.3-6=11.3. Mas allá sigue habiendo datos, de modo que prolongamos el bigote en toda esa longitud hasta 11.3. El dato que queda fuera se considera dato atípico.



Como citar: Sarasola, Josemari (2024) en ikusmira.org
"Diagrama de caja y bigotes" (en línea)   Enlace al artículo
Última actualización: 06/05/2025

¿Tienes preguntas sobre este artículo?

Envíanos tu pregunta e intentaremos responderte lo antes posible.

Nombre
Email
Tu pregunta
Sigue aprendiendo en Audible

Apoya nuestro contenido registrándote en Audible, sigue aprendiendo gratis a través de este link!


Mediana estadística

Imagen: La mediana se muestra en el histograma como el valor que separa el 50% de los datos a cada lado, mostrando de este modo el "centro" de la distribución que puede tomarse como medida representativa del conjunto de datos.  En estadística, la mediana (Me) es el valor de la variable que s...

Correlación por rangos

En estadística, la correlación por rangos o correlación de rangos se refiere a la asociación estadística entre dos variables para las que se ha fijado el rango que ocupa cada elemento; por ejemplo, cuando se desea calcular la relación existente entre los rankings de las diez canciones más escuchadas...

Media armónica

La media armónica es una formula de cálculo de un promedio que se utiliza especialmente para el calculo de velocidades medias o rendimientos medios. Para una serie de datos homogéneos (para datos velocidades y rendimientos referidos siempre a distancias y producciones homogéneas respectivamente) \(x...

Marca de clase

Imagen: Marcas de clase (como puntos azules) en un histograma.  En una distribución agrupada de datos en intervalos, las marcas de clase o puntos medios estadísticos son los puntos en cada intervalo de clase de la variable  que se sitúan a mitad de camino del recorrido del intervalo y s...