Intervalo de clase

ikusmira_histograma_1.png

Imagen: Tras recoger las alturas de 50 jóvenes, estas se han agrupado en los intervalos de clase 160-165 (4 chicos), 165-170 (23 chicos), 170-175 (16 chicos), 175-180 (7 chicos), con el objetivo de representar mejor su distribución, dado que la lista de datos sin agrupar mostraría una serie de alturas difícil de interpretar por ser estas diferentes. Podemos ver de esta forma que el mayor número de chicos se encuentra en el intervalo de alturas 165-170cm.

Un intervalo de clase es un intervalo numérico en el que se agrupan datos cuantitativos que de otra forma se deberían expresar o representar de forma individual o aislada por tomar valores diferentes entre sí. En otras palabras, los intervalos de clase se utilizan para agrupar datos de una variable cuantitativa continua. Por ejemplo, respecto a las ventas diarias en un comercio, un intervalo de clase en euros sería 1000-2000, donde se agruparían las ventas diarias en ese intervalo. Para cada intervalo se calculan las frecuencias absolutas, número de datos individuales en el intervalo, y las frecuencias relativas, esto es, el número de datos en cada intervalo en porcentaje sobre el tamaño de la muestra (ver, además, frecuencia de clase). La secuencia de intervalos de clase junto con sus respectivas frecuencias conforman lo que se conoce con el nombre de distribución agrupada de datos, a partir de la cual se construirá el histograma.

Otros conceptos relacionados con los intervalos de clase son los límites de clase, la amplitud de clase y la marca de clase

Existen diferentes reglas para determinar el número de intervalos en el que se deben agrupar lo datos, pero en general se considera que el número de intervalos óptimo está entre 5 y 15. Con un número demasiado pequeño de intervalos se da una pérdida considerable de información respecto al conjunto original y datos, y un número demasiado grande no es eficiente en el sentido de que no resume adecuadamente la distribución de los datos individuales. La regla de Sturges es una fórmula que determina el número de intervalos supuestamente óptimo dependiendo del número de datos. 

Otros criterios a seguir a la hora de fijar intervalos de clase son:

  • se recomiendan generalmente intervalos de clase de amplitud constante, aunque a veces esto no es lo conveniente;
  • en general, los extremos de los intervalos deben ser números redondeados (10, 50, 100, ...);
  • por convenio, se considera que los intervalos son cerrados por la izquierda y abiertos por la derecha, de modo que entre los intervalos 0-10 y 10-20, el dato de valor 10 debería incluirse en el segundo intervalo.

ikusmira_amplitud_clase.png

Puede interesarte también



Como citar: Sarasola, Josemari (2024) en ikusmira.org
"Intervalo de clase" (en línea)   Enlace al artículo
Última actualización: 27/08/2024

¿Tienes preguntas sobre este artículo?

Envíanos tu pregunta e intentaremos responderte lo antes posible.

Nombre
Email
Tu pregunta

Tipificación

La tipificación o estandarización es la operación que sustrae a cada valor de una variable cuantitativa la media de la distribución y divide el resultado entre la desviación típica. Los valores resultante se denominan valores z.  El objetivo es reducir los datos a una escala típica o estándar d...

Media geométrica

La media geométrica de una serie o conjunto de valores cuantitativos \(x-1,x_2,...,x_n\) se calcula a través de la siguiente fórmula:  $$G=(x_1 \cdot x_2 \cdot \cdots \cdot x_n)^{1/n}$$ Por ejemplo, la media geométrica de los valores 2 y 4 es: $$G=(2 \times 4)^{1/2}=2.828$$ En relación con ...

Perturbación aleatoria

La perturbación aleatoria (en inglérs, random error, error term) es el componente no determinista en un modelo estadístico, no observable y que incluye de forma conjunta todos los factores no especificados en el modelo. Generalmente la perturbación aleatoria aparece en los modelos de regresión ...

Distribución de llegadas

Imagen: Distribuciones de llegadas en forma gráfica según un proceso de Poisson con diferentes tasas de llegadas: el proceso de abajo tiene una tasa de llegadas (parámetro lambda) mayor que el de arriba. Una distribución de llegadas es la especificación en forma de distribución de probabil...