Media aritmética para datos agrupados

La media aritmética para datos agrupados es conceptualmente la misma que la media aritmética para datos no agrupados, pero su cálculo en la práctica a partir de la distribuciones de frecuencias es diferente (consulta, además, datos agrupados). Veamos un ejemplo:

Las calificaciones obtenidas por un grupo de alumnos en un examen se distribuyen según se indica a continuación:

$x_i$ (calificaciones)	$n_i$ (número de alumnos)
5	1
6	3
7	4
8	2
	Tamaño muestral=10

Un aprendiz torpe de estadística calcularía la media aritmética de las calificaciones de esta forma, utilizando la fórmula de la media para datos aislados:

$$\overline{x}=\cfrac{5+6+7+8}{4}=6.5$$

Dicho cálculo es erróneo porque en este caso los valores $x_i$ no representan a los datos, sino a los valores de la variables. Dicho de otra forma, los datos no son 5-6-7-8 sino 5-6-6-7-7-7-7-8-8, esto es, hay que tener en cuenta evidentemente que los valores de la variable aparecen diferente número de veces en la distribución; por tanto, la media aritmética sería (5+6+6+7+7+7+7+8+8)/10. Para evitar sumar el mismo dato una y otra vez, lo podemos hacer multiplicando cada valor de la variable por su frecuencia absolutua: (1x5+2x6+4x7+2x8)/10. Normalmente, el cálculo se hace a través de una columna que se añade a la columna de frecuencias y que representa las sumas parciales para cada valor:

$x_i$ (calificaciones)	$n_i$ (número de alumnos)	$n_ix_i$ (sumas parciales)
5	1	5
6	3	18
7	4	28
8	2	16
	Tamaño muestral=10	Total=67

Resultando de esta forma la media:

$$\overline{x}=\cfrac{67}{10}=6.7\ puntos$$

Por tanto, la fórmula general para la media aritmética con datos agrupados es la siguiente:

$$\overline{x}=\cfrac{\sum_i n_ix_i}{\sum_i n_i}$$

Cuando los datos se han agrupado en intervalos, no es posible calcular la media aritmética directamente con la fórmula anterior, ya que en lugar de los valores $x_i$ tenemos una serie de intervalos de clase. En estos casos, se sustituye el intervalo por su marca de clase o punto medio del intervalo como representativo de todo el intervalo. Suponiendo que los datos se distribuyen uniformemente a lo largo del intervalo, se considera que no hay un error sistemático derivado de la utilización de la marca de clase como valor representativo de todos los datos incluidos en el intervalo ya que los errores por exceso se compensan generalmente con los errores por defecto. Veamos un ejemplo.

Intervalo de notas	$n_i$ (número de alumnos)
5-6	2
6-7	5
7-8	6
8-9	4
9-10	3
	Tamaño muestral=20

Sustituyendo los intervalos por su marca de clase y operando de la misma forma que en el ejemplo anterior:

Intervalo de notas	$x_i$ (marca de clase)	$n_i$ (número de alumnos)	$n_ix_i$ (sumas parciales)
5-6	5.5	2	11
6-7	6.5	5	32.5
7-8	7.5	6	45
8-9	8.5	4	34
9-10	9.5	3	28.5
		Tamaño muestral=20	Total=151

Resultado este forma esta media aritmética:

$$\overline{x}=\cfrac{151}{20}=7.55\ puntos$$

Puede interesarte también

Media de medias (media general, media agregada)

Como citar: Sarasola, Josemari (2024) en ikusmira.org
"Media aritmética para datos agrupados" (en línea) Enlace al artículo
Última actualización: 06/05/2025

¿Tienes preguntas sobre este artículo?

Envíanos tu pregunta e intentaremos responderte lo antes posible.

Sigue aprendiendo en Audible

Apoya nuestro contenido registrándote en Audible, sigue aprendiendo gratis a través de este link!

Percentiles

Un percentil es el valor de una variable estadística que deja por debajo suyo un porcentaje dado de datos de una muestra. Por ejemplo, el percentil 10, expresado P10, de las calificaciones de un grupo de alumnos, es la calificación en puntos por debajo de la cual se sitúa el 10% de los alumnos del g...

Escalas categóricas

Las escalas categóricas o escalas cualitativas son aquellas escalas de medida que asignan una categoría relativa a una característica de estudio y no una medida cuantitativa a cada uno de los elementos u objetos que forman un conjunto, muestra o población. Por ejemplo son escalas categóricas, el sex...

Muestra invitada

La muestra invitada es el conjunto de individuos a los que se ha invitado a participar en una encuesta, entrevista o experimento. La muestra de individuos invitados que aceptan formalmente participar se denomina muestra aceptante....

Winsorización

En estadística, la winsorización es el proceso por el que se sustituye un porcentaje dado de valores extremos en una distribución de datos por los valores contiguos, con el objetivo de limitar la influencia de estos valores extremos en los estadísticos que resulten de la muestra (consulta el ar...

\(x_i\) (calificaciones)	\(n_i\) (número de alumnos)
5	1
6	3
7	4
8	2
	Tamaño muestral=10

\(x_i\) (calificaciones)	\(n_i\) (número de alumnos)	\(n_ix_i\) (sumas parciales)
5	1	5
6	3	18
7	4	28
8	2	16
	Tamaño muestral=10	Total=67

Intervalo de notas	\(x_i\) (marca de clase)	\(n_i\) (número de alumnos)	\(n_ix_i\) (sumas parciales)
5-6	5.5	2	11
6-7	6.5	5	32.5
7-8	7.5	6	45
8-9	8.5	4	34
9-10	9.5	3	28.5
		Tamaño muestral=20	Total=151