Cuasivarianza (varianza corregida)

kuasibariantza.pngLa cuasivarianza o varianza muestral corregida es una fórmula de estimación de la varianza poblacional que corrige el sesgo que tiene la varianza muestral respecto a dicha varianza poblacional.

Para el cálculo de la cuasivarianza  partimos de esa misma varianza muestral, que se calcula de acuerdo a esta fórmula:

$$s^2=\cfrac{\sum(x_i-\overline{x})^2}{n}$$

Dicho fórmula tiene un sesgo como estimador respecto de la varianza poblacional \(\sigma^2\); más concretamente, subestima en promedio la varianza poblacional:

$$E[s^2]=\cfrac{n-1}{n}\sigma^2$$

Para corregir dicho sesgo, se aplica la corrección de Bessel a la varianza muestral, multiplicando la varianza muestral sin corregir por el factor n/(n-1), dando lugar a la formula de la varianza muestral corregida que denotamos por \(\hat{s}^2\):

$$\hat{s}^2=\cfrac{n}{n-1}s^2=\cfrac{n}{n-1}\cfrac{\sum(x_i-\overline{x})^2}{n}=\cfrac{\sum(x_i-\overline{x})^2}{n-1}$$

Como puede observarse la diferencia entre ambos estimadores de la varianza poblacional consiste en que la varianza corregida divide entre (n-1)  la suma de los cuadrados de las diferencia respecto a la media, mientras que la varianza muestral sin corregir divide esa suma divide entre n.

Examinando el factor  n/(n-1), podemos constatar que la diferencia entre los estimadores es muy pequeña para muestras grandes, pero notable para muestras pequeñas.

Terminológicamente hay que tener cuidado a la hora de consultar bibliografía o utilizar software estadístico, ya que frecuentemente se llama varianza poblacional (population variance) a la varianza muestral sin corregir y varianza muestral (sample variance), a secas, a la varianza muestral corregida. 

También debe tenerse en cuenta que el desarrollo de la fórmula de la cuasivarianza no permite obtener, al contrario de la varianza muestral, una expresión de cálculo rápido para la varianza. Recordemos que para la varianza muestral sin corregir puede utilizarse cualquiera de las siguientes fórmulas de forma equivalente:

$$s^2=\cfrac{\sum(x_i-\overline{x})^2}{n}=\cfrac{\sum x_i^2}{n}-\overline{x}^2$$

Pero no podemos proceder de forma análoga en el caso de la varianza corregida, ya que no procede la igualdad entre las expresiones correspondientes:

$$\hat{s }^2=\cfrac{\sum(x_i-\overline{x})^2}{n-1} \neq \cfrac{\sum x_i^2}{n-1}-\overline{x}^2$$

De modo que deberá que utilizarse siempre la primera expresión, siendo la segunda expresión absolutamente errónea. 




Como citar: Sarasola, Josemari (2024) en ikusmira.org
"Cuasivarianza (varianza corregida)" (en línea)   Enlace al artículo
Última actualización: 06/05/2025

¿Tienes preguntas sobre este artículo?

Envíanos tu pregunta e intentaremos responderte lo antes posible.

Nombre
Email
Tu pregunta
Sigue aprendiendo en Audible

Apoya nuestro contenido registrándote en Audible, sigue aprendiendo gratis a través de este link!


Aleatorización (diseño de experimentos)

En el diseño de experimentos, la aleatorización es la asignación aleatoria o al azar de las unidades experimentales a los diferentes tratamientos con el objetivo de que no se produzcan sesgos y que los diferentes grupos de unidades sean comparables únicamente debido  al tratamiento, diluyendo g...

Estadística paramétrica

La estadística paramétrica es el conjunto de métodos estadísticos que partiendo de un modelo aleatorio con unos parámetros concretos para una distribución de datos, tienen como finalidad estimar o contrastar dichos parámetros en base a la muestra observada. La validez de un método paramétrico depend...

Muestra aceptante

Una muestra aceptante es el conjunto de individuos que han aceptado formalmente participar en una encuesta, entrevista o experimento, a partir de una muestra invitada. La muestra aceptante puedo coincidir o no con la muestra final de individuos....

Correlación

En la imagen, dos nubes de puntos diferentes que muestran correlación lineal positiva (izquierda) y negativa (derecha) respectivamente. En estadística, el término correlación se refiere generalmente a la relación o asociación estadística entre dos variables cuantitativas; por ejemplo, la correlac...