Cuasivarianza (varianza corregida)
La cuasivarianza o varianza muestral corregida es una fórmula de estimación de la varianza poblacional que corrige el sesgo que tiene la varianza muestral respecto a dicha varianza poblacional.
Si se calcula la varianza muestral de acuerdo a esta fórmula:
$$s^2=\cfrac{\sum(x_i-\overline{x})^2}{n}$$
Dicho fórmula tiene un sesgo como estimador respecto de la varianza poblacional \(\sigma^2\); más concretamente, subestima en promedio la varianza poblacional:
$$E[s^2]=\cfrac{n-1}{n}\sigma^2$$
Para corregir dicho sesgo, se aplica la corrección de Bessel a la varianza muestral, multiplicando la varianza muestral sin corregir por el factor n/(n-1), dando lugar a la formula de la varianza muestral corregida que denotamos por \(\hat{s}^2\):
$$\hat{s}^2=\cfrac{n}{n-1}s^2=\cfrac{n}{n-1}\cfrac{\sum(x_i-\overline{x})^2}{n}=\cfrac{\sum(x_i-\overline{x})^2}{n-1}$$
Como puede observarse la diferencia entre ambos estimadores de la varianza poblacional consiste en que la varianza corregida divide entre (n-1) la suma de los cuadrados de las diferencia respecto a la media, mientras que la varianza muestral sin corregir divide esa suma divide entre n.
Examinando el factor n/(n-1), podemos constatar que la diferencia entre los estimadores es muy pequeña para muestras grandes, pero notable para muestras pequeñas.
Terminológicamente hay que tener cuidado a la hora de consultar bibliografía o utilizar software estadístico, ya que frecuentemente se llama varianza poblacional (population variance) a la varianza muestral sin corregir y varianza muestral (sample variance), a secas, a la varianza muestral corregida.
También debe tenerse en cuenta que el desarrollo de la fórmula de la cuasivarianza no permite obtener, al contrario de la varianza muestral, una expresión de cálculo rápido para la varianza. Recordemos que para la varianza muestral sin corregir puede utilizarse cualquiera de las siguientes fórmulas de forma equivalente:
$$s^2=\cfrac{\sum(x_i-\overline{x})^2}{n}=\cfrac{\sum x_i^2}{n}-\overline{x}^2$$
Pero no podemos proceder de forma análoga en el caso de la varianza corregida, ya que no procede la igualdad entre las expresiones correspondientes:
$$\hat{s }^2=\cfrac{\sum(x_i-\overline{x})^2}{n-1} \neq \cfrac{\sum x_i^2}{n-1}-\overline{x}^2$$
De modo que deberá que utilizarse siempre la primera expresión, siendo la segunda expresión absolutamente errónea.
Como citar: Sarasola, Josemari (2024) en ikusmira.org
"Cuasivarianza (varianza corregida)" (en línea) Enlace al artículo
Última actualización: 27/08/2024
¿Tienes preguntas sobre este artículo?
Envíanos tu pregunta e intentaremos responderte lo antes posible.
Apoya nuestro contenido registrándote en Audible, sigue aprendiendo gratis a través de este link!