Cuasivarianza (varianza corregida)

La cuasivarianza o varianza muestral corregida es una fórmula de estimación de la varianza poblacional que corrige el sesgo que tiene la varianza muestral respecto a dicha varianza poblacional.

Si se calcula la varianza muestral de acuerdo a esta fórmula:

$$s^2=\cfrac{\sum(x_i-\overline{x})^2}{n}$$

Dicho fórmula tiene un sesgo como estimador respecto de la varianza poblacional \(\sigma^2\); más concretamente, subestima en promedio la varianza poblacional:

$$E[s^2]=\cfrac{n-1}{n}\sigma^2$$

Para corregir dicho sesgo, se aplica la corrección de Bessel a la varianza muestral, multiplicando la varianza muestral sin corregir por el factor n/(n-1), dando lugar a la formula de la varianza muestral corregida que denotamos por \(\hat{s}^2\):

$$\hat{s}^2=\cfrac{n}{n-1}s^2=\cfrac{n}{n-1}\cfrac{\sum(x_i-\overline{x})^2}{n}=\cfrac{\sum(x_i-\overline{x})^2}{n-1}$$

Como puede observarse la diferencia entre ambos estimadores de la varianza poblacional consiste en que la varianza corregida divide entre (n-1)  la suma de los cuadrados de las diferencia respecto a la media, mientras que la varianza muestral sin corregir divide esa suma divide entre n.

Examinando el factor  n/(n-1), podemos constatar que la diferencia entre los estimadores es muy pequeña para muestras grandes, pero notable para muestras pequeñas.

Terminológicamente hay que tener cuidado a la hora de consultar bibliografía o utilizar software estadístico, ya que frecuentemente se llama varianza poblacional (population variance) a la varianza muestral sin corregir y varianza muestral (sample variance), a secas, a la varianza muestral corregida. 

También debe tenerse en cuenta que el desarrollo de la fórmula de la cuasivarianza no permite obtener, al contrario de la varianza muestral, una expresión de cálculo rápido para la varianza. Recordemos que para la varianza muestral sin corregir puede utilizarse cualquiera de las siguientes fórmulas de forma equivalente:

$$s^2=\cfrac{\sum(x_i-\overline{x})^2}{n}=\cfrac{\sum x_i^2}{n}-\overline{x}^2$$

Pero no podemos proceder de forma análoga en el caso de la varianza corregida, ya que no procede la igualdad entre las expresiones correspondientes:

$$\hat{s }^2=\cfrac{\sum(x_i-\overline{x})^2}{n-1} \neq \cfrac{\sum x_i^2}{n-1}-\overline{x}^2$$

De modo que deberá que utilizarse siempre la primera expresión, siendo la segunda expresión absolutamente errónea. 




Como citar: Sarasola, Josemari (2024) en ikusmira.org
"Cuasivarianza (varianza corregida)" (en línea)   Enlace al artículo
Última actualización: 27/08/2024

¿Tienes preguntas sobre este artículo?

Envíanos tu pregunta e intentaremos responderte lo antes posible.

Nombre
Email
Tu pregunta

Muestras no probabilísticas (muestreo no probabilístico)

Una muestra no probabilística es aquella en la que la selección de los elementos no se realiza al azar sino siguiendo criterios más o menos accidentales y subjetivos del invstigador. Dado que la aleatoriedad de la muestra es el criterio fundamental para que los resultados que se infieren de ella sea...

Muestra aceptante

Una muestra aceptante es el conjunto de individuos que han aceptado formalmente participar en una encuesta, entrevista o experimento, a partir de una muestra invitada. La muestra aceptante puedo coincidir o no con la muestra final de individuos....

Objeto material y objeto formal de la estadística

El objeto material de la estadística viven dado por los datos como información en forma de valores cuantitativos o cualitativos sobre cierta característica de un conjunto de elementos. Su objeto formal, su perspectiva de análisis, consiste en encontrar las pautas  y regularidades que se puede e...

Marco muestral

En el muestreo de poblaciones finitas, el marco muestral es la lista que contiene todos los elementos de la población estadística de la cual se va extraer la muestra. Puede tratartse del padrón de población a la hora de seleccionar ciudadanos de un municipio, lista de matriculados a la hora de selec...