Cuasivarianza (varianza corregida)

kuasibariantza.pngLa cuasivarianza o varianza muestral corregida es una fórmula de estimación de la varianza poblacional que corrige el sesgo que tiene la varianza muestral respecto a dicha varianza poblacional.

Para el cálculo de la cuasivarianza  partimos de esa misma varianza muestral, que se calcula de acuerdo a esta fórmula:

$$s^2=\cfrac{\sum(x_i-\overline{x})^2}{n}$$

Dicho fórmula tiene un sesgo como estimador respecto de la varianza poblacional \(\sigma^2\); más concretamente, subestima en promedio la varianza poblacional:

$$E[s^2]=\cfrac{n-1}{n}\sigma^2$$

Para corregir dicho sesgo, se aplica la corrección de Bessel a la varianza muestral, multiplicando la varianza muestral sin corregir por el factor n/(n-1), dando lugar a la formula de la varianza muestral corregida que denotamos por \(\hat{s}^2\):

$$\hat{s}^2=\cfrac{n}{n-1}s^2=\cfrac{n}{n-1}\cfrac{\sum(x_i-\overline{x})^2}{n}=\cfrac{\sum(x_i-\overline{x})^2}{n-1}$$

Como puede observarse la diferencia entre ambos estimadores de la varianza poblacional consiste en que la varianza corregida divide entre (n-1)  la suma de los cuadrados de las diferencia respecto a la media, mientras que la varianza muestral sin corregir divide esa suma divide entre n.

Examinando el factor  n/(n-1), podemos constatar que la diferencia entre los estimadores es muy pequeña para muestras grandes, pero notable para muestras pequeñas.

Terminológicamente hay que tener cuidado a la hora de consultar bibliografía o utilizar software estadístico, ya que frecuentemente se llama varianza poblacional (population variance) a la varianza muestral sin corregir y varianza muestral (sample variance), a secas, a la varianza muestral corregida. 

También debe tenerse en cuenta que el desarrollo de la fórmula de la cuasivarianza no permite obtener, al contrario de la varianza muestral, una expresión de cálculo rápido para la varianza. Recordemos que para la varianza muestral sin corregir puede utilizarse cualquiera de las siguientes fórmulas de forma equivalente:

$$s^2=\cfrac{\sum(x_i-\overline{x})^2}{n}=\cfrac{\sum x_i^2}{n}-\overline{x}^2$$

Pero no podemos proceder de forma análoga en el caso de la varianza corregida, ya que no procede la igualdad entre las expresiones correspondientes:

$$\hat{s }^2=\cfrac{\sum(x_i-\overline{x})^2}{n-1} \neq \cfrac{\sum x_i^2}{n-1}-\overline{x}^2$$

De modo que deberá que utilizarse siempre la primera expresión, siendo la segunda expresión absolutamente errónea. 




Como citar: Sarasola, Josemari (2024) en ikusmira.org
"Cuasivarianza (varianza corregida)" (en línea)   Enlace al artículo
Última actualización: 19/01/2025

¿Tienes preguntas sobre este artículo?

Envíanos tu pregunta e intentaremos responderte lo antes posible.

Nombre
Email
Tu pregunta
Sigue aprendiendo en Audible

Apoya nuestro contenido registrándote en Audible, sigue aprendiendo gratis a través de este link!


Coeficiente de determinación ajustado (coeficiente de determinación corregido)

Cuando se calcula el coeficiente de determinación para un modelo de regresión estimado en su fórmula original, puede observarse que este siempre aumenta cuando se incrementa el número de regresores, de modo que cuando se van introduciendo regresores en un modelo se obtiene la falsa impresión de que ...

Medio rango intercuartil

El medio rango intercuartil (en inglés, midhinge) es una medida de tendencia central calculada como la media aritmética del primer y tercer cuartil, valores que a su vez indican los valores de la distribución que dejan por debajo y encima de esos valores el 25% de los datos o una probabilidad del 0....

Distribución de frecuencias

En estadística, una distribución de frecuencias es la presentación organizada y ordenada, en forma de tabla o como representación gráfica, de los diferentes valores que toma una variable estadística junto con la frecuencia de aparición, en forma de frecuencia absoluta o frecuencia relativa, de cada ...

Variable cuasicuantitativa

El término variable cuasicuantitativa se utiliza con dos acepciones diferentes: puede referirse a una variable ordinal, por el hecho de situarse en relación a su escala de medida entre una variable nominal o cualitativa pura y una variable cuantitativa; por otro lado, puede ser un tipo concreto ...