Matriz de varianzas y covarianzas (matriz de covarianzas)

La matriz de varianzas y covarianzas es una matriz cuadrada que representa para un conjunto de variables estadísticas o variables aleatorias las varianzas muestrales o varianzas poblacionales de todas ellas, en la diagonal principal, y las covarianzas existentes entre todos los pares de variables, fuera de dicha diagonal. Las variables para las que se calcula cada varianza y covarianza dependen de la fila y columna correspondientes a su posición en la matriz, estando las variables ordenadas de la misma manera en filas y columnas. La matriz se caracteriza por ser una matriz simétrica, ya que la propia covarianza es un estadístico simétrico, independiente del orden en que se presenten las variables. La matriz de varianzas y covarianzas se utiliza especialmente en modelos de regresión y otras técnicas multivariantes.

Para las variables \(X_1,X_2,ldots,X_n\) la matriz varianza-covarianza se expresa y determina de la siguiente manera:

$$
\Sigma
=
\begin{bmatrix}
\text{Var}(X_1) & \text{Cov}(X_1,X_2) & \cdots & \text{Cov}(X_1,X_n) \\
\text{Cov}(X_2,X_1) & \text{Var}(X_2) & \cdots & \text{Cov}(X_2,X_n) \\
\vdots & \vdots & \ddots & \vdots \\
\text{Cov}(X_n,X_1) & \text{Cov}(X_n,X_2) & \cdots & \text{Var}(X_n)
\end{bmatrix}$$

La matriz de varianzas y covarianzas también se suele denominar matriz de covarianzas, teniendo en cuenta que la varianza no es más que la covarianza de una variable con sí misma. 

Puede interesarte también

Matriz de correlación



Como citar: Sarasola, Josemari (2024) en ikusmira.org
"Matriz de varianzas y covarianzas (matriz de covarianzas)" (en línea)   Enlace al artículo
Última actualización: 06/05/2025

¿Tienes preguntas sobre este artículo?

Envíanos tu pregunta e intentaremos responderte lo antes posible.

Nombre
Email
Tu pregunta
Sigue aprendiendo en Audible

Apoya nuestro contenido registrándote en Audible, sigue aprendiendo gratis a través de este link!


Perturbación aleatoria

La perturbación aleatoria (en inglérs, random error, error term) es el componente no determinista en un modelo estadístico, no observable y que incluye de forma conjunta todos los factores no especificados en el modelo. Generalmente la perturbación aleatoria aparece en los modelos de regresión ...

Polígono de frecuencias

Un polígono de frecuencias es una representación visual de datos de una variable estadística continua, construida a partir del histograma, y con una interpretación análoga a este, formado por líneas que unen los puntos cartesianos formados por las marcas de clase o puntos medios de cada inter...

Distribución asimétrica positiva (a la derecha)

Una distribución estadística es asimétrica positiva o a la derecha es aquella en la que los datos correspondientes a valores bajos se concentran en un intervalo más bien estrecho, mientras que los datos correspondientes a valores altos se encuentran dispersos en un intervalo más amplio. También pued...

Moda absoluta y moda relativa

En relación a la moda de una variable estadística, cabe distinguir entre moda absoluta y moda relativa. La moda absoluta es el valor con mayor frecuencia de todos los valores de la variable estadística, es decir, es la moda en sentido estricto. Pero por otro lado, también se distingue la moda re...