La matriz de covarianza es un tipo de matriz que se utiliza para describir los valores de covarianza entre dos elementos en un vector aleatorio. También se la conoce como matriz de varianza-covarianza porque la varianza de cada elemento se representa a lo largo de la diagonal mayor de la matriz y la covarianza se representa entre los elementos no diagonales. Una matriz de covarianza suele ser una matriz cuadrada. También es positivo semidefinido y simétrico. Esta matriz resulta útil cuando se trata de modelado estocástico y análisis de componentes principales.
¿Qué es la matriz de covarianza?
El diferencia -la matriz de covarianza es una matriz cuadrada con elementos diagonales que representan la varianza y los componentes no diagonales que expresan la covarianza. La covarianza de una variable puede tomar cualquier valor real: positivo, negativo o cero. Una covarianza positiva sugiere que las dos variables tienen una relación positiva, mientras que una covarianza negativa indica que no la tienen. Si dos elementos no varían juntos, tienen covarianza cero.
Aprende más, Matriz diagonal
Ejemplo de matriz de covarianza
Digamos que hay 2 conjuntos de datos X = [10, 5] e Y = [3, 9]. La varianza del conjunto X = 12,5 y la varianza del conjunto Y = 18. La covarianza entre ambas variables es -15. La matriz de covarianza es la siguiente:
Fórmula de matriz de covarianza
La forma general de una matriz de covarianza se da de la siguiente manera:

dónde,
- Variación de la muestra: donde (x1) =
frac{sum_{1}^{n}left ( x_{i} -overline{x} ight )^{2} }{n-1} - Covarianza de muestra: el (x1, y1) =
frac{sum_{1}^{n}left (x_{i} -overline{x} ight )left(y_{i}-overline{y} ight)}{n-1} - Variación de la población: donde (xnorte) =
frac{sum_{1}^{n}left ( x_{i} -mu ight )^{2} }{n} - Covarianza de población: el (xnorte, ynorte) =
frac{sum_{1}^{n}left ( x_{i} -mu_{x} ight )left ( y_{i}-mu_{y} ight ) }{n}
Aquí, metro es la media de la población
norte es el número de observación
X i es la observación en el conjunto de datos x
Veamos el formato de Matriz de Covarianza de 2 ⨯ 2 y 3 ⨯ 3
2 ⨯ 2 Matriz de covarianza
Sabemos que en un 2 ⨯ 2 matriz hay dos filas y dos columnas. Por lo tanto, la Matriz de Covarianza 2 ⨯ 2 se puede expresar como
3 ⨯ 3 Matriz de covarianza
En una matriz 3⨯3 hay 3 filas y 3 columnas. Sabemos que en una Matriz de Covarianza los elementos diagonales son varianza y los elementos no diagonales son covarianza. Por lo tanto, se puede dar una matriz de covarianza 3⨯3 como
¿Cómo encontrar la matriz de covarianza?
Las dimensiones de una matriz de covarianza están determinadas por el número de variables en un conjunto de datos determinado. Si sólo hay dos variables en un conjunto, entonces la matriz de covarianza tendría dos filas y dos columnas. De manera similar, si un conjunto de datos tiene tres variables, entonces su matriz de covarianza tendría tres filas y tres columnas.
Los datos pertenecen a las calificaciones obtenidas por Anna, Caroline y Laura en Psicología e Historia. Haz una matriz de covarianza.
| Alumno | Psicología(X) | Historia(Y) |
|---|---|---|
| ana | 80 | 70 |
| carolino | 63 | 20 |
| laura | 100 | 50 |
Se deben seguir los siguientes pasos:
Paso 1: Encuentra la media de la variable X. Suma todas las observaciones en la variable X y divide la suma obtenida por el número de términos. Por tanto, (80 + 63 + 100)/3 = 81.
Paso 2: Resta la media de todas las observaciones. (80 – 81), (63 – 81), (100 – 81).
Paso 3: Toma los cuadrados de las diferencias obtenidas anteriormente y luego súmalos. Así, (80 – 81)2+ (63 – 81)2+ (100 – 81)2.
Etapa 4: Encuentre la varianza de X dividiendo el valor obtenido en el Paso 3 por 1 menos que el número total de observaciones. var(X) = [(80 – 81)2+ (63 – 81)2+ (100 – 81)2] / (3 – 1) = 343.
Paso 5: De manera similar, repita los pasos 1 a 4 para calcular la varianza de Y. Var(Y) = 633.
Paso 6: Elija un par de variables.
Paso 7: Reste la media de la primera variable (X) de todas las observaciones; (80 – 81), (63 – 81), (100 – 81).
Paso 8: Repita lo mismo para la variable Y; (70 – 47), (20 – 47), (50 – 47).
Paso 9: Multiplica los términos correspondientes: (80 – 81)(70 – 47), (63 – 81)(20 – 47), (100 – 81)(50 – 47).
Paso 10: Encuentre la covarianza sumando estos valores y dividiéndolos por (n – 1). Cov(X, Y) = (80 – 81)(70 – 47) + (63 – 81)(20 – 47) + (100 – 81)(50 – 47)/3-1 = 481.
Paso 11: Utilice la fórmula general de la matriz de covarianza para ordenar los términos. La matriz se convierte en:
Propiedades de la matriz de covarianza
Las propiedades de la matriz de covarianza se mencionan a continuación:
- Una matriz de covarianza siempre es cuadrada, lo que implica que el número de filas en una matriz de covarianza siempre es igual al número de columnas en ella.
- Una matriz de covarianza siempre es simétrica, lo que implica que la transponer de una matriz de covarianza es siempre igual a la matriz original.
- Una matriz de covarianza es siempre positiva y semidefinida.
- El valores propios de una matriz de covarianza son siempre reales y no negativos.
Leer más,
- Tipos de matrices
- Multiplicación de matrices
- Varianza y desviación estándar
Ejemplos resueltos sobre matriz de covarianza
Ejemplo 1: Las calificaciones obtenidas por 3 estudiantes en Física y Biología se detallan a continuación:
| Alumno | Física(X) | Biología(Y) |
|---|---|---|
| A | 92 | 80 |
| B | 60 | 30 |
| C | 100 | 70 |
Calcule la matriz de covarianza a partir de los datos anteriores.
Solución:
La matriz de covarianza muestral viene dada por
frac{sum_{1}^{n}left ( x_{i} -overline{x} ight )^{2} }{n-1} .Aquí, µX= 84, norte = 3
var(x) = [(92 – 84)2+ (60 – 84)2+ (100 – 84)2] / (3 – 1) = 448
Entonces, µy= 60, norte = 3
var(y) = [(80 – 60)2+ (30 – 60)2+ (70 – 60)2] / (3 – 1) = 700
Ahora, cov(x, y) = cov(y, x) = [(92 – 84)(80 – 60) + (60 – 84)(30 – 60) + (100 – 84)(70 – 60)] / (3 – 1) = 520.
La matriz de covarianza poblacional viene dada por:
egin{bmatrix} 448 & 520 520& 700 end{bmatrix} actor rohit shetty
Ejemplo 2. Prepare la matriz de covarianza poblacional a partir de la siguiente tabla:
| Edad | Número de personas |
|---|---|
| 29 | 68 |
| 26 | 60 |
| 30 | 58 |
| 35 | 40 |
Solución:
La varianza poblacional está dada por
frac{sum_{1}^{n}left ( x_{i} -mu ight )^{2} }{n} .Aquí, µX= 56,5, norte = 4
var(x) = [(68 – 56,5)2+ (60 – 56.5)2+ (58 – 56.5)2+ (40 – 56.5)2] / 4 = 104.75
Entonces, µy= 30, norte = 4
var(y) = [(29 – 30)2+ (26 – 30)2+ (30 – 30)2+ (35 – 30)2] / 4 = 10. 5
Ahora, cov(x, y) =
frac{sum_{1}^{4}left ( x_{i} -mu_{x} ight )left ( y_{i}-mu_{y} ight ) }{4} cov(x, y) = -27
La matriz de covarianza poblacional viene dada por:
egin{bmatrix} 104.7 &-27 -27& 10.5 end{bmatrix}
Ejemplo 3. Interprete la siguiente matriz de covarianza:
Solución:
- Los elementos diagonales 60, 30 y 80 indican la varianza en los conjuntos de datos X, Y y Z respectivamente. Y muestra la varianza más baja mientras que Z muestra la varianza más alta.
- La covarianza para X e Y es 32. Como es un número positivo, significa que cuando X aumenta (o disminuye) Y también aumenta (o disminuye).
- La covarianza para X y Z es -4. Al ser un número negativo implica que cuando X aumenta, Z disminuye y viceversa.
- La covarianza para Y y Z es 0. Esto significa que no existe una relación predecible entre los dos conjuntos de datos.
Ejemplo 4. Encuentre la matriz de covarianza de muestra para los siguientes datos:
| X | Y | CON |
|---|---|---|
| 75 | 10.5 | 45 |
| 65 | 12.8 | 65 |
| 22 | 7.3 | 74 |
| 15 | 2.1 | 76 |
| 18 | 9.2 | 56 |
Solución:
La matriz de covarianza muestral viene dada por
frac{sum_{1}^{n}left ( x_{i} -overline{x} ight )^{2} }{n-1} .norte = 5, metroX= 22,4, var(X) = 321,2 / (5 – 1) = 80,3
metroy= 12.58, var(Y) = 132.148 / 4 = 33.037
metroCon= 64, var(Z) = 570/4 = 142,5
cov(X, Y) =
frac{sum_{1}^{5}left ( x_{i} -22.4 ight )left ( y_{i}-12.58 ight ) }{5-1} = -11.76 cov(X,Z) =
frac{sum_{1}^{5}left ( x_{i} -22.4 ight )left ( z_{i}-64 ight ) }{5-1} = 34.97 cov(Y,Z) =
frac{sum_{1}^{5}left ( y_{i} -12.58 ight )left ( z_{i}-64 ight ) }{5-1} = -40.87 La matriz de covarianza viene dada por:
egin{bmatrix} 80.3 & -13.865 &14.25 -13.865 & 33.037 & -39.5250 14.25 & -39.5250 & 142.5 end{bmatrix}
Preguntas frecuentes sobre la matriz de covarianza
1. Definir la matriz de covarianza
Una matriz de covarianza es un tipo de matriz que se utiliza para describir los valores de covarianza entre dos elementos en un vector aleatorio.
2. ¿Cuál es la fórmula de la matriz de covarianza?
La fórmula para la matriz de covarianza se da como
left[egin{array}{ccc} operatorname{Var}left(x_1 ight) & ldots ldots & operatorname{Cov}left(x_n, x_1 ight) vdots & ldots & vdots vdots & ldots & vdots operatorname{Cov}left(x_n, x_1 ight) & ldots ldots & operatorname{Var}left(x_n ight) end{array} ight] Dónde, Variación de la muestra: donde (x1) =
frac{sum_{1}^{n}left ( x_{i} -overline{x} ight )^{2} }{n-1}
- Covarianza de muestra: el (x1, y1) =
frac{sum_{1}^{n}left (x_{i} -overline{x} ight )left(y_{i}-overline{y} ight)}{n-1} - Variación de la población: donde (xnorte) =
frac{sum_{1}^{n}left ( x_{i} -mu ight )^{2} }{n} - Covarianza de población: el (xnorte, ynorte) =
frac{sum_{1}^{n}left ( x_{i} -mu_{x} ight )left ( y_{i}-mu_{y} ight ) }{n}
3. ¿Cuál es la forma general de una matriz de covarianza 3 ⨯ 3?
La forma general de una matriz de covarianza 3 ⨯ 3 se da de la siguiente manera:
egin{bmatrix}mathrm{var(x)}&mathrm{cov(x,y)} &mathrm{cov(x,z)} \mathrm{cov(x,y)} &mathrm{var(y)} &mathrm{cov(y,z)} \mathrm{cov(x,z)} &mathrm{cov(y,z)} &mathrm{var(z)} \end{bmatrix}
4. ¿Cuáles son las propiedades de la matriz de covarianza?
La matriz de covarianza es una matriz cuadrada y también es de naturaleza simétrica, es decir, la transpuesta de la matriz original da la matriz original misma.
5. ¿Cuáles son los sectores donde se puede utilizar la Matriz de Covarianza?
La Matriz de Covarianza se utiliza en el campo de las Matemáticas, el Aprendizaje Automático, las Finanzas y la Economía. La matriz de covarianza se utiliza en la descomposición de Cholskey para realizar la simulación Monte Carlo, que se utiliza para crear modelos matemáticos.