Complemento de Schur
En álgebra lineal y teoría de matrices, el complemento de Schur de un bloque de matriz (es decir, de una submatriz dentro de una matriz más grande) se define de la manera siguiente:
Supóngase que A, B, C y D son respectivamente matrices de orden p×p, p×q, q×p y q×q, y que D es invertible. Sea
de modo que M es una matriz de orden (p+q)×(p+q).
Entonces, se define el complemento de Schur del bloque D de la matriz M como la matriz de orden p×p
y el complemento de Schur del bloque A de la matriz M se define como la matriz de orden q×q
En el caso de que A o D sean matrices singulares, las inversas M/A y M/D pueden ser reemplazadas por un inverso generalizado, produciendo lo que se llama un complemento de Schur generalizado.
El complemento de Schur lleva el nombre de Issai Schur, que lo utilizó para probar el Lema de Schur, aunque ya se había utilizado anteriormente.[1] Emilie Haynsworth fue la primera en llamarlo "complemento de Schur".[2] El complemento de Schur es una herramienta clave en los campos de análisis numérico, estadística y análisis de matrices.
Antecedentes
El complemento de Schur surge como resultado de realizar un bloque de eliminación Gaussiana al multiplicar la matriz M desde la derecha por la matriz "triangular inferior"
Aquí Ip denota una matriz identidad de orden p×p. Después de la multiplicación por la matriz L aparece el complemento de Schur en el bloque superior de orden p×p. La matriz del producto es
Esto es análogo a una factorización LU. Es decir, se ha demostrado que
y el inverso de M se puede expresar como D−1 y el inverso del complemento de Schur (si existe) solo como
Un lema sobre la inversión de matrices ilustra las relaciones entre lo anterior y la deducción equivalente con las posiciones de A y D intercambiadas.
Propiedades
- Si M es una matriz simétrica definida positiva, entonces también lo es el complemento de Schur de D en M.
- Si p y q son ambos 1 (es decir, A, B, C y D son todos escalares), se obtiene la familiar fórmula para el inverso de una matriz de 2 por 2:
- siempre que AD − BC no sea cero.
- El determinante de M también se ve claramente como dado por
- que generaliza la fórmula del determinante para matrices de 2x2.
- (Fórmula de adición de rango de Guttman) El rango de M viene dado por
- (Fórmula de aditividad inercial de Haynsworth) La "inercia" de un bloque de la matriz "M" es igual a la inercia de "A" más la inercia de "M"/"A".
Aplicación para resolver ecuaciones lineales
El complemento de Schur surge naturalmente al resolver un sistema de ecuaciones lineales como
donde x, a son vectores columna p dimensionales; y, b son vectores columna q dimensionales; y A, B, C, D son como los anteriores. Multiplicando la ecuación inferior por y luego restando de la ecuación superior, se obtiene
Por lo tanto, si es posible invertir D y el complemento de Schur de D, se puede resolver x; y al usar la ecuación puede resolverse y. Esto reduce el problema de invertir una matriz a la de invertir una matriz de p×p y una matriz q×q. En la práctica, se necesita que D esté bien condicionada para que este algoritmo sea numéricamente preciso.
En ingeniería eléctrica esto se conoce como eliminación de nudos o reducción de Kron.
Aplicaciones a la teoría de la probabilidad y la estadística
Supóngase que los vectores columna aleatorios X, Y están definidos en Rn y Rm respectivamente, y el vector ( X,Y ) en Rn+m define una distribución normal multivariante cuya covarianza es la matriz simétrica positiva definida
donde es la matriz de covarianza de X, es la matriz de covarianza de Y y es la matriz de covarianza entre X e Y.
Entonces, la covarianza condicional de X dado Y es el complemento de Schur de C en :
Si se considera que la matriz anterior es, no una covarianza de un vector aleatorio, sino una covarianza de "muestra", entonces puede tener una distribución de Wishart. En ese caso, el complemento de Schur de C en también tiene una distribución de Wishart.
Condición del complemento de Schur para definición positiva y semidefinición positiva
Sea X una matriz simétrica dada por
sea X/A el complemento de Schur de A en X, es decir
y sea X/C el complemento de Schur de C en X, es decir
Entonces
- X es positiva definida si y solo si A y X/A son ambos positivos definidos:
- .
- X es positivo definido si y solo si C y X/C son ambos positivos definidos:
- .
- Si A es positivo definido, entonces X es positivo semidefinido si y solo si X/A es positivo semidefinido:
- , .
- Si C es positivo definido, entonces X es positivo semidefinido si y solo si X/C es positivo semidefinido:
- , .
Los enunciados primero y tercero se pueden derivar de[3] considerando el minimizador de la cantidad
como una función de v (para u fijo).
Además, desde
y de manera similar para las matrices semi-definidas positivas, la segunda declaración (y respectivamente la cuarta) es inmediata a partir de la primera declaración (o en su caso, de la tercera).
También hay una condición suficiente y necesaria para la semidefinición positiva de X en términos de un complemento de Schur generalizado.[1] Precisamente,
- y
donde denota el inverso generalizado de .
Véase también
Referencias
- Zhang, Fuzhen (2005). The Schur Complement and Its Applications. Springer. ISBN 0-387-24271-6. doi:10.1007/b105056.
- Haynsworth, E. V., "On the Schur Complement", Basel Mathematical Notes, #BNB 20, 17 pages, June 1968.
- Boyd, S. and Vandenberghe, L. (2004), "Convex Optimization", Cambridge University Press (Appendix A.5.5)