Matrice par blocs

On appelle matrice par blocs une matrice divisée en blocs à partir d'un groupement quelconque de termes contigus de sa diagonale. Chaque bloc étant indexé comme on indicerait les éléments d'une matrice, la somme et le produit de deux matrices partitionnées suivant les mêmes tailles de bloc, s'obtiennent avec les mêmes règles formelles que celles des composantes (mais en veillant à l'ordre des facteurs dans les produits matriciels!). L'intérêt du partitionnement des matrices en bloc vient de ce que le produit d'un bloc par un bloc dont toutes les composantes sont nulles (sous-matrice nulle) est une matrice nulle. Le partitionnement des matrices permet de distribuer les calculs matriciels entre plusieurs processeurs travaillant concurremment : c'est l'un des principes de base du calcul parallèle.

Un matrice présente une structure par blocs si l'on peut isoler les termes non nuls dans des sous-matrices (ici la structure « diagonale par blocs » d'une réduite de Jordan).

Définition

En théorie des matrices, une matrice par blocs ou matrice partitionnée est une matrice divisée en sous-matrices rectangulaires à partir d'une division de sa diagonale : ces sous-matrices sont appelées blocs[1]. On peut dire également que la matrice est écrite en termes de sous-matrices mises côte à côte. Une matrice par blocs doit se conformer à une manière cohérente de division des lignes et des colonnes :

on groupe les lignes en « groupes » adjacents, et les colonnes de la même manière ;
on convient que les blocs diagonaux sont des sous-matrices carrées.

La partition se fait dans les rectangles décrits par un groupe de lignes adjacentes croisant un groupe de colonnes adjacentes. En d'autres termes, la matrice est divisée par certaines des lignes horizontales et verticales la traversant.

Exemple

La matrice

\mathbf {P} ={\begin{bmatrix}1&1&2&2&2\\1&1&2&2&2\\3&3&4&4&4\\3&3&4&4&4\\3&3&4&4&4\end{bmatrix}}

peut être partitionnée en quatre blocs

\mathbf {P} _{11}={\begin{bmatrix}1&1\\1&1\end{bmatrix}},\mathbf {P} _{12}={\begin{bmatrix}2&2&2\\2&2&2\end{bmatrix}},\mathbf {P} _{21}={\begin{bmatrix}3&3\\3&3\\3&3\end{bmatrix}},\mathbf {P} _{22}={\begin{bmatrix}4&4&4\\4&4&4\\4&4&4\end{bmatrix}}.

On peut alors écrire la matrice par bloc comme :

\mathbf {P} _{\mathrm {partitionnee} }={\begin{bmatrix}\mathbf {P} _{11}&\mathbf {P} _{12}\\\mathbf {P} _{21}&\mathbf {P} _{22}\end{bmatrix}}.

Multiplication de matrices par blocs

Sous certaines conditions d'homogénéité du partitionnement en blocs, un produit de matrices peut être effectué par blocs, c'est-à-dire en considérant seulement des opérations sur les sous-matrices[1]. Étant donné une matrice $A$ $(m \times p)$ avec $q$ partitions de lignes et $s$ de colonnes :

\mathbf {A} ={\begin{bmatrix}\mathbf {A} _{11}&\mathbf {A} _{12}&\cdots &\mathbf {A} _{1s}\\\mathbf {A} _{21}&\mathbf {A} _{22}&\cdots &\mathbf {A} _{2s}\\\vdots &\vdots &\ddots &\vdots \\\mathbf {A} _{q1}&\mathbf {A} _{q2}&\cdots &\mathbf {A} _{qs}\end{bmatrix}}

et une matrice $B$ $(p \times n)$ avec $s$ partitions de lignes et $r$ partitions de colonnes :

\mathbf {B} ={\begin{bmatrix}\mathbf {B} _{11}&\mathbf {B} _{12}&\cdots &\mathbf {B} _{1r}\\\mathbf {B} _{21}&\mathbf {B} _{22}&\cdots &\mathbf {B} _{2r}\\\vdots &\vdots &\ddots &\vdots \\\mathbf {B} _{s1}&\mathbf {B} _{s2}&\cdots &\mathbf {B} _{sr}\end{bmatrix}}

,

et à la condition que le nombre de colonnes de chaque bloc $A_{ij}$ soit égal au nombre de lignes du bloc $B_{jk}$ , le produit matriciel :

\mathbf {C} =\mathbf {A} \mathbf {B}

peut être effectué par blocs, donnant $C$ , matrice $(m \times n)$ avec $q$ partitions de lignes et $r$ partitions de colonnes. Les blocs sous-matrices de $C$ sont calculés de la manière suivante[2] :

\mathbf {C} _{\alpha \beta }=\sum _{\gamma =1}^{s}\mathbf {A} _{\alpha \gamma }\mathbf {B} _{\gamma \beta },\quad \alpha =1,\ldots ,q,\quad \beta =1,\ldots ,r.

le produit de matrices n'est pas commutatif, donc l'ordre de facteurs ne changera pas.

Matrices par blocs diagonales

Une matrice bloc-diagonale (ou diagonale par blocs) est une matrice carrée qui possède des blocs matrices carrées sur la diagonale principale, tels que les blocs non diagonaux soient des matrices nulles. Une matrice bloc-diagonale $A$ est de forme :

\mathbf {A} ={\begin{bmatrix}\mathbf {A} _{1}&0&\cdots &0\\0&\mathbf {A} _{2}&\cdots &0\\\vdots &\vdots &\ddots &\vdots \\0&0&\cdots &\mathbf {A} _{n}\end{bmatrix}}

où $A k$ est une matrice carrée ; en d'autres termes, c'est la somme directe de $A 1, \dots, A n$ . On peut aussi noter ceci : $\mathbf {A} _{1}\oplus \mathbf {A} _{2}\oplus \,\ldots \,\oplus \mathbf {A} _{n}$ ou $diag(A 1, A 2,..., A n)$ , ce dernier étant une expression dans le même formalisme que celui d'une matrice diagonale. Toute matrice carrée peut être de manière triviale considérée comme une matrice bloc-diagonale avec un seul bloc.

Pour le déterminant et la trace, les expressions sont alors :

\operatorname {det} (\mathbf {A} )=\operatorname {det} (\mathbf {A} _{1})\cdots \operatorname {det} (\mathbf {A} _{n})

,

\operatorname {trace} (\mathbf {A} )=\operatorname {trace} (\mathbf {A} _{1})+\cdots +\operatorname {trace} (\mathbf {A} _{n})

.

Pour tout entier $n$ , on a :

{\begin{pmatrix}\mathbf {A} _{1}&0&\cdots &0\\0&\mathbf {A} _{2}&\cdots &0\\\vdots &\vdots &\ddots &\vdots \\0&0&\cdots &\mathbf {A} _{n}\end{pmatrix}}^{n}={\begin{pmatrix}\mathbf {A} _{1}^{n}&0&\cdots &0\\0&\mathbf {A} _{2}^{n}&\cdots &0\\\vdots &\vdots &\ddots &\vdots \\0&0&\cdots &\mathbf {A} _{n}^{n}\end{pmatrix}}

L'inverse d'une matrice diagonale par blocs est donc la matrice, diagonale par blocs, des inverses des blocs :

{\begin{pmatrix}\mathbf {A} _{1}&0&\cdots &0\\0&\mathbf {A} _{2}&\cdots &0\\\vdots &\vdots &\ddots &\vdots \\0&0&\cdots &\mathbf {A} _{n}\end{pmatrix}}^{-1}={\begin{pmatrix}\mathbf {A} _{1}^{-1}&0&\cdots &0\\0&\mathbf {A} _{2}^{-1}&\cdots &0\\\vdots &\vdots &\ddots &\vdots \\0&0&\cdots &\mathbf {A} _{n}^{-1}\end{pmatrix}}

Matrices tridiagonales par blocs

Une matrice tridiagonale par bloc est une autre matrice par bloc spéciale, qui est comparable à la matrice diagonale par blocs, c'est-à-dire une matrice carrée ayant des matrices blocs carrées sur les diagonales principales, inférieure et supérieure, les autres blocs étant des matrices nulles. C'est une matrice tridiagonale essentiellement, mais qui possède des sous-matrices à la place des coefficients scalaires. Une matrice tridiagonale par bloc $A$ a la forme :

\mathbf {A} ={\begin{bmatrix}\mathbf {B} _{1}&\mathbf {C} _{1}&&&\cdots &&0\\\mathbf {A} _{2}&\mathbf {B} _{2}&\mathbf {C} _{2}&&&&\\&\ddots &\ddots &\ddots &&&\vdots \\&&\mathbf {A} _{k}&\mathbf {B} _{k}&\mathbf {C} _{k}&&\\\vdots &&&\ddots &\ddots &\ddots &\\&&&&\mathbf {A} _{n-1}&\mathbf {B} _{n-1}&\mathbf {C} _{n-1}\\0&&\cdots &&&\mathbf {A} _{n}&\mathbf {B} _{n}\end{bmatrix}}

où $A k$ , $B k$ et $C k$ sont des sous-matrices carrées sur les diagonales inférieure, principale et supérieure respectivement.

Les matrices tridiagonales par blocs sont parfois rencontrées dans les solutions numériques des problèmes d'ingénierie (ex. : en calcul de structures et en mécanique des fluides numérique). Les méthodes numériques optimisées pour une factorisation LU sont disponibles ainsi que des algorithmes de résolution de systèmes d'équations avec une matrice tridiagonale par bloc pour matrice de coefficients. L'algorithme de Thomas, utilisé pour obtenir une solution efficace des systèmes d'équations impliquant une matrice tridiagonale peut être aussi appliqué en utilisant des opérations matricielles aux matrices tridiagonales par blocs.^{[réf. nécessaire]}

Matrices de Toeplitz par blocs

Une matrice de Toeplitz par bloc est une autre matrice par bloc spéciale, contenant des blocs répétés le long des diagonales de la matrice, comme pour les coefficients d'une matrice de Toeplitz. Une matrice de Toeplitz par bloc $A$ est de la forme :

\mathbf {A} ={\begin{bmatrix}\mathbf {A} _{(1,1)}&\mathbf {A} _{(1,2)}&&&\cdots &\mathbf {A} _{(1,n-1)}&\mathbf {A} _{(1,n)}\\\mathbf {A} _{(2,1)}&\mathbf {A} _{(1,1)}&\mathbf {A} _{(1,2)}&&&&\mathbf {A} _{(1,n-1)}\\&\ddots &\ddots &\ddots &&&\vdots \\&&\mathbf {A} _{(2,1)}&\mathbf {A} _{(1,1)}&\mathbf {A} _{(1,2)}&&\\\vdots &&&\ddots &\ddots &\ddots &\\\mathbf {A} _{(n-1,1)}&&&&\mathbf {A} _{(2,1)}&\mathbf {A} _{(1,1)}&\mathbf {A} _{(1,2)}\\\mathbf {A} _{(n,1)}&\mathbf {A} _{(n-1,1)}&\cdots &&&\mathbf {A} _{(2,1)}&\mathbf {A} _{(1,1)}\end{bmatrix}}

Somme directe

Pour toutes matrices arbitraires $A$ (de taille $m \times n$ ) et $B$ (de taille $p \times q$ ), il existe une somme directe de $A$ et $B$ , notée $\mathbf {A} \oplus \mathbf {B}$ définie par :

\mathbf {A} \oplus \mathbf {B} ={\begin{bmatrix}a_{11}&\cdots &a_{1n}&0&\cdots &0\\\vdots &\cdots &\vdots &\vdots &\cdots &\vdots \\a_{m1}&\cdots &a_{mn}&0&\cdots &0\\0&\cdots &0&b_{11}&\cdots &b_{1q}\\\vdots &\cdots &\vdots &\vdots &\cdots &\vdots \\0&\cdots &0&b_{p1}&\cdots &b_{pq}\end{bmatrix}}.

Par exemple,

{\begin{bmatrix}1&3&2\\2&3&1\end{bmatrix}}\oplus {\begin{bmatrix}1&6\\0&1\end{bmatrix}}={\begin{bmatrix}1&3&2&0&0\\2&3&1&0&0\\0&0&0&1&6\\0&0&0&0&1\end{bmatrix}}.

Cette opération est généralisable naturellement à tous tableaux de dimensions arbitraires (pourvu que $A$ et $B$ aient le même nombre de dimensions).

Notons que tout élément dans la somme directe de deux espaces vectoriels matriciels peut être représentée comme une somme directe de matrices.

Produit direct

De manière similaire à la somme directe, il existe une opération appelée produit direct portant sur les matrices par blocs.

Utilisations et applications

En algèbre linéaire, l'utilisation d'une matrice par bloc correspond à avoir une application linéaire pensée en termes de groupes correspondants à des vecteurs de base. Cela rejoint l'idée d'avoir des décompositions en sommes directes distinctes des ensembles de définitions de départ et d'arrivée. Cela est particulièrement significatif si un bloc est une matrice nulle ; ceci indique qu'un sous-ensemble est linéaire à une sous-somme. Étant donné cette interprétation par des applications linéaires et des sommes directes, il existe un genre spécial de matrice par bloc pour les matrices carrées (où m=n). Dans ce cas, on peut postuler une interprétation de ce type de matrice comme un endomorphisme d'un espace de dimension n V ; la structure par bloc dans lesquels les blocs sont disposés en lignes et colonnes est importante car elle correspond à obtenir une décomposition en somme directe simple (au lieu de deux) sur V. Dans ce cas, par exemple, les blocs diagonaux les plus évidents sont tous carrés. Ce type de structure est nécessaire pour la description de la réduction de Jordan.

Cette technique est utilisée pour alléger les calculs sur les matrices, les développements en colonnes et lignes, et autres applications en informatique, y compris la conception de puce d'intégration à très grande échelle. L'algorithme de Strassen pour des produits matriciels rapides, comme le code de Hamming (7,4) pour la détection d'erreur et la récupération de données dans les transmissions de données.

Elle est utilisée en sciences sociales en analyse des réseaux sociaux et en analyse de similitudes pour la détection des interactions corrélatives[3].

Notes et références

(en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Block matrix » (voir la liste des auteurs).

D'après H. Ikramov (trad. V. Polonski), Recueil de problèmes d'algèbre linéaire, Éditions Mir, 1977, « Opérateurs linéaires et matrices », p. 130.
Cf. Ciarlet 2001, p. 6.
Harrison C. White, Scott A. Boorman et Ronald L. Breiger, « Social Structure from Multiple Networks. I. Blockmodels of Roles and Positions », American Journal of Sociology, vol. 81, n^o 4,‎ janvier 1976, p. 730–780 (ISSN 0002-9602 et 1537-5390, DOI 10.1086/226141, lire en ligne, consulté le 21 novembre 2018)

Voir aussi

Article connexe

Déterminant par blocs

Bibliographie

Philippe Ciarlet, Introduction à l'analyse numérique matricielle et à l'optimisation, Masson, coll. « Mathématiques appliquées pour la maîtrise », 2001 (1^re éd. 1985) (ISBN 2-225-68893-1)

Portail de l’algèbre

Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.

[Ikramov-1] D'après H. Ikramov (trad. V. Polonski), Recueil de problèmes d'algèbre linéaire, Éditions Mir, 1977, « Opérateurs linéaires et matrices », p. 130.

[2] Cf. Ciarlet 2001, p. 6.

[3] Harrison C. White, Scott A. Boorman et Ronald L. Breiger, « Social Structure from Multiple Networks. I. Blockmodels of Roles and Positions », American Journal of Sociology, vol. 81, n^o 4,‎ janvier 1976, p. 730–780 (ISSN 0002-9602 et 1537-5390, DOI 10.1086/226141, lire en ligne, consulté le 21 novembre 2018)