Théorème min-max de Courant-Fischer

Page d’aide sur l’homonymie

Pour les articles homonymes, voir Théorème min-max.

En algèbre linéaire et en analyse fonctionnelle, le théorème min-max de Courant[1]-Fischer[2] donne une caractérisation variationnelle des valeurs propres d'une matrice hermitienne. Il permet donc de caractériser les valeurs singulières d'une matrice complexe quelconque. Il s'étend aux opérateurs compacts autoadjoints sur un espace de Hilbert, ainsi qu'aux opérateurs autoadjoints bornés inférieurement.

Énoncé

Soit A une matrice hermitienne n × n, de valeurs propres λ1 ≥ … ≥ λn (répétées selon leur multiplicité). Notons, pour tout k de 1 à n, Gk l'ensemble des sous-espaces vectoriels de dimension k de ℂn et pour tout vecteur x non nul, R(A, x) le quotient de Rayleigh Ax, x/x, x, où 〈∙, ∙〉 désigne le produit scalaire hermitien canonique. Alors,

λ k = max V G k min x V x 0 R ( A , x ) = min W G n k + 1 max y W y 0 R ( A , y ) {\displaystyle \lambda _{k}=\max _{V\in G_{k}}\min _{x\in V \atop x\neq 0}R(A,x)=\min _{W\in G_{n-k+1}}\max _{y\in W \atop y\neq 0}R(A,y)}

ou encore, par homogénéité :

λ k = max V G k min x V x = 1 A x , x = min W G n k + 1 max y W y = 1 A y , y . {\displaystyle \lambda _{k}=\max _{V\in G_{k}}\min _{x\in V \atop \|x\|=1}\langle Ax,x\rangle =\min _{W\in G_{n-k+1}}\max _{y\in W \atop \|y\|=1}\langle Ay,y\rangle .}

Si A est de plus réelle (donc symétrique), on a les mêmes égalités en remplaçant Gk par l'ensemble des sous-espaces de dimension k de ℝn[3].

Démonstration

Comme A est normale, il existe une base orthonormée (u1, … , un) formée de vecteurs propres pour A, associés (dans cet ordre) aux λi.

D'après la formule de Grassmann, tout sous-espace V de dimension k contient au moins un vecteur unitaire du sous-espace engendré par (uk, … , un). Un tel vecteur s'écrit

x = i = k n x i u i a v e c | x i | 2 = 1 {\displaystyle x=\sum _{i=k}^{n}x_{i}u_{i}\quad {\rm {avec}}\quad \sum |x_{i}|^{2}=1}

donc vérifie

A x , x = i = k n λ i | x i | 2 λ k , {\displaystyle \langle Ax,x\rangle =\sum _{i=k}^{n}\lambda _{i}|x_{i}|^{2}\leq \lambda _{k},}

ce qui prouve que

min x V x = 1 A x , x λ k {\displaystyle \min _{x\in V \atop \|x\|=1}\langle Ax,x\rangle \leq \lambda _{k}}

(il s'agit bien d'un minimum car la borne inférieure est atteinte, par compacité et continuité).

Pour V égal au sous-espace engendré par (u1, … , uk), ce minimum est atteint pour x = uk et est égal au majorant λk, ce qui achève la preuve de la première égalité. La seconde se démontre de même, ou se déduit de la première appliquée à A.

Applications

Caractérisation des valeurs singulières

Soit M une matrice complexe m × n avec nm. Les valeurs singulières σ1 ≥ … ≥ σn de M sont les racines carrées des valeurs propres de la matrice positive M*M. Un corollaire immédiat du théorème de Courant-Fischer est donc[4] :

σ k = max V G k min x V x = 1 M x = min W G n k + 1 max y W y = 1 M y . {\displaystyle \sigma _{k}=\max _{V\in G_{k}}\min _{x\in V \atop \|x\|=1}\|Mx\|=\min _{W\in G_{n-k+1}}\max _{y\in W \atop \|y\|=1}\|My\|.}

Théorème d'entrelacement de Cauchy

Articles détaillés : Théorème de séparation de Poincaré (en) et Inégalité de Weyl.

Soient A une matrice hermitienne n × n et B une matrice m × m déduite de A par compression (en) (B = P*AP, où P est une matrice n × m telle que P*P = Im). Alors, les valeurs propres α1 ≥ … ≥ αn de A et β1 ≥ … ≥ βm de B vérifient[5] : pour tout km,

α k β k α n m + k . {\displaystyle \alpha _{k}\geq \beta _{k}\geq \alpha _{n-m+k}.}
Démonstration

Soit (b1, …, bm) une base orthonormée de ℂm formée de vecteurs propres pour B, associés (dans cet ordre) aux βj et soit Vk le sous-espace engendré par (b1, …, bk). D'après la démonstration ci-dessus,

β k = min z V k z = 1 P A P z , z = min z V k z = 1 A P z , P z = min x P ( V k ) x = 1 A x , x max V G k min x V x = 1 A x , x = α k , {\displaystyle \beta _{k}=\min _{z\in V_{k} \atop \|z\|=1}\langle P^{*}APz,z\rangle =\min _{z\in V_{k} \atop \|z\|=1}\langle APz,Pz\rangle =\min _{x\in P(V_{k}) \atop \|x\|=1}\langle Ax,x\rangle \leq \max _{V\in G_{k}}\min _{x\in V \atop \|x\|=1}\langle Ax,x\rangle =\alpha _{k},}

ce qui démontre la première inégalité. La seconde se démontre de même, ou se déduit de la première appliquée à A et B.

En particulier si m = n − 1 alors[6] α1β1α2 ≥ … ≥ βn–1αn, d'où le nom d'entrelacement.

Opérateurs compacts

Soit H un espace de Hilbert. Tout opérateur autoadjoint sur H se décompose canoniquement en la différence de deux opérateurs positifs (en) de produit nul (par calcul fonctionnel continu, en lui appliquant les fonctions partie positive et partie négative).

Soit A un opérateur compact positif sur H. Ses valeurs propres non nulles sont de multiplicité finie et forment une suite décroissante λ1λ2 ≥ … et l'on a encore (en notant Gk l'ensemble des sous-espaces vectoriels de dimension k de H)[7] :

λ k = max V G k min x V x = 1 A x , x = min U G k 1 max y U y = 1 A y , y . {\displaystyle \lambda _{k}=\max _{V\in G_{k}}\min _{x\in V \atop \|x\|=1}\langle Ax,x\rangle =\min _{U\in G_{k-1}}\max _{y\in U^{\bot } \atop \|y\|=1}\langle Ay,y\rangle .}
Démonstration

Comme A est normal, il existe une suite orthonormée (u1, u2, …) de vecteurs propres associés aux λi. Notons N l'adhérence du sous-espace engendré par (uk, uk+1, …). La codimension de N est k − 1 donc pour tout sous-espace V de H de dimension k, k dim ( V N ) = dim ( V / ( V N ) ) = dim ( ( V + N ) / N ) dim ( H / N ) = k 1 {\displaystyle k-\dim(V\cap N)=\dim(V/(V\cap N))=\dim((V+N)/N)\leq \dim(H/N)=k-1} (d'après le deuxième théorème d'isomorphisme, adapté aux espaces vectoriels). Par conséquent, V contient au moins un vecteur unitaire de N.

La fin de la preuve de la première égalité est identique à celle du § « Démonstration », en remplaçant la somme finie (de k à n) par une série (de k à l'infini).

Pour la seconde, notons V le sous-espace engendré par (u1, … , uk) et U un sous-espace de H de dimension k − 1. Son orthogonal N est alors de codimension k − 1 donc, par le même raisonnement que ci-dessus, il contient au moins un vecteur unitaire y de V. De la même façon que pour la première égalité, on en déduit que λ k max y U y = 1 A y , y , {\displaystyle \lambda _{k}\leq \max _{y\in U^{\bot } \atop \|y\|=1}\langle Ay,y\rangle ,} puis on conclut en considérant le sous-espace U particulier engendré par (u1, … , uk−1) et le vecteur y = uk.

Notes et références

(en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Min-max theorem » (voir la liste des auteurs).
  1. (de) Ernst Fischer, « Über quadratische Formen mit reellen Koeffizienten », Monatshefte für Mathematik und Physik, vol. 16,‎ , p. 234-249.
  2. (de) Richard Courant, « Über die Eigenwerte bei den Differentialgleichungen der mathematischen Physik », Math. Z., vol. 7, nos 1-4,‎ , p. 1-57.
  3. Alain Yger et Jacques-Arthur Weil, Mathématiques appliquées L3, Pearson Education France, (ISBN 978-2-74407352-6, lire en ligne), p. 70.
  4. (en) Carl D. Meyer, Matrix Analysis and Applied Linear Algebra, SIAM, (lire en ligne), p. 555.
  5. (en) Rajendra Bhatia (en), Matrix Analysis, Springer, coll. « GTM » (no 169), (lire en ligne), p. 59-60.
  6. Pour une autre preuve dans ce cas, voir (en) Steve Fisk, « A very short proof of Cauchy's interlace theorem for eigenvalues of Hermitian matrices », Amer. Math. Monthly, vol. 112, no 2,‎ , p. 118 (arXiv math/0502408).
  7. (en) D. H. Griffel, Applied Functional Analysis, Dover, (1re éd. 1981) (lire en ligne), p. 287 ne mentionne que la seconde expression.

Voir aussi

Articles connexes

Bibliographie

  • (en) M. Reed (en) et B. Simon, Methods of Modern Mathematical Physics IV: Analysis of Operators, Academic Press, 1977
  • (en) Elliott H. Lieb et Michael Loss (en), Analysis, AMS, coll. « GSM » (no 14), , 2e éd. (1re éd. 1997) (lire en ligne)
  • (en) Gerald Teschl, Mathematical Methods in Quantum Mechanics, AMS, coll. « GSM » (no 99), (lire en ligne)
  • icône décorative Portail de l'analyse