實對稱矩陣\(A\)正交相似于對角矩陣,或正交合同于對角矩陣,稱為主軸定理,其含義是\(A\)所對應的二次型\(x^TAx\)經正交變換\(x=Qy\)化為對稱軸與坐標軸重合的二次型\(y^T\Lambda y\), 即將二次型化為標準形. 該定理在解決二次型相關問題時能發揮重要作用.

例1\(A\)是對稱正定矩陣,求證\(x^TAx+y^TA^{-1}y\geqslant 2x^Ty\), 其中\(x,y\)\(n\)維列向量.

證明 由于\(A\)對稱,所以存在正交矩陣\(Q\)使得

\[A=Q^T\Lambda Q, \quad A^{-1}=Q^T\Lambda^{-1} Q \]

其中\(\Lambda=\mbox{diag}(\lambda_1,\lambda_2,\cdots,\lambda_n)\). 令

\[\bar{x}=Qx=(x_1,x_2,\cdots,x_n)^T, \bar{y}=Qy=(y_1,y_2,\cdots,y_n)^T, \]

\[\begin{aligned} x^TAx+y^TA^{-1}y =& x^TQ^T\Lambda Qx+y^TQ^T\Lambda^{-1}Qy\\ =&\bar{x}^T\Lambda\bar{x}+ \bar{y}^T\Lambda^{-1}\bar{y}\\ =&\sum_{i=1}^n\left( \lambda_ix_i^2+\frac{1}{\lambda_i}y_i^2\right)\\ \geqslant &\sum_{i=1}^n2x_iy_i=2\bar{x}^T\bar{y}=2x^Ty. \end{aligned} \]

例2\(A\)\(n\)階實對稱矩陣,

(1)若\(\lambda_1\leqslant \lambda_2\leqslant\cdots\leqslant\lambda_n\)\(A\)的全部特征值, 則$$\forall X\in \mathbb{R}^n, \quad \lambda_1X^TX\leqslant X^TAX\leqslant \lambda_n X^TX.$$

(2)\(\exists c\in \mathbb{R}^+\) 使得\(\forall X\in \mathbb{R}^n\), \(X^TAX\leqslant cX^TX\).

(3) \(\forall \lambda=\lambda_i\), \(\exists \xi=(c_1,c_2,\ldots,c_n)^T\ne 0\) 使得\(f(\xi)=\lambda\xi^T\xi\).

證明 存在正交矩陣\(Q\), 使得

\[Q^TAQ=Q^{-1}AQ=\mbox{diag}(\lambda_1,\lambda_2,\ldots,\lambda_n). \]

(1) 對\(\forall X\in \mathbb{R}^n\), \(Y=Q^TX\). 則\(Y^TY=y_1^2+y_2^2+\cdots+y_n^2\). 所以

\[\lambda_1X^TX=\lambda_1Y^TY\leqslant f(X) =\lambda_1y_1^2+\lambda_2y_2^2+\cdots+\lambda_ny_n^2\leqslant \lambda_nY^TY=\lambda_nX^TX. \]

(2) 取\(c>\max{|\lambda_1|,|\lambda_2|,\ldots,|\lambda_n|}\), 則對\(\forall X\in \mathbb{R}^n\),

\[\begin{array}{ll} f(X)& =\lambda_1y_1^2+\lambda_2y_2^2+\cdots+\lambda_ny_n^2\\ &<c Y^TY=c(Q^{T}X)^T(Q^{T}X)=cX^T(Q^T)^{T}Q^{T}X=cX^TX \end{array} \]

(3) 取\(\varepsilon_i=(0,\ldots,0,1,0\ldots,0), \xi=Q\varepsilon_i\), 則
\(f(\xi)=g(\varepsilon_i)=\lambda_i\varepsilon^T_i\varepsilon_i=\lambda\xi^T\xi\).

(證法二) 設\(\xi\)是屬于特征值\(\lambda\)的特征向量, 則
\(A\xi=\lambda\xi\), 從而

\[f(\xi)=\xi^TA^T\xi=\lambda\xi^T\xi. \]

例3\(A=(a_{ij})\)\(n\)階實對稱矩陣, \(\lambda_1\leqslant\lambda_2\leqslant\cdots\leqslant \lambda_n\)是它的全部特征值. 證明

\[\lambda_1\leqslant a_{ii}\leqslant \lambda_n,\; i=1,2,\cdots,n. \]

證明 由于\(\varepsilon_i^TA\varepsilon_i=a_{ii}\), 且\(\varepsilon_i^T\varepsilon_i=1\), 所以由上題得到
\(\lambda_1\leqslant a_{ii}\leqslant \lambda_n\).

例4\(A\)是秩為\(r\)的復對稱矩陣, 證明\(A\)可分解為\(r\)個秩為\(1\)的對稱矩陣之和.

證明 存在可逆矩陣\(C\)使得

\[C^TAC=\left(\begin{array}{cc} E_r&O\\ O&O\end{array}\right). \]

所以

\[A=(C^{-1})^T\left(\begin{array}{cc} E_r&O\\ O&O\end{array}\right) C^{-1}=\sum_{i=1}^r(C^{-1})^TE_{ii}(C^{-1}), \]

其中, \((C^{-1})^TE_{ii}(C^{-1})\)是對稱矩陣, 且\(\r((C^{-1})^TE_{ii}(C^{-1}))=1\), \(i=1,2,\cdots,r.\)

例5\(A\)是秩為\(r\)的復對稱矩陣, 證明\(A\)可分解為\(A=B^TB\), 其中\(B\)是秩為\(r\)\(n\)階方陣.

證明 存在可逆矩陣\(C\)使得

\[C^TAC=\left(\begin{array}{cc} E_r&O\\ O&O\end{array}\right). \]

所以

\[A=(C^{-1})^T\left(\begin{array}{cc} E_r&O\\ O&O\end{array}\right) C^{-1}, \]

\(B=\left(\begin{array}{cc} E_r&O\\ O&O\end{array}\right) C^{-1}\), 則\(B\)是秩\(\r(B)=r\)\(n\)階方陣, 且\(A=B^TB\).

例6\(f(x_1,x_2,\ldots,x_n)=X^TAX\)是一實二次型, 存在\(n\) 維實向量\(X_1,X_2\), 使得\(X^T_1AX_1>0, X^T_2AX_2<0\), 則存在\(n\) 維實向量\(X_0\), 使得\(X^T_0AX_0=0\).

證明 \(f\)可經非退化線性替換\(X=CY\)化為

\[g(Y)=y_1^2+\cdots+y_p^2-y_{p+1}^2-\cdots-y_r^2. \]

\(X^T_1AX_1>0, X^T_2AX_2<0\)\(p>0,q=r-p>0\). 所以可取

\[Y_0=(1,0,\ldots,0, 1,0\ldots,0,0,\ldots,0),\quad X_0=CY_0, \]

\(f(X_0)=g(Y_0)=0\).

例7\(n\)階矩陣\(A\)是實對稱矩陣,若\(A\)為半正定矩陣,則\(A^*\)也為半正定矩陣.

證明\({\rm r}(A)<n-1\), \(A^*=O\), 結論成立. 若\({\rm r}(A)=n-1\), 則存在可逆矩陣\(C\)使得

\[C^TAC=\begin{pmatrix} E_{n-1}&O\\ O&0 \end{pmatrix}. \]

兩邊求伴隨,且\((C^T)^*=(C^*)^T\), 由此得到

\[C^*A^*(C^*)^T= \begin{pmatrix} O_{(n-1)\times (n-1)}&O\\ O&1 \end{pmatrix}. \]

由此可得\(A^*\)的正慣性指數=秩=1,因此是半正定矩陣.

引理\(A=(a_{ij})\)\(n\)階實對稱半正定矩陣. 若\(a_{ii}=0\), 則\(a_{ij}\)所在的行、列上的元素全為零,即\(a_{ij}=a_{ji}=0\), \(j=1,2,\cdots,n.\)

證明[反證法]
假設存在某個\(a_{ij}\ne 0\), \(j\ne i\), 則考慮二階主子式

\[\begin{vmatrix} 0&a_{ij}\\ a_{ji}&a_{jj} \end{vmatrix}=-a_{ij}^2<0 \]

這與\(A\)是半正定矩陣矛盾!

例8[大連市競賽試題,2012]
\(A,B\)\(n\)階實對稱半正定矩陣,求證:存在實可逆矩陣\(Q\)使得\(Q^TAQ,Q^TBQ\)同時為對角矩陣.

證明 由于\(A,B\)是半正定矩陣,所以存在實可逆矩陣\(C\)使得

\[C^T(A+B)C=\begin{pmatrix}E_r&O\\O&O \end{pmatrix} \]

由于\(C^TAC,C^TBC\)均為半正定矩陣,所以\(C^TAC\)的后\(n-r\)個對角元都為\(0\), 即

\[C^TAC=\begin{pmatrix}H_r&O\\O&O \end{pmatrix} \]

其中\(H_r\)\(r\)階實對稱矩陣. 因此存在正交矩陣\(P_1\)使得\(P_1^TH_rP_1=\mbox{diag}(d_1,d_2,\cdots,d_r)=D_r\). 令

\[P=\begin{pmatrix}P_1&O\\O&E_{n-r} \end{pmatrix},\quad Q=CP \]

\[\begin{array}{l} Q^TAQ=P^T(C^TAC)P= \begin{pmatrix}P_1&O\\O&E_{n-r} \end{pmatrix}^T \begin{pmatrix}H_r&O\\O&O \end{pmatrix} \begin{pmatrix}P_1&O\\O&E_{n-r} \end{pmatrix}= \begin{pmatrix}D_r&O\\O&O \end{pmatrix}\\ Q^T(A+B)Q= \begin{pmatrix}P_1&O\\O&E_{n-r} \end{pmatrix}^T \begin{pmatrix}E_r&O\\O&O \end{pmatrix} \begin{pmatrix}P_1&O\\O&E_{n-r} \end{pmatrix}= \begin{pmatrix}E_r&O\\O&O \end{pmatrix} \end{array} \]

因此

\[Q^TBQ=Q^T(A+B)Q-Q^TAQ=\mbox{diag}(1-d_1,1-d_2,\cdots,1-d_r,0,\cdots,0) \]

也為對角矩陣.

練習[1、全國競賽試題,2010]
\(A,B\)\(n\)階實對稱半正定矩陣,且滿足\(n-1\leqslant \r(A)\leqslant n\). 求證:存在實可逆矩陣\(Q\)使得\(Q^TAQ,Q^TBQ\)同時為對角矩陣.

2、若\(A,B\)為實對稱矩陣,且\(A\)為正定矩陣,則\(A,B\)可同時合同于對角矩陣,即存在可逆矩陣\(P\)使得\(P^TAP, P^TBP\)為對角矩陣.

由實對稱矩陣\(A\)的合同標準形,利用\(A\)\(B\)的交換性(\(AB=BA\))或反交換性(\(AB=-BA\)), 聯合分塊矩陣的技巧,可以達到解決問題的目的.

例9[華南理工大學2010,四川師范大學2016] 設\(A,B\)\(n\)階實對稱矩陣,證明:存在正交矩陣\(Q\)使得\(Q^TAQ\)\(Q^TBQ\)同時為對角矩陣當且僅當\(AB=BA\).

證明 必要性:由\((Q^TAQ)(Q^TBQ)=(Q^TBQ)(Q^TAQ)\)\(AB=BA\).

充分性:由于\(A\)是實對稱矩陣,所以存在正交矩陣\(P\)使得

\[P^TAP=\mbox{diag}(\lambda_1E_{n_1},\lambda_2 E_{n_2},\cdots,\lambda_sE_{n_s}). \]

其中\(\lambda_1,\lambda_2,\cdots,\lambda_s\)\(A\)的互異特征值. 由\(AB=BA\)

\[(P^TTAP)(P^TBP)=(P^TBP)(P^TAP) \]

\(P^TBP\)作相應分塊\(P^TBP=(B_{ij})_{s\times s}\), 代入上式得

\[\begin{aligned} &\begin{pmatrix} \lambda_1E_{n_1}&&&\\ &\lambda_2E_{n_2}&&\\ &&\ddots&\\ &&&\lambda_sE_{n_s} \end{pmatrix} \begin{pmatrix} B_{11}&B_{12}&\cdots&B_{1s}\\ B_{21}&B_{22}&\cdots&B_{2s}\\ \vdots&\vdots&&\vdots\\ B_{s1}&B_{s2}&\cdots&B_{s} \end{pmatrix}\\ =& \begin{pmatrix} B_{11}&B_{12}&\cdots&B_{1s}\\ B_{21}&B_{22}&\cdots&B_{2s}\\ \vdots&\vdots&&\vdots\\ B_{s1}&B_{s2}&\cdots&B_{s} \end{pmatrix} \begin{pmatrix} \lambda_1E_{n_1}&&&\\ &\lambda_2E_{n_2}&&\\ &&\ddots&\\ &&&\lambda_sE_{n_s} \end{pmatrix} \end{aligned} \]

兩邊分別做乘法,并比較對應的子塊,可得

\[P^TBP=\begin{pmatrix} B_{11}&&&\\ &B_{22}&&\\ &&\ddots&\\ &&&B_{ss} \end{pmatrix} \]

由于\(B\)是實對稱矩陣,所以\(B_i\)也是實對稱矩陣,\(i=1,2,\cdots,s\). 故存在正交矩陣\(P_i\)使得\(P_i^TB_{ii}P=\Lambda_i\), \(i=1,2,\cdots,s\). 令\(T=\mbox{diag}(P_1,P_2,\cdots,P_s)\), \(Q=PT\)為正交矩陣, \(Q^{-1}=Q^T\). 則

\[Q^{-1}BQ= \begin{pmatrix} \Lambda_1&&&\\ &\Lambda_2&&\\ &&\ddots&\\ &&&\Lambda_s \end{pmatrix},\; Q^{-1}AQ=\begin{pmatrix} \lambda_1E_{n_1}&&&\\ &\lambda_2E_{n_2}&&\\ &&\ddots&\\ &&&\lambda_sE_{n_s} \end{pmatrix}. \]

例10\(n\)階實對稱矩陣\(A_1,A_2,\cdots,A_m\)兩兩可交換,求證:存在正交矩陣\(P\), 使得\(P^TA_iP(1\leqslant i\leqslant m)\)都是對角矩陣.

證明\(\mathscr{A}_i\)是歐氏空間\(V\)上的線性變換使得\(\mathscr{A}_i\)\(V\)的標準正交基下的矩陣是\(A_i\), 對\(n\)用數學歸納法,證明存在由\(\mathscr{A}_1,\mathscr{A}_2, \cdots,\mathscr{A}_m\)的公共特征向量組成的標準正交基. 當\(n-1\)時結論成立,假設結論對\(n-1\)成立,考慮\(n\)的情形.

\(A_i(1\leqslant i\leqslant m)\)可交換知存在\(\mathscr{A}_i(1\leqslant i\leqslant m)\)的公共單位特征向量\(e_1\). 則\(W=e_1^{\bot}\)\(n-1\)\(\mathscr{A}_i(1\leqslant i\leqslant m)\)-不變子空間, 將\(\mathscr{A}_i(1\leqslant i\leqslant m)\)限制在\(W\)上,由歸納假設,存在\(W\)的一組由\(\mathscr{A}_i(1\leqslant i\leqslant m)\)的公共單位特征向量組成的標準正交基\(e_2,\cdots,e_n\). 因此,\(e_1,e_2,\cdots,e_n\)是所要求的標準正交基, 且\(\mathscr{A}_i(1\leqslant i\leqslant m)\)在這組記下的矩陣為對角矩陣.

例11\(A,B\)\(n\)階實矩陣,\(A\)半正定,且\(AB+BA=O\). 求證: \(AB=BA=O\).

證明 因為\(A\)半正定,則存在正交矩陣\(Q\)使得

\[Q^TAQ=\begin{pmatrix} \lambda_1&&&&&\\ &\ddots&&&&\\ &&\lambda_r&&&\\ &&&0&&\\ &&&&\ddots&\\ &&&&&0 \end{pmatrix} =\begin{pmatrix} A_1&O\\ O&O \end{pmatrix}, \]

其中\(A_1=\begin{pmatrix} \lambda_1&&\\ &\ddots&\\ &&\lambda_r \end{pmatrix}\), \(\lambda_1,\lambda_2,\cdots,\lambda_r\)\(A\)的非零特征值. 所以
\(A=Q\begin{pmatrix} A_1&O\\ O&O \end{pmatrix}Q^T\). 由\(AB+BA=O\)

\[Q\begin{pmatrix} A_1&O\\ O&O \end{pmatrix}Q^TB=BQ\begin{pmatrix} A_1&O\\ O&O \end{pmatrix}Q^T. \]

因此

\[\begin{pmatrix} A_1&O\\ O&O \end{pmatrix}(Q^TBQ)=(Q^TBQ)\begin{pmatrix} A_1&O\\ O&O \end{pmatrix}. \]

\(Q^TBQ=\begin{pmatrix} C_1&C_2\\ C_3&C_4 \end{pmatrix}\), 則

\[\begin{pmatrix} A_1&O\\ O&O \end{pmatrix}\begin{pmatrix} C_1&C_2\\ C_3&C_4 \end{pmatrix}=\begin{pmatrix} C_1&C_2\\ C_3&C_4 \end{pmatrix}\begin{pmatrix} A_1&O\\ O&O \end{pmatrix}. \]

由此得\(\begin{pmatrix} A_1C_1&A_1C_2\\ O&O \end{pmatrix}=-\begin{pmatrix} C_1A_1&O\\ C_3A_1&O \end{pmatrix}\), 從而\(A_1C_1=-C_1A_1\), \(A_1C_2=O\), \(C_3A_1=O\). 由此可得\(C_1=C_2=C_3=O\). 從而\(B=Q\begin{pmatrix} O&O\\ O&C_4 \end{pmatrix}Q^T\). 故

\[AB=Q\begin{pmatrix} A_1&O\\ O&O \end{pmatrix}Q^TQ\begin{pmatrix} O&O\\ O&C_4 \end{pmatrix}Q^T =Q\begin{pmatrix} A_1&O\\ O&O \end{pmatrix}\begin{pmatrix} O&O\\ O&C_4 \end{pmatrix}Q^T=O. \]

于是\(BA=-AB=O\).

若一個命題涉及到兩個矩陣\(A,B\), 且滿足可同時合同于對角矩陣,則常常需要將這兩個矩陣同時合同于對角矩陣或分解為\(A=P^T\Lambda_1P, B=P^T\Lambda_2P\) (其中\(P\)為可逆矩陣,\(\Lambda_i\)為對角矩陣)來解決.

例12\(A,B\)\(n\)階實對稱矩陣且\(B\)正定,求證:

(1) \(|\lambda B-A|=0\)的根全為實數;

(2) 設\(|\lambda B-A|=0\)的根為\(\mu_1\leqslant \mu_2\leqslant \cdots\leqslant \mu_n\), 求\(x^TAx\)在約束條件\(x^TBx=1\)下的最大與最小值分別為\(\mu_1\)\(\mu_n\).

證明 (1)由題設知存在存在可逆矩陣\(P\)使得

\[P^BP=E,\; P^TAP=\mbox{diag}(\mu_1,\mu_2,\cdots,\mu_n), \; \mu_i\in\mathbb{R}. \]

所以

\[0=|\lambda B-A|=|P^T(\lambda B-A)P|= (\lambda-\mu_1)(\lambda-\mu_2)\cdots (\lambda-\mu_n). \]

結論得證.

(2) 令\(x=Py\), 由\(x^TBx=1\)

\[y^Ty=(P^{-1}x)^T(P^{-1}x)=x^T(P^T)^{-1}EP^{-1}x=x^T(P^T)^{-1}P^TBPP^{-1}x=x^TBx=1 \]

所以

\[x^TAx=x^T(P^T)^{-1}P^TAPP^{-1}x=y^T\mbox{diag}(\mu_1,\mu_2,\cdots,\mu_n)y =\mu_1y_1^2+\nu_2y_2^2+\cdots+\mu_ny_n^2. \]

于是

\[\mu_1\leqslant x^TAx\leqslant \mu_n. \]

例13\(A\)\(n\)階對稱正定矩陣,\(x\in \mathbb{R}^n\), 證明:\(0\leqslant x^T(A+xx^T)^{-1}x<1\).

證明\(x=0\)顯然,下設\(x\ne 0\). 由題設知存在可逆矩陣\(Q\)使得

\[A=P^TEP,\; xx^T=P^T\mbox{diag}(b,0,\cdots,0)P,\; b>0. \]

\((A+xx^T)^{-1}=P^{-1}D(P^T)^{-1}\), 其中\(D=\mbox{diag}(\frac{1}{1+b}, 1,\cdots,1)\). 令\(x=P^Ty\),, 則\(\mbox{diag}(b,0,\cdots,0)=(P^T)^{-1}xx^TP^{-1}=y^Ty\), 所以可設\(y_1^2=b, y_2^2=\cdots=y_n^2=0\). 從而

\[x^T(A+xx^T)^{-1}x=x^TP^{-1}D(P^T)^{-1}x=y^TDy=\frac{1}{1+b}y_1^2+y_2^2+\cdots+y_n^2=\frac{b}{1+b}. \]

\[0<x^T(A+xx^T)^{-1}x<1. \]

例14\(A,B\)\(n\)階正定矩陣,求證:

\[\frac{2^{n+1}}{|A+B|}\leqslant \frac{1}{|A|}+ \frac{1}{|B|}. \]

證明 由題設知存在可逆矩陣\(P\)使得

\[A=P^TEP,\quad B=P^T\mbox{diag}(\lambda_1,\lambda_2,\cdots,\lambda_n)P,\; \lambda_i\geqslant 0(1\leqslant i\leqslant n) \]

從而

\[|A+B|=|P|^2\prod_{i=1}^n(1+\lambda_i), \; |A|=|P|^2,\; |B|=|P|^2\lambda_1\lambda_2\cdots\lambda_n. \]

從而只需證明

\[\frac{2^{n+1}}{\prod_{i=1}^n(1+\lambda_i)}\leqslant 1+\frac{1}{\lambda_1\lambda_2\cdots\lambda_n}. \]

由于\(1+\lambda_i\geqslant 2\sqrt{\lambda_i}\), 所以式\ref{Inequal}變為
\(\frac{2}{\sqrt{\lambda_1\lambda_2\cdots\lambda_n}}\leqslant 1+\frac{1}{\lambda_1\lambda_2\cdots\lambda_n}\), 即\(\frac{2}{\sqrt{y}}\leqslant 1+\frac{1}{y}\), 其中\(y=\lambda_1\lambda_2\cdots\lambda_n\). 即只需證明\(2y\leqslant (1+y)\sqrt{y}\), 也即\(4y^2\leqslant (1+y)^2y\), 或\(4y\leqslant (1+y)^2\). 這顯然成立.