实对称矩阵实对称矩阵的定义对称矩阵的定义定义:如果矩阵 AAA 满足 AT=AA^T = AAT=A,则称 AAA 为对称矩阵。
实对称矩阵的定义定义:如果矩阵 AAA 是实矩阵且满足 AT=AA^T = AAT=A,则称 AAA 为实对称矩阵。
例子例 1:矩阵 A=(1223)A = \begin{pmatrix} 1 & 2 \\ 2 & 3 \end{pmatrix}A=(1223) 是实对称矩阵,因为 AT=AA^T = AAT=A。
实对称矩阵的性质基本性质性质 1:实对称矩阵的特征值都是实数。
性质 2:实对称矩阵对应于不同特征值的特征向量正交。
性质 3:实对称矩阵可以对角化。
性质 4:实对称矩阵可以正交对角化。
性质 1 的证明证明:设 AAA 是实对称矩阵,λ\lambdaλ 是其特征值,x⃗\vec{x}x是对应的特征向量。
Ax⃗=λx⃗A\vec{x} = \lambda\vec{x}Ax=λx
两边取共轭转置: x⃗∗AT=λ∗x⃗∗\vec{x}^*A^T = \lambda^*\vec{x}^*x∗AT=λ∗x∗
由于 AAA 是实对称矩阵,AT=AA^T = AAT=A,所以: x⃗∗A=λ∗x⃗∗\vec{x}^*A = \lambda^*\vec{x}^*x∗A=λ∗x∗
两边右乘 x⃗\vec{x}x: x⃗∗Ax⃗=λ∗x⃗∗x⃗\vec{x}^*A\vec{x} = \lambda^*\vec{x}^*\vec{x}x∗Ax=λ∗x∗x
左边:x⃗∗Ax⃗=x⃗∗λx⃗=λx⃗∗x⃗\vec{x}^*A\vec{x} = \vec{x}^*\lambda\vec{x} = \lambda\vec{x}^*\vec{x}x∗Ax=x∗λx=λx∗x
所以:λx⃗∗x⃗=λ∗x⃗∗x⃗\lambda\vec{x}^*\vec{x} = \lambda^*\vec{x}^*\vec{x}λx∗x=λ∗x∗x
由于 x⃗≠0⃗\vec{x} \neq \vec{0}x=0,所以 x⃗∗x⃗>0\vec{x}^*\vec{x} > 0x∗x>0,因此 λ=λ∗\lambda = \lambda^*λ=λ∗,即 λ\lambdaλ 是实数。
性质 2 的证明证明:设 λ1≠λ2\lambda_1 \neq \lambda_2λ1=λ2 是实对称矩阵 AAA 的两个不同特征值,x⃗1,x⃗2\vec{x}_1, \vec{x}_2x1,x2 是对应的特征向量。
Ax⃗1=λ1x⃗1A\vec{x}_1 = \lambda_1\vec{x}_1Ax1=λ1x1 Ax⃗2=λ2x⃗2A\vec{x}_2 = \lambda_2\vec{x}_2Ax2=λ2x2
第一个等式两边左乘 x⃗2T\vec{x}_2^Tx2T: x⃗2TAx⃗1=λ1x⃗2Tx⃗1\vec{x}_2^TA\vec{x}_1 = \lambda_1\vec{x}_2^T\vec{x}_1x2TAx1=λ1x2Tx1
由于 AAA 是对称矩阵: x⃗2TAx⃗1=x⃗2TATx⃗1=(Ax⃗2)Tx⃗1=λ2x⃗2Tx⃗1\vec{x}_2^TA\vec{x}_1 = \vec{x}_2^TA^T\vec{x}_1 = (A\vec{x}_2)^T\vec{x}_1 = \lambda_2\vec{x}_2^T\vec{x}_1x2TAx1=x2TATx1=(Ax2)Tx1=λ2x2Tx1
所以:λ1x⃗2Tx⃗1=λ2x⃗2Tx⃗1\lambda_1\vec{x}_2^T\vec{x}_1 = \lambda_2\vec{x}_2^T\vec{x}_1λ1x2Tx1=λ2x2Tx1
由于 λ1≠λ2\lambda_1 \neq \lambda_2λ1=λ2,所以 x⃗2Tx⃗1=0\vec{x}_2^T\vec{x}_1 = 0x2Tx1=0,即 x⃗1\vec{x}_1x1 与 x⃗2\vec{x}_2x2 正交。
正交对角化正交对角化的定义定义:如果存在正交矩阵 QQQ 和对角矩阵 DDD,使得: A=QDQTA = QDQ^TA=QDQT
则称矩阵 AAA 可正交对角化。
正交对角化的条件定理:实对称矩阵可以正交对角化。
证明:
实对称矩阵可以对角化实对称矩阵的特征向量可以正交化因此可以正交对角化正交对角化的步骤步骤:
求特征值:解特征方程 ∣A−λI∣=0|A - \lambda I| = 0∣A−λI∣=0求特征向量:对每个特征值,求对应的特征向量正交化:对重特征值对应的特征向量进行施密特正交化单位化:将所有特征向量单位化构造矩阵:QQQ 由单位化特征向量组成,DDD 由特征值组成例子例 2:求矩阵 A=(2112)A = \begin{pmatrix} 2 & 1 \\ 1 & 2 \end{pmatrix}A=(2112) 的正交对角化形式。
解:
特征方程:∣A−λI∣=λ2−4λ+3=0|A - \lambda I| = \lambda^2 - 4\lambda + 3 = 0∣A−λI∣=λ2−4λ+3=0特征值:λ1=1\lambda_1 = 1λ1=1,λ2=3\lambda_2 = 3λ2=3特征向量:λ1=1\lambda_1 = 1λ1=1:x⃗1=(1,−1)\vec{x}_1 = (1, -1)x1=(1,−1)λ2=3\lambda_2 = 3λ2=3:x⃗2=(1,1)\vec{x}_2 = (1, 1)x2=(1,1)单位化:q⃗1=12(1,−1)\vec{q}_1 = \frac{1}{\sqrt{2}}(1, -1)q1=21(1,−1)q⃗2=12(1,1)\vec{q}_2 = \frac{1}{\sqrt{2}}(1, 1)q2=21(1,1)构造矩阵:Q=12(11−11)Q = \frac{1}{\sqrt{2}}\begin{pmatrix} 1 & 1 \\ -1 & 1 \end{pmatrix}Q=21(1−111)D=(1003)D = \begin{pmatrix} 1 & 0 \\ 0 & 3 \end{pmatrix}D=(1003)正交对角化形式:A=QDQTA = QDQ^TA=QDQT谱定理谱定理的表述定理(谱定理):设 AAA 是 nnn 阶实对称矩阵,则存在正交矩阵 QQQ 和对角矩阵 DDD,使得: A=QDQTA = QDQ^TA=QDQT
其中 DDD 的对角元素是 AAA 的特征值,QQQ 的列向量是 AAA 的对应于这些特征值的单位正交特征向量。
谱定理的应用应用 1:实对称矩阵的幂 An=QDnQTA^n = QD^nQ^TAn=QDnQT
应用 2:实对称矩阵的函数 f(A)=Qf(D)QTf(A) = Qf(D)Q^Tf(A)=Qf(D)QT
其中 f(D)=diag(f(λ1),f(λ2),…,f(λn))f(D) = \operatorname{diag}(f(\lambda_1), f(\lambda_2), \dots, f(\lambda_n))f(D)=diag(f(λ1),f(λ2),…,f(λn))。
正定矩阵正定矩阵的定义定义:设 AAA 是 nnn 阶实对称矩阵,如果对任意非零向量 x⃗\vec{x}x,都有: x⃗TAx⃗>0\vec{x}^TA\vec{x} > 0xTAx>0
则称 AAA 为正定矩阵。
正定矩阵的等价条件定理:设 AAA 是 nnn 阶实对称矩阵,则以下条件等价:
AAA 是正定矩阵AAA 的所有特征值都是正数AAA 的所有顺序主子式都是正数存在可逆矩阵 BBB,使得 A=BTBA = B^TBA=BTB例子例 3:判断矩阵 A=(2112)A = \begin{pmatrix} 2 & 1 \\ 1 & 2 \end{pmatrix}A=(2112) 是否为正定矩阵。
解:
特征值:λ1=1\lambda_1 = 1λ1=1,λ2=3\lambda_2 = 3λ2=3,都是正数顺序主子式:∣A1∣=2>0|A_1| = 2 > 0∣A1∣=2>0,∣A2∣=3>0|A_2| = 3 > 0∣A2∣=3>0所以 AAA 是正定矩阵练习题练习 1判断矩阵 A=(0110)A = \begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}A=(0110) 是否为实对称矩阵,并说明其特征值是否全为实数。
参考答案解题思路: 检查矩阵的对称性和特征值。
详细步骤:
检查对称性:AT=(0110)=AA^T = \begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix} = AAT=(0110)=A,所以是实对称矩阵求特征值:∣A−λI∣=λ2−1=0|A - \lambda I| = \lambda^2 - 1 = 0∣A−λI∣=λ2−1=0特征值:λ=1\lambda = 1λ=1 或 λ=−1\lambda = -1λ=−1,都是实数答案:是实对称矩阵,特征值全为实数
练习 2求矩阵 A=(3113)A = \begin{pmatrix} 3 & 1 \\ 1 & 3 \end{pmatrix}A=(3113) 的正交对角化形式。
参考答案解题思路: 按照正交对角化的步骤求解。
详细步骤:
特征方程:∣A−λI∣=(3−λ)2−1=λ2−6λ+8=0|A - \lambda I| = (3-\lambda)^2 - 1 = \lambda^2 - 6\lambda + 8 = 0∣A−λI∣=(3−λ)2−1=λ2−6λ+8=0特征值:λ1=2\lambda_1 = 2λ1=2,λ2=4\lambda_2 = 4λ2=4特征向量:λ1=2\lambda_1 = 2λ1=2:x⃗1=(1,−1)\vec{x}_1 = (1, -1)x1=(1,−1)λ2=4\lambda_2 = 4λ2=4:x⃗2=(1,1)\vec{x}_2 = (1, 1)x2=(1,1)单位化:q⃗1=12(1,−1)\vec{q}_1 = \frac{1}{\sqrt{2}}(1, -1)q1=21(1,−1)q⃗2=12(1,1)\vec{q}_2 = \frac{1}{\sqrt{2}}(1, 1)q2=21(1,1)构造矩阵:Q=12(11−11)Q = \frac{1}{\sqrt{2}}\begin{pmatrix} 1 & 1 \\ -1 & 1 \end{pmatrix}Q=21(1−111)D=(2004)D = \begin{pmatrix} 2 & 0 \\ 0 & 4 \end{pmatrix}D=(2004)正交对角化形式:A=QDQTA = QDQ^TA=QDQT答案:A=QDQTA = QDQ^TA=QDQT,其中 Q=12(11−11)Q = \frac{1}{\sqrt{2}}\begin{pmatrix} 1 & 1 \\ -1 & 1 \end{pmatrix}Q=21(1−111),D=(2004)D = \begin{pmatrix} 2 & 0 \\ 0 & 4 \end{pmatrix}D=(2004)
练习 3证明:实对称矩阵对应于不同特征值的特征向量正交。
参考答案解题思路: 利用实对称矩阵的性质证明。
详细步骤:
设 λ1≠λ2\lambda_1 \neq \lambda_2λ1=λ2 是实对称矩阵 AAA 的两个不同特征值设 x⃗1,x⃗2\vec{x}_1, \vec{x}_2x1,x2 是对应的特征向量Ax⃗1=λ1x⃗1A\vec{x}_1 = \lambda_1\vec{x}_1Ax1=λ1x1,Ax⃗2=λ2x⃗2A\vec{x}_2 = \lambda_2\vec{x}_2Ax2=λ2x2第一个等式两边左乘 x⃗2T\vec{x}_2^Tx2T:x⃗2TAx⃗1=λ1x⃗2Tx⃗1\vec{x}_2^TA\vec{x}_1 = \lambda_1\vec{x}_2^T\vec{x}_1x2TAx1=λ1x2Tx1由于 AAA 是对称矩阵:x⃗2TAx⃗1=x⃗2TATx⃗1=(Ax⃗2)Tx⃗1=λ2x⃗2Tx⃗1\vec{x}_2^TA\vec{x}_1 = \vec{x}_2^TA^T\vec{x}_1 = (A\vec{x}_2)^T\vec{x}_1 = \lambda_2\vec{x}_2^T\vec{x}_1x2TAx1=x2TATx1=(Ax2)Tx1=λ2x2Tx1所以:λ1x⃗2Tx⃗1=λ2x⃗2Tx⃗1\lambda_1\vec{x}_2^T\vec{x}_1 = \lambda_2\vec{x}_2^T\vec{x}_1λ1x2Tx1=λ2x2Tx1由于 λ1≠λ2\lambda_1 \neq \lambda_2λ1=λ2,所以 x⃗2Tx⃗1=0\vec{x}_2^T\vec{x}_1 = 0x2Tx1=0,即 x⃗1\vec{x}_1x1 与 x⃗2\vec{x}_2x2 正交答案:证明完成
练习 4判断矩阵 A=(2112)A = \begin{pmatrix} 2 & 1 \\ 1 & 2 \end{pmatrix}A=(2112) 是否为正定矩阵。
参考答案解题思路: 检查特征值或顺序主子式。
详细步骤:
方法一:求特征值特征方程:∣A−λI∣=λ2−4λ+3=0|A - \lambda I| = \lambda^2 - 4\lambda + 3 = 0∣A−λI∣=λ2−4λ+3=0特征值:λ1=1\lambda_1 = 1λ1=1,λ2=3\lambda_2 = 3λ2=3,都是正数方法二:检查顺序主子式∣A1∣=2>0|A_1| = 2 > 0∣A1∣=2>0∣A2∣=3>0|A_2| = 3 > 0∣A2∣=3>0答案:是正定矩阵
练习 5设 AAA 是实对称矩阵,证明:AAA 的特征值都是实数。
参考答案解题思路: 利用实对称矩阵的性质证明。
详细步骤:
设 λ\lambdaλ 是 AAA 的特征值,x⃗\vec{x}x是对应的特征向量Ax⃗=λx⃗A\vec{x} = \lambda\vec{x}Ax=λx两边取共轭转置:x⃗∗AT=λ∗x⃗∗\vec{x}^*A^T = \lambda^*\vec{x}^*x∗AT=λ∗x∗由于 AAA 是实对称矩阵,AT=AA^T = AAT=A,所以:x⃗∗A=λ∗x⃗∗\vec{x}^*A = \lambda^*\vec{x}^*x∗A=λ∗x∗两边右乘 x⃗\vec{x}x:x⃗∗Ax⃗=λ∗x⃗∗x⃗\vec{x}^*A\vec{x} = \lambda^*\vec{x}^*\vec{x}x∗Ax=λ∗x∗x左边:x⃗∗Ax⃗=x⃗∗λx⃗=λx⃗∗x⃗\vec{x}^*A\vec{x} = \vec{x}^*\lambda\vec{x} = \lambda\vec{x}^*\vec{x}x∗Ax=x∗λx=λx∗x所以:λx⃗∗x⃗=λ∗x⃗∗x⃗\lambda\vec{x}^*\vec{x} = \lambda^*\vec{x}^*\vec{x}λx∗x=λ∗x∗x由于 x⃗≠0⃗\vec{x} \neq \vec{0}x=0,所以 x⃗∗x⃗>0\vec{x}^*\vec{x} > 0x∗x>0,因此 λ=λ∗\lambda = \lambda^*λ=λ∗,即 λ\lambdaλ 是实数答案:证明完成