Skip to main content

Mục lục

Bài 23: ĐA THỨC ĐẶC TRƯNG

Trong mục này chúng ta sẽ khảo sát phương pháp tìm các giá trị riêng và xác định không gian riêng tương ứng của một tự đồng cấu của không gian hữu hạn chiều (cũng như là của một ma trận vuông) trên trường số $\mathbb{K}$. Dưới đây $V$ luôn là không gian véctơ $n$-chiều trên trường $\mathbb{K}$.

23.1. Đa thức đặc trưng

Một đặc trưng cơ bản cho giá trị riêng của một tự đồng cấu của $V$ được trình bày bởi tính chất sau.
$\textbf{Bổ đề 23.1.} \ $ Với $f\in \text{End}(V)$ và $\lambda\in \mathbb{K}$, các điều kiện sau là tương đương:
  1. $\lambda$ là giá trị riêng của $f$.
  2. $\text{det}(f-\lambda \text{id}_V) =0$.

$\textbf{Chứng minh.} \ $ Từ Bổ đề 22.15, ta thấy rằng $\lambda$ là giá trị riêng của $f$ khi và chỉ khi $\text{Ker}(f-\lambda \text{id}_V) \ne \set{\mathbf{0}}$. Vì $V$ là không gian véctơ hữu hạn chiều, nên điều kiện trên tương đương với $f-\lambda \text{id}_V$ không là đẳng cấu theo Hệ quả 17.15. Điều kiện cuối này tương đương với $\text{det}(f-\lambda \text{id}_V)=0$ bởi Hệ quả 21.20.

Nếu $S$ là một cơ sở của $V$ và $A=M_{S}(f)\in\text{Mat}_{n}(\mathbb{K})$, thì $\text{det}(f-\lambda \text{id}_V)=\text{det}(A-\lambda I_n)$. Từ bổ đề trên, việc tìm các giá trị riêng của $f$ (hay của $A$) được quy về việc khảo sát phương trình $\text{det}(A-\lambda I_n)=0$. Điều này đưa ta tới định nghĩa sau.
$\textbf{Định nghĩa 23.2.}\ $ Cho ma trận $A = (a_{ij})_{n\times n}\in\text{Mat}_{n}(\mathbb{K})$ và $t$ là một biến. $\textbf{Đa thức đặc trưng}$ của $A$ là đa thức cho bởi $$\mathcal{P}_A(t) := \text{det}(A-tI_n) = \left| \begin{array}{llll} a_{11}-t&a_{12}&\dots&a_{1n}\\ a_{21}&a_{22}-t&\dots&a_{2n}\\ \vdots&\vdots&\ddots&\vdots\\ a_{n1}&a_{n2}&\dots&a_{nn}-t \end{array}\right|.$$
Từ định nghĩa, đa thức đặc trưng của ma trận $A$ có các tính chất sau:
  1. $\deg(\mathcal{P}_A(t))=n$.
  2. Nghiệm của $\mathcal{P}_A(t)$ là các giá trị riêng của $A$.
Hơn thế nữa, ta có:
$\textbf{Mệnh đề 23.3.} \ $ Cho $f\in\text{End}(V)$ và $S,T$ là hai cơ sở của $V$. Ta ký hiệu $A=M_{S}(f)$ và $B=M_{T}(f)$, khi đó $\mathcal{P}_A(t) = \mathcal{P}_B(t)$.

$\textbf{Chứng minh.} \ $ Gọi $C \in\text{Mat}_n(\mathbb{K})$ là ma trận chuyển cơ sở từ $S$ sang $T$. Theo Định lý 16.15, ta có $B=C^{-1}AC$. Do đó \begin{align*} \mathcal{P}_B(t)&=\text{det}(B-tI_n) =\text{det}(C^{-1}AC-tI_n) \\ &=\text{det}(C^{-1}(A-tI_n)C)=\text{det}(C^{-1})\cdot\text{det}(A-tI_n)\cdot\text{det}(C)\\ &=\text{det}(A-tI_n)=\mathcal{P}_A(t). \end{align*} Vậy khẳng định của mệnh đề được chứng minh.

Kết quả trên cho phép ta định nghĩa đa thức đặc trưng của tự đồng cấu.
$\textbf{Định nghĩa 23.4.}\ $ Cho $f\in\text{End}(V)$, $S$ là một cơ sở của $V$ và $A=M_{S}(f)$. Khi đó đa thức $\mathcal{P}_{f}(t):=\mathcal{P}_A(t)$ được gọi là $\textbf{đa thức đặc trưng}$ của $f$.
Như vậy, các nghiệm của $\mathcal{P}_{f}(t)$ chính là các giá trị riêng của~$f$.
$\textbf{Nhận xét 23.5.} \ $ Để tìm giá trị riêng và không gian riêng tương ứng của một tự đồng cấu $f\in\text{End}(V)$, ta cần thực hiện các bước sau đây:
  1. Tìm ma trận $A$ của $f$ trong một có sở nào đó của $V$.
  2. Tính đa thức đặc trưng $\mathcal{P}_A(t)$ của $A$.
  3. Tìm các nghiệm của $\mathcal{P}_A(t)$ trên trường $\mathbb{K}$. Đó là các giá trị riêng của $f$ (của~$A$).
  4. Với mỗi giá trị riêng $\lambda$, lập và giải hệ phương trình tuyến tính thuần nhất $$ (A-\lambda I_n)\cdot\mathbf{x}=\mathbf{0}. $$ Tập nghiệm của hệ phương trình này chính là không gian con riêng $E_{f,\lambda}$.

$\textbf{Ví dụ 23.6.}\ $ Xét toán tử $f\colon\mathbb{R}^2\rightarrow\mathbb{R}^2$ cho bởi $f\left(\begin{bmatrix}x\\ y\end{bmatrix}\right)=\begin{bmatrix}-x+6y\\ -x+4y\end{bmatrix}$. Chúng ta muốn xác định các giá trị riêng và không gian riêng của $f$. Trước tiên, ta tính đa thức đặc trưng của $f$. Ma trận của $f$ trong cơ sở chính tắc cho bởi $ A= \begin{bmatrix} -1&6\\ -1&4 \end{bmatrix}. $ Do đó, đa thức đặc trưng của $f$ được xác định bởi \begin{align*} \mathcal{P}_{f}(t)&=\text{det}(A-tI_2)=\left\vert\begin{matrix} -1-t&6\\ -1&4-t \end{matrix}\right\vert \\ & = (-1-t)(4-t)+6 =(t-1)(t-2). \end{align*} Do đó, $f$ có hai giá trị riêng phân biệt là $\lambda_1=1$ và $\lambda_2=2$. Để xác định không gian con riêng ứng với $\lambda_1=1$, ta lập hệ $$ (A-\lambda_1 I_2)\cdot\mathbf{v}=\mathbf{0} \;\Leftrightarrow\; \begin{bmatrix}-2&6\\-1&3\end{bmatrix}\cdot \begin{bmatrix}x\\ y\end{bmatrix}= \begin{bmatrix}0\\ 0\end{bmatrix}. $$ Giải hệ phương trình này, ta nhận được không gian riêng $E_{f,1} = \langle \begin{bmatrix}3\\ 1\end{bmatrix}\rangle_\mathbb{R}$. Hoàn toàn tương tự, không gian riêng ứng với $\lambda_2=2$ là $E_{f,2} = \langle \begin{bmatrix}2\\ 1\end{bmatrix} \rangle_\mathbb{R}$. Hơn nữa, $f$ là tự đồng cấu chéo hóa được. Với cơ sở $S = \set{\begin{bmatrix}3\\ 1\end{bmatrix}, \begin{bmatrix}2\\ 1\end{bmatrix}}$ và $C= \begin{bmatrix}3&2\\ 1&1\end{bmatrix}$, ma trận của $f$ ứng với $S$ là $$ M_S(f) = C^{-1}AC = \begin{bmatrix}1&-2\\ -1&3\end{bmatrix} \cdot\begin{bmatrix}-1&6\\ -1&4\end{bmatrix} \cdot\begin{bmatrix}3&2\\ 1&1\end{bmatrix} = \begin{bmatrix}1&0\\ 0&2\end{bmatrix}. $$

$\textbf{Ví dụ 23.7.}\ $ Xét tự đồng cấu $f\colon \mathbb{R}^3 \rightarrow\mathbb{R}^3, \mathbf{v}\mapsto A\cdot \mathbf{v}$ với $$ A = \begin{bmatrix} 2 & 2 & 3 \\ 1 & 2 & 1 \\ 2 & -2 & 1 \end{bmatrix}. $$ Ma trận của $f$ trong cơ sở chính tắc của $\mathbb{R}^3$ là $A$ và đa thức đặc trưng của $f$ là \begin{align*} \mathcal{P}_A(t) &= \left\vert \begin{matrix} 2-t & 2 & 3 \\ 1 & 2-t & 1 \\ 2 & -2 & 1-t \end{matrix}\right\vert \\ &= -t^3 +5 t^2 -2 t -8\\ &= -(t +1)(t -2)(t -4). \end{align*} Thế nên $f$ có ba giá trị riêng $\lambda_1 =-1$, $\lambda_2 =2$ và $\lambda_3 =4$. Để xác định $E_{f,-1}$ ta giải hệ phương trình $(A-\lambda_1I_3)\cdot\mathbf{v}=\mathbf{0}$, tương đương với $$ \begin{bmatrix} 3 & 2 & 3 \\ 1 & 3 & 1 \\ 2 & -2 & 2 \end{bmatrix}\cdot \begin{bmatrix}x\\ y\\ z\end{bmatrix} = \begin{bmatrix}0\\ 0\\ 0\end{bmatrix} \;\Leftrightarrow\; \begin{bmatrix} 1 & 0 & 1 \\ 0 & 1 & 0 \\ 0 & 0 & 0 \end{bmatrix}\cdot \begin{bmatrix}x\\ y\\ z\end{bmatrix} = \begin{bmatrix}0\\ 0\\ 0\end{bmatrix}. $$ Ta nhận được $E_{f,-1}=\langle \begin{bmatrix} -a\\ 0\\ a\end{bmatrix} \;\Big|\; a\in \mathbb{R}\rangle_\mathbb{R}$. Tương tự, giải các hệ $(A-2I_3)\cdot\mathbf{v}=\mathbf{0}$ và $(A-4I_3)\cdot\mathbf{v}=\mathbf{0}$ ta thu được các không gian riêng $$ E_{f,2}=\langle \begin{bmatrix} -a\\ \frac{-3a}{2}\\ a\end{bmatrix} \;\Big|\; a\in \mathbb{R} \rangle_\mathbb{R},\quad E_{f,4}=\langle \begin{bmatrix} 4a\\ \frac{5a}{2}\\ a\end{bmatrix} \;\Big|\; a\in \mathbb{R}\rangle_\mathbb{R}. $$ Với cơ sở $S=\set{\begin{bmatrix} -1\\ 0\\ 1\end{bmatrix}, \begin{bmatrix} -2\\ -3\\ 2\end{bmatrix}, \begin{bmatrix} 8\\ 5\\ 2\end{bmatrix} }$ và $C= \begin{bmatrix} -1& -2& 8\\ 0&-3&5\\ 1&2&2 \end{bmatrix}$ ta có $$ M_S(f)=C^{-1}AC = \begin{bmatrix} -1&0&0\\ 0&2&0\\ 0&0&4 \end{bmatrix}. $$ Đặc biệt, $f$ là tự đồng cấu chéo hóa được.

23.2. Định lý Cayley-Hamilton

Cho $A\in\text{Mat}_{n}(\mathbb{K})$ và ma trận không $O\in\text{Mat}_{n}(\mathbb{K})$, và cho $p(t)\in\mathbb{K}[t]$. Nhắc lại rằng nếu $p(t)=a_0+a_1t+\cdots+a_dt^d$ với $a_0,\dots,a_d\in\mathbb{K}$ thì $p(A) = a_0I_n+a_1A+\cdots+a_dA^d$. Chẳng hạn, với $A=\begin{bmatrix}1&2\\ 3&4\end{bmatrix}$ và $p(t)= 2+t+t^2$, ta có $$ p(A) = 2I_2 +A+A^2 =\begin{bmatrix}2&0\\ 0&2\end{bmatrix} +\begin{bmatrix}1&2\\ 3&4\end{bmatrix} +\begin{bmatrix}7&10\\15& 22\end{bmatrix} = \begin{bmatrix}10& 12\\ 18& 28\end{bmatrix}. $$
$\textbf{Nhận xét 23.8.} \ $
  1. Với $\lambda_1,\dots,\lambda_n\in\mathbb{K}$ và số nguyên $k>0$ ta có tính chất ma trận chéo $$ A=\begin{bmatrix}\lambda_1&\dots&0\\ \vdots &\ddots& \vdots\\ 0&\dots&\lambda_n\end{bmatrix} \;\Longrightarrow\; A^k = \begin{bmatrix}\lambda_1^k&\dots&0\\ \vdots &\ddots& \vdots\\ 0&\dots&\lambda_n^k\end{bmatrix}, $$ $$ p(A) = \begin{bmatrix}p(\lambda_1)&\dots&0\\ \vdots &\ddots& \vdots\\ 0&\dots&p(\lambda_n)\end{bmatrix}. $$
  2. Nếu $C\in\text{Mat}_n(\mathbb{K})$ là ma trận khả nghịch và $B=C^{-1}AC$ thì với $k>0$ $$ B^k = (C^{-1}AC)^k = \underbrace{(C^{-1}AC)(C^{-1}AC)\cdots(C^{-1}AC)}_{\text{$k$ lần}} = C^{-1}A^kC $$ và $$ p(B) = p(C^{-1}AC)=C^{-1}p(A)C. $$
Từ tính chất dưới đây, ma trận $A$ có thể được coi là nghiệm của đa thức đặc trưng.
$\textbf{Định lý 23.9} [\textbf{Cayley-Hamilton}] \ $ Với $A\in\text{Mat}_{n}(\mathbb{K})$ ta có $\mathcal{P}_A(A) \;=\; O.$

$\textbf{Chứng minh.} \ $ Gọi $B=(b_{ij})_{n\times n}$ là ma trận phụ hợp của ma trận $A-tI_n$. Khi đó ta có \[ (A-tI_n)\cdot B=\text{det}(A-tI_n)\cdot I_n = \mathcal{P}_A(t)\cdot I_n. \] Từ công thức xác định ma trận phụ hợp, mỗi vị trí $b_{ij}$ của ma trận $B$ là một đa thức với biến $t$ có bậc không vượt quá $n-1$. Do đó, với mỗi $i$ ($0\leq i\leq n-1$), ta có thể gom các hệ số của $t^i$ tại mỗi vị trí của ma trận $B$ để lập thành một ma trận $B_i\in\text{Mat}_n(\mathbb{K})$. Bằng cách này, ta có thể viết \[ B= B_0+ tB_1+\cdots+t^{n-1}B_{n-1} =\sum_{i=0}^{n-1} t^iB_i. \] Thay biểu diễn trên của $B$ vào đẳng thức ban đầu, ta được \begin{align*} \mathcal{P}_A(t)\cdot I_n&=(A-tI_n)\cdot B\\ &=(A-tI_n)\bigg(\sum_{i=0}^{n-1} t^iB_i\bigg)\\ &=\sum_{i=0}^{n-1}t^iAB_i-\sum_{i=0}^{n-1}t^{i+1}B_i\\ &=AB_0+\sum_{i=1}^{n-1}t^i(AB_i-B_{i-1})-t^nB_{n-1}. \end{align*} Viết $\mathcal{P}_A(t)\cdot I_n=\sum_{i=0}^nc_it^iI_n$. Khi đó từ đẳng thức trên ta có \begin{align*} AB_0&=c_0I_n,\\ AB_1-B_0&=c_1I_n,\\ \dots&\dots\dots\\ AB_{n-1}-B_{n-2}&=c_{n-1}I_n,\\ -B_{n-1}&=c_nI_n. \end{align*} Nhân các đẳng thức trên vế theo vế lần lượt với $I_n, A, A^2,\dots, A^n$ và cộng lại, ta nhận thấy tổng ở vế trái là ma trận không, trong khi tổng ở vế phải chính là $\mathcal{P}_A(A)$. Vậy $\mathcal{P}_A(A)=O$.

$\textbf{Ví dụ 23.10.}\ $ Xét ma trận $A=\begin{bmatrix}1&2\\ -2&1\end{bmatrix}\in\text{Mat}_2(\mathbb{R})$. Đa thức đặc trưng của $A$ là $$ \mathcal{P}_A(t) = \left\vert \begin{matrix} 1-t& 2\\ -2& 1-t \end{matrix}\right\vert =t^2-2t+5. $$ Ta có $$ \mathcal{P}_A(A) = A^2-2A+5I_n = \begin{bmatrix}-3& 4\\ -4& -3\end{bmatrix} +\begin{bmatrix}-2&-4\\ 4&-2\end{bmatrix} +\begin{bmatrix}5&0\\ 0&5\end{bmatrix} = \begin{bmatrix}0&0\\ 0&0\end{bmatrix}. $$
Để tính $p(A)$ với đa thức $p(t)\in \mathbb{K}[t]$, ta dùng Định lý chia đa thức để viết $$ p(t) = q(t)\cdot \mathcal{P}_A(t) + r(t) $$ với $r(t)=0$ hoặc $\text{deg}(r(t)) < n $, khi đó Định lý Cayley-Hamilton suy ra $p(A)=r(A)$.
$\textbf{Ví dụ 23.11.}\ $ Ta sẽ tính $p(A) = 2A^8-3A^5+A^4+A^2-4I_3$ với \[ A= \begin{bmatrix}1& 0& 2\\0& -1&1\\0&1&0\end{bmatrix}. \] Trước hết ta tính đa thức đặc trưng của $A$ \[ \mathcal{P}_{A}(t)= \left|\begin{matrix}1-t &0&2\\ 0&-1-t&1\\0&1&-t\end{matrix}\right| = -t^3+2t-1. \] Theo Định lý chia đa thức ta có $$ p(t) = (-2 t^5 -4 t^3 +5 t^2 -9 t +14)\mathcal{P}_{A}(t) + (24t^2-37t+10). $$ Phần dư của phép chia là $r(t) = 24t^2-37t+10$. Vì $A^2 = \begin{bmatrix}1&2&2\\0&2&-1\\0&-1&1\end{bmatrix}$ và $\mathcal{P}_{A}(A)=O$, nên ta nhận được $$ \begin{aligned} p(A) & = r(A) = 24A^2-37A+10I_3 \\ &=24\begin{bmatrix}1&2&2\\0&2&-1\\0&-1&1\end{bmatrix} -37\begin{bmatrix}1&0&2\\0&-1&1\\0&1&0\end{bmatrix} +10 \begin{bmatrix}1&0&0\\0&1&0\\0&0&1\end{bmatrix}\\ &=\begin{bmatrix}-3&48&-26\\0&95&-61\\0&-61&34\end{bmatrix}. \end{aligned} $$
Cho $V$ là không gian véctơ $n$-chiều trên $\mathbb{K}$, và $f \in \text{End}(V)$ và đa thức $p(t)=a_0+a_1t+\cdots+a_dt^d\in \mathbb{K}[t]$. Khi đó, ta có tự đồng cấu $p(f) = a_0\text{id}_V + a_1f+\cdots+a_df^d\in\text{End}(V)$.
$\textbf{Bổ đề 23.12.} \ $ Nếu $S$ là một cơ sở của $V$ và $A=M_{S}(f)$ thì $p(A) = M_{S}(p(f))$.

$\textbf{Chứng minh.} \ $ Ta xét $p(t)=a_0+a_1t+\cdots+a_dt^d$ là một đa thức bất kỳ trong $\mathbb{K}[t]$ và $S=\set{\mathbf{v}_1,\dots,\mathbf{v}_n}$ là cơ sở của $V$. Với $1\le i\le n$, ta có $f(\mathbf{v}_i)=A\mathbf{v}_i$ và $f^k(\mathbf{v}_i) = A^{k}\mathbf{v}_i$ với mọi số nguyên $k\ge 1$, do đó \begin{align*} p(f)(\mathbf{v}_i) &= (a_0\text{id}_V+a_1f+\cdots+a_df^d)(\mathbf{v}_i)\\ &= a_0I_n \mathbf{v}_i + a_1A\mathbf{v}_i+\cdots+a_dA^d(\mathbf{v}_i) = p(A)\mathbf{v}_i. \end{align*} Vì vậy $p(A) = M_{S}(p(f))$.

$\textbf{Định lý 23.13} [\textbf{Cayley-Hamilton đối với tự đồng cấu}] \ $ Cho $f \in \text{End}(V)$ và $f_0$ là tự đồng cấu không của $V$. Khi đó $\mathcal{P}_f(f) =f_0$.

$\textbf{Chứng minh.} \ $ Gọi $S$ là một cơ sở của $V$ và $A=M_{S}(f)$. Khi đó $\mathcal{P}_f(t)=\mathcal{P}_A(t)$. Theo Định lý 23.9 ta có $\mathcal{P}_f(A)=\mathcal{P}_A(A)=O$. Vì $M_{S}(\mathcal{P}_f(f))=\mathcal{P}_f(A) = O$ theo Bổ đề 23.12, thế nên $\mathcal{P}_f(f) =f_0$.

23.3. Đa thức tối tiểu

Với $A\in\text{Mat}_n(\mathbb{K})$, Định lý Cayley-Hamilton đảm bảo $\mathcal{P}_A(A)=O$. Thế nên tồn tại đa thức bậc nhỏ nhất $g(t)\in\mathbb{K}[t]$ sao cho $g(A)=O$. Chia $g$ cho hệ số dẫn đầu của nó ta nhận được đa thức chuẩn tắc (tức đa thức với hệ số dẫn đầu bằng 1) có cùng tính chất trên.
$\textbf{Định nghĩa 23.14.}\ $ Cho $A\in\text{Mat}_n(\mathbb{K})$. $\textbf{Đa thức tối tiểu}$ $\mu_A(t)$ của $A$ là đa thức chuẩn tắc trong $\mathbb{K}[t]$ có bậc nhỏ nhất sao cho $\mu_A(A)=O$.

$\textbf{Định lý 23.15} \ $ Cho $A\in\text{Mat}_n(\mathbb{K})$ và $\mu_A(t)$ là đa thức tối tiểu của $A$.
  1. Nếu $p(t)\in \mathbb{K}[t]$ thỏa mãn $p(A)=0$ thì $\mu_A(t)$ chia hết $p(t)$. Đặc biệt, $\mu_A(t)$ chia hết $\mathcal{P}_A(t)$.
  2. $\mu_A(t)$ là duy nhất.
$\textbf{Chứng minh.} \ $ (a)$\ $ Cho $p(t)\in \mathbb{K}[t]$ thỏa mãn $p(A)=0$. Theo Định lý chia đa thức 3.23, tồn tại $q(t),r(t)\in\mathbb{K}[t]$ sao cho $$ p(t) = q(t)\mu_A(t)+ r(t) $$ với $r(t)=0$ hoặc $\deg(r(t)) < \deg(\mu_A(t))$. Khi đó $r(A) = p(A)-q(A)\mu_A(A) =O$. Vì $\mu_A(t)$ là đa thức chuẩn tắc có bậc nhỏ nhất sao cho $\mu_A(A)=O$, nên ta phải có $r(t) =0$. Như vậy, $p(t)=q(t)\mu_A(t)$. Đặc biệt, Định lý 23.9 chỉ ra rằng $\mu_A(t)$ chia hết $\mathcal{P}_A(t)$.
(b) $\ $ Giả sử $q(t)\in\mathbb{K}[t]$ là đa thức tối tiểu khác của $A$. Khi đó $\mu_A(t)$ chia hết $q(t)$ theo (a). Vì chúng cùng bậc nên $\mu_A(t) = aq(t)$ với một $a\in \mathbb{K}\setminus\set{0}$. Do $\mu_A(t)$ và $q(t)$ là các đa thức chuẩn tắc nên $a=1$, vì vậy $\mu_A(t) = q(t)$.
Hơn thế nữa, kết quả sau đây cho thấy rằng tập nghiệm của đa thức tối tiểu và đa thức đặc trưng của cùng một ma trận là trùng nhau (các số bội có thể sai khác).
$\textbf{Định lý 23.16} \ $ Cho $A\in\text{Mat}_n(\mathbb{K})$ và $\mu_A(t)$ là đa thức tối tiểu của $A$. Khi đó $\lambda \in\mathbb{K}$ là một giá trị riêng của $A$ nếu và chỉ nếu $\mu_A(\lambda)=0$.

$\textbf{Chứng minh.} \ $ Do $\mu_A(t)$ chia hết $\mathcal{P}_A(t)$, tồn tại $q(t)\in\mathbb{K}[t]$ sao cho $\mathcal{P}_A(t) = q(t)\mu_A(t)$. Nếu $\lambda$ là nghiệm của $\mu_A(t)$ thì $$ \mathcal{P}_A(\lambda) = q(\lambda)\mu_A(\lambda)=q(\lambda)\cdot 0 =0. $$ Thế nên $\lambda$ là một nghiệm của $\mathcal{P}_A(t)$, tức $\lambda$ là một giá trị riêng của $A$. Đảo lại, giả sử $\lambda$ là một giá trị riêng của $A$ và gọi $\mathbf{v}\in V\setminus\set{\mathbf{0}}$ là một véctơ riêng tương ứng với $\lambda$. Ta thấy rằng $A\mathbf{v}=\lambda\mathbf{v}$ và $A^k\mathbf{v}=\lambda^k\mathbf{v}$ với mọi số nguyên $k\geq 0$. Viết $\mu_A(t)=a_0+\cdots+a_{d-1}t^{d-1}+t^d$. Khi đó \begin{align*} \mathbf{0}=\mu_A(A)(\mathbf{v}) &=\big(a_0I_n+\cdots+a_{d-1}A^{d-1}+A^d\big)\mathbf{v}\\ &=\big(a_0+\cdots+a_{d-1}\lambda^{d-1}+\lambda^d\big)\mathbf{v}\\ &=\mu_A(\lambda)\mathbf{v}. \end{align*} Do $\mathbf{v}\ne\mathbf{0}$, từ đẳng thức trên ta có $\mu_A(\lambda)=0$. Vậy $\lambda$ là một nghiệm của đa thức $\mu_A(t)$.

$\textbf{Nhận xét 23.17.} \ $ Nếu đa thức đặc trưng của ma trận $A$ có dạng $$ \mathcal{P}_A(t) = (\lambda_1-t)^{n_1}\cdots(\lambda_r-t)^{n_r} $$ trong đó $\lambda_1,\dots,\lambda_r$ là các giá trị riêng phân biệt của $A$ thì tồn tại $1\le m_i\le n_i$ với $i=1,\dots,r$ sao cho $$ \mu_A(t) = (t-\lambda_1)^{m_1}\cdots(t-\lambda_r)^{m_r}. $$

$\textbf{Ví dụ 23.18.}\ $ Ta tính đa thức tối tiểu của ma trận $$ A = \begin{bmatrix} 1 & -1 & 0 \\ 0 & 2 & 0 \\ 1 & 1 & 2 \end{bmatrix}\in\text{Mat}_{3}(\mathbb{R}). $$ Đa thức đặc trưng của $A$ là $$ \mathcal{P}_A(t) = \left\vert\begin{matrix} 1-t & -1 & 0 \\ 0 & 2-t & 0 \\ 1 & 1 & 2-t \end{matrix}\right\vert =(1-t)(2-t)^2. $$ Do đó đa thức tối tiểu của $A$ phải là $(t-1)(t-2)$ hay $(t-1)(t-2)^2$. Thay $A$ vào đa thức $p(t)=(t-1)(t-2)$, ta thấy $p(A)=O$. Như vậy, $\mu_A(t)=p(t)=(t-1)(t-2)$.

$\textbf{Định nghĩa 23.19.}\ $ Cho $f\in\text{End}(V)$ và $f_0$ là tự đồng cấu không của $V$. $\textbf{Đa thức tối tiểu}$ $\mu_f(t)$ của $f$ là đa thức chuẩn tắc trong $\mathbb{K}[t]$ với bậc nhỏ nhất thỏa mãn $\mu_f(f)=f_0$.
Lưu ý rằng Định lý 23.15 vẫn đúng nếu ta thay $A$ bởi $f\in\text{End}(V)$, tức $\mu_f(t)$ là duy nhất và nó chia hết mọi đa thức $p(t)$ thỏa mãn $p(f)=f_0$, đặc biệt nó chia hết đa thức đặc trưng của $f$. Hơn nữa, ta có tính chất sau.
$\textbf{Mệnh đề 23.20.} \ $ Cho $f\in\text{End}(V)$ và $S$ là một cơ sở của $V$ và $A=M_{S}(f)$. Khi đó $\mu_f(t)=\mu_A(t)$.

$\textbf{Chứng minh.} \ $ Theo Bổ đề 23.12, ta có $$ M_S(\mu_f(f))=M_f(A),\quad M_S(\mu_A(f)) =\mu_A(A). $$ Từ $M_S(\mu_A(f))=\mu_A(A)=O$ suy ra $\mu_A(f)=f_0$. Thế nên $\mu_f(t)$ là ước của $\mu_A(t)$. Bên cạnh đó, vì $\mu_f(f)=f_0$ nên $M_S(\mu_f(f))=M_f(A)=O$, kéo theo $\mu_A(t)$ là ước của $\mu_f(t)$. Vậy $\mu_A(t)=\mu_f(t)$ vì chúng là các đa thức chuẩn tắc.

$\textbf{Ví dụ 23.21.}\ $ Cho tự đồng cấu $f:\mathbb{R}^4\rightarrow\mathbb{R}^4$ có ma trận trong cơ sở chính tắc là $$ A=\begin{bmatrix} 0& 1& 0& 1\\ 1& 0& 1& 0\\ 0& 1& 0& 1\\ 1& 0& 1& 0 \end{bmatrix}. $$ Đa thức đặc trưng của $f$ được xác định bởi $$ \mathcal{P}_{f}(t)=\mathcal{P}_{A}(t)=\text{det}(A-tI_4)=t^2(t-2)(t+2). $$ Do đó $f$ có $3$ giá trị riêng là $0,2,-2$. Hơn thế, đa thức tối tiểu $\mu_f(t)$ của $f$ phải là ước của $\mathcal{P}_{f}(t)$ và nhận các giá trị riêng của $f$ làm nghiệm. Thế nên $\mu_f(t)=t(t-2)(t+2)$ hoặc $\mu_f(t)=t^2(t-2)(t+2)$. Kiểm tra trực tiếp ta thấy ngay $A(A-2I_4)(A+2I_4)=O$. Vậy $\mu_f(t)=\mu_A(t)=t(t-2)(t+2)$.

23.4. Không gian con bất biến thực và phức

Cho tự đồng cấu $f\in\text{End}(V)$ và $n=\dim_\mathbb{K}(V)$. Trường hợp $n=1$, $f$ chỉ có các không gian con bất biến tầm thường. Thế nên dưới đây ta giả sử $n\ge 2$.
$\textbf{Định lý 23.22} \ $ Nếu $\mathbb{K}=\mathbb{C}$, thì $f$ có ít nhất một giá trị riêng và một không gian con bất biến một chiều.

$\textbf{Chứng minh.} \ $ Gọi $A$ là ma trận của $\varphi$ đối với một cơ sở $S$ nào đó của $V$ trên trường~$\mathbb{C}$. Từ Định lý cơ bản của Đại số (Định lý 3.23), đa thức đặc trưng $\mathcal{P}_{f}(t)=\text{det}(A-t I_n)$ luôn có ít nhất một nghiệm phức nên $f$ có ít nhất một giá trị riêng $\lambda$. Lấy $\mathbf{v}$ là một véctơ riêng ứng với giá trị riêng $\lambda$, khi đó không gian véctơ sinh bởi $\mathbf{v}$ là không gian con bất biến một chiều của~$f$.

$\textbf{Định lý 23.23} \ $ Nếu $\mathbb{K}=\mathbb{R}$, thì $f$ có ít nhất một không gian con bất biến một chiều hoặc hai chiều.
$\textbf{Chứng minh.} \ $ Gọi $A=(a_{kl})_{n\times n}\in\text{Mat}_n(\mathbb{R})$ là ma trận của $\varphi$ đối với cơ sở $S$ nào đó của $V$. Khi đó $\mathcal{P}_{f}(t) \in \mathbb{R}[t]$ là đa thức bậc $n$ với hệ số thực.
Nếu $\mathcal{P}_{f}(t)$ có một nghiệm thực, thì $f$ có ít nhất một giá trị riêng thực và do đó, tự đồng cấu này có một không gian con bất biến một chiều.
Bây giờ, ta xét trường hợp đa thức $\mathcal{P}_{f}(t)$ có tất cả các nghiệm đều là nghiệm phức. Gọi $\lambda=a+bi$ là một nghiệm phức của đa thức này, trong đó $b\ne 0$. Để tìm không gian con riêng ứng với giá trị riêng $\lambda$, như thường lệ ta xét hệ phương trình tuyến tính thuần nhất suy biến với hệ số phức sau đây \begin{equation}\tag{23.1} (A-\lambda I_n)\mathbf{z}=\mathbf{0}, \end{equation} trong đó $\mathbf{z}=[z_1,\dots,z_n]^T$ là ẩn viết dưới dạng véctơ cột. Gọi $(\alpha_1,\dots,\alpha_n)\in\mathbb{C}^n$ là một nghiệm không tầm thường của hệ trên, trong đó $\alpha_k=\beta_k+\gamma_ki$ với mỗi $1\leq k\leq n$. Thay vào (23.1), ta được \[ \sum_{l=1}^n a_{kl}\alpha_l=\lambda\alpha_k\qquad (1\leq k\leq n), \] hay \[ \sum_{l=1}^n a_{kl}(\beta_l+\gamma_li) = (a+bi)(\beta_k+\gamma_ki)\qquad (1\leq k\leq n). \] So sánh phần thực và phần ảo trong các đẳng thức trên ta thu được $$ \begin{cases} \sum_{l=1}^na_{kl}\beta_l=a\beta_k-b\gamma_k\\ \sum_{l=1}^na_{kl}\gamma_l=a\gamma_k+b\beta_k, \end{cases} $$ với mọi $1\leq k\leq n$. Đặt $\mathbf{u}=[\beta_1,\dots,\beta_n]^T$, $\mathbf{v}=[\gamma_1,\dots,\gamma_n]^T$. Khi đó các đẳng thức trên được viết lại dưới dạng $$ \begin{cases} \varphi(\mathbf{u})=a\mathbf{u}-b\mathbf{v}\\ \varphi(\mathbf{v})=a\mathbf{v}+b\mathbf{u}. \end{cases} $$ Gọi $U$ là không gian con của $V$ sinh bởi $\mathbf{u},\mathbf{v}$. Từ hệ thức trên ta thấy $U$ là không gian con bất biến của $V$. Do $(\alpha_1,\dots,\alpha_n)$ là một nghiệm không tầm thường của hệ (23.1), trong hai véctơ $\mathbf{u}$, $\mathbf{v}$ phải có ít nhất một véctơ khác $\mathbf{0}$. Do đó $\dim U\geq 1$. Nếu $\dim U=1$ thì khi đó $V$ có không gian con bất biến $1$ chiều, và do đó $V$ có giá trị riêng thực. Điều này mâu thuẫn với giả thiết rằng $\mathcal{P}_{f}(t)$ không có nghiệm thực. Vậy $\dim U=2$. Ta kết luận rằng $V$ có không gian con bất biến hai chiều.

Sử dụng Maple

Trong $\texttt{Maple},$ lệnh $\texttt{CharacteristicPolynomial}$ trong gói $\texttt{LinearAlgebra}$ tính đa thức đặc trưng của một ma trận vuông trên trường số $\mathbb{K}$. Để tìm các nghiệm của đa thức đặc trưng ta có thể sử dụng lệnh $\texttt{solve}.$ Chẳng hạn, ta tính đa thức đặc trưng của ma trận $A$ của tự đồng cấu trong Ví dụ 23.7 như sau.
$\texttt{> with(LinearAlgebra):}$
$\texttt{> A := Matrix([[2,2,3], [1,2,1], [2,-2,1]]);}$
$\texttt{> Pa := CharacteristicPolynomial(A,t);}$
$\hspace{0.5cm}\texttt{ Pa := t^3-5*t^2+2*t+8}$
do đó $A$ có đa thức đặc trưng là $\mathcal{P}_A(t)=-(t^3-5t^2+2t+8)$, ở đây kết quả ở $\texttt{Maple}$ là đa thức đặc trưng được chuẩn hóa với hệ số dẫn đầu bằng 1. Ta tính nghiệm của $\mathcal{P}_A(t)$ với
$\texttt{> solve(Pa,t);}$
$\hspace{0.5cm}\texttt{ 2, 4, -1}$
và nhận được nghiệm $2,4,-1$ và đây là các giá trị riêng của $A$. Hơn nữa ta có thể kiểm tra Định lý Cayley-Hamilton đối với $A$ như sau:
$\texttt{> Pa := unapply(Pa,t): Pa(A);}$
ở trên lệnh $\texttt{unapply}$ cho phép ta định nghĩa hàm đa thức $\texttt{Pa}=\mathcal{P}_A(t)$ và tính giá trị của nó tại $A$ và nhận được là ma trận không $O$ như khẳng định của Định lý Cayley-Hamilton. Để tính đa thức tối tiểu của ma trận $A$ ta dùng lệnh $\texttt{MinimalPolynomial}:$
$\texttt{> MinimalPolynomial(A, t);}$
$\hspace{0.5cm}\texttt{ t^3-5*t^2+2*t+8}$
và như vậy đa thức tối tiểu và đa thức đặc trưng của $A$ trùng nhau (sai khác dấu). Cuối cùng, chúng ta tính đa thức đặc trưng và đa thức tối tiểu cùng giá trị riêng của ma trận $A$ của tự đồng cấu trong Ví dụ 22.22. Ta nhận được:
$\texttt{> A := Matrix([[0,1,0,1], [1,0,1,0], [0,1,0,1], [1,0,1,0]]);}$
$\texttt{> Pa := CharacteristicPolynomial(A,t); # đa thức đt của A}$
$\hspace{0.5cm}\texttt{ Pa := t^4-4*t^2}$
$\texttt{> solve(Pa,t); # tính giá trị riêng của A}$
$\hspace{0.5cm}\texttt{ 0, 0, 2, -2}$
$\texttt{> MinimalPolynomial(A, t); # đa thức tối tiểu của A}$
$\hspace{0.5cm}\texttt{ t^3-4*t}$
Để tính không gian riêng $E_{A,c}$ ứng với giá trị riêng $c$ của $A$, ta dùng lệnh
$\texttt{> NullSpace(A-c*IdentityMatrix(4)); }$
để tìm một cơ sở của $E_{A,C}$ như ở mục trước.

Comments

Popular posts from this blog

Mục lục

LỜI NÓI ĐẦU Chương I: KIẾN THỨC CHUẨN BỊ    1 TẬP HỢP  2 ÁNH XẠ  3 VÀNH VÀ TRƯỜNG SỐ  Chương II: MA TRẬN VÀ HỆ PHƯƠNG TRÌNH TUYẾN TÍNH   4 GIỚI THIỆU VỀ HỆ PHƯƠNG TRÌNH TUYẾN TÍNH  5 MA TRẬN   6 PHƯƠNG PHÁP KHỬ GAUSS-JORDAN   7 BIỆN LUẬN HỆ PHƯƠNG TRÌNH VÀ ỨNG DỤNG  8 CÁC PHÉP TOÁN TRÊN MA TRẬN  9 MA TRẬN KHẢ NGHỊCH VÀ CÁC TÍNH CHẤT  Chương III: KHÔNG GIAN VÉCTƠ  10 KHÁI NIỆM VỀ KHÔNG GIAN VÉCTƠ  11 HỆ VÉCTƠ ĐỘC LẬP TUYẾN TÍNH 12 CƠ SỞ VÀ CHIỀU CỦA KHÔNG GIAN VÉCTƠ 13 TỌA ĐỘ VÀ MA TRẬN CHUYỂN CƠ SỞ  14 TỔNG VÀ TỔNG TRỰC TIẾP Chương  IV: ÁNH XẠ TUYẾN TÍNH   15 ÁNH XẠ TUYẾN TÍNH  16 MA TRẬN CỦA ÁNH XẠ TUYẾN TÍNH  17 ẢNH VÀ HẠT NHÂN CỦA ĐỒNG CẤU  18 KHÔNG GIAN VÉCTƠ ĐỐI NGẪU Chương V: ĐỊNH THỨC VÀ ỨNG DỤNG   19 ĐỊNH THỨC CỦA MA TRẬN   20 KHAI TRIỂN ĐỊNH THỨC.  21 CÁC ỨNG DỤNG CỦA ĐỊNH THỨC   Chương VI: GIÁ TRỊ RIÊNG VÀ BÀI TOÁN CHÉO HÓA  22 KHÔNG GIAN CON BẤT BIẾN 23 ĐA THỨC ĐẶC TRƯNG  24 BÀI TOÁN CHÉO HÓA VÀ ỨNG DỤNG 

Bài 8: CÁC PHÉP TOÁN TRÊN MA TRẬN

Trong các mục trước, ma trận là một công cụ hữu hiệu dùng để giải hệ phương trình tuyến tính. Thật ra, chính bản thân nội tại của ma trận cũng có nhiều tính chất thú vị. Các phép toán được giới thiệu sau đây cho thấy sự hữu ích của nó về cả lý thuyết và thực hành trong các chương tiếp theo. Chẳng hạn, nếu xem ma trận là một ngôn ngữ để diễn tả khái niệm trừu tượng ánh xạ tuyến tính trong Chương 4, thì các phép toán này là vốn từ vựng cần thiết. 8.1. Cộng hai ma trận, nhân ma trận với một số Hai phép toán đầu tiên được giới thiệu ở đây là phép cộng hai ma trận và nhân ma trận với một số. Cho $\mathbb{K}$ là trường số ($\mathbb{Q}$, $\mathbb{R}$ hay $\mathbb{C}$), $m,n$ là hai số nguyên dương, và cho hai ma trận $A=(a_{ij})_{m\times n}$, $B=(b_{ij})_{m\times n} \in\mathrm{Mat}_{m,n}(\mathbb{K})$ và $\lambda\in \mathbb{K}$. $\textbf{Định nghĩa 8.1.}\ $ $\textbf{Tổng}$ của hai ma trận $A$ và $B$, ký hiệu là $A+B$, là một ma trận cấp $m\times n$ trên trường $\mathbb{K}$ xác định bởi

Bài 1: TẬP HỢP

1.1. Khái niệm tập hợp Đối tượng của toán học gồm nhiều loại khác nhau, trong đó chúng ta đã quen thuộc với các đối tượng như các số, điểm, đường thẳng, mặt phẳng, tam giác, đường tròn, phương trình, vv. Thông thường các đối tượng có cùng một tính chất chung được gom thành các tập hợp, và chúng có thể là hữu hạn hoặc vô hạn. Tập hợp là một khái niệm cơ bản và thâm nhập vào toàn bộ cách nghĩ trong toán học ngày nay. Tập hợp là một khái niệm không được định nghĩa mà được hiểu một cách trực giác như sau. Tất cả những đối tượng được xác định theo một quy tắc nào đó được xem là $\textbf{một tập hợp}$. Những đối tượng này được gọi là các $\textbf{phần tử}$ của tập hợp đó. (Để ngắn gọn, đôi khi ta nói $\textbf{tập}$ thay cho tập hợp.) Một tập hợp có thể không có một phần tử nào cả, một tập như vậy được gọi là $\textbf{tập rỗng}$, ký hiệu là $\varnothing$. $\textbf{Định nghĩa 1.1.}$ Cho $A$ là một tập hợp khác rỗng. Nếu $a$ là một phần tử của của $A$, thì người ta nói rằng ``$\te