22.1. Định nghĩa và một số tính chất
Cho tự đồng cấu $f \in \mathrm{End}(V)$. Nếu $V$ có thể phân tích thành tổng trực tiếp \begin{equation}\tag{22.1} V= V_1\oplus\cdots \oplus V_m \end{equation} trong đó $V_i$ là các không gian con thực sự của $V$, thì việc khảo sát $f$ có thể quy về việc khảo sát các ánh xạ thu hẹp $f|_{V_i}$ trên các không gian con $V_i$. Rõ ràng khảo sát $f|_{V_i}$ là dễ hơn so với $f$ vì $\dim(V_i) < \dim(V)$. Tuy nhiên, vấn đề ở đây là ánh xạ thu hẹp $f|_{V_i}$ có thể không phải là tự đồng cấu của $V_i$, do ảnh của nó có thể là một không gian con khác với $V_i$. Vì vậy ta cần xét các phân tích của $V$ dạng (22.1) sao cho $f(V_i)\subseteq V_i$ với mọi $i=1,\dots, m$. Điều này đưa ta tới định nghĩa sau.
$\textbf{Định nghĩa 22.1.}\ $
Không gian con $U$ của $V$ được gọi là không gian con bất biến
của $f$ nếu $f(U)\subset U$.
$\textbf{Ví dụ 22.2.}\ $
- Rõ ràng, $f(\mathbf{0})=\mathbf{0}$ và $f(\mathbf{v})\in V$ với mọi $\mathbf{v}\in V$, thế nên $\set{\mathbf{0}}$ và $V$ là các không gian con bất biến của $f$, và được gọi là các không gian con bất biến tầm thường của $f$.
- Không gian con $\mathrm{Ker}(f) = \set{\mathbf{u}\in V \mid f(\mathbf{u})=\mathbf{0}}$ của $V$ là một không gian con bất biến của $f$, vì nếu $\mathbf{u}\in \mathrm{Ker}(f)$ thì $f(\mathbf{u})=\mathbf{0} \in \mathrm{Ker}(f)$.
- Không gian con $\mathrm{Im}(f) =\set{f(\mathbf{v})\mid \mathbf{v}\in V}$ của $V$ cũng là một không gian con bất biến của $f$, vì $\mathbf{v}\in \mathrm{Im}(f)$ kéo theo $f(\mathbf{v})\in \mathrm{Im}(f)$.
$\textbf{Ví dụ 22.3.}\ $
Phép chiếu từ một điểm trên mặt phẳng $Oxy$ lên trục tọa độ thứ nhất $Ox$
cho bởi $\mathrm{pr}_1(x,y)=(x,0)$ có một không gian con bất biến
không tầm thường chính là bản thân trục tọa độ này.
Thực vậy, với mỗi $\mathbf{v}=(x,0)\in Ox$, ta có
$\mathrm{pr}_1(\mathbf{v})=\mathbf{v}$, do đó $\mathrm{pr}_1(Ox)=Ox$.
$\textbf{Ví dụ 22.4.}\ $
Xét phép tính đạo hàm hình thức
$f:\mathbb{R}[x]\rightarrow \mathbb{R}[x], p(x)\mapsto p'(x)$.
Ta biết rằng $f \in \mathrm{End}(\mathbb{R}[x])$.
Khi đó, không gian con $\mathbb{R}[x]_{\le 3}$ là một không gian con
bất biến của $f$, vì nếu $p(x)\in \mathbb{R}[x]_{\le 3}$ thì
$\deg(p'(x))\le \deg(p(x))$, và do đó
$f(p(x))=p'(x)\in \mathbb{R}[x]_{\le 3}$.
$\textbf{Định lý 22.5.} \ $
Cho $f\in\mathrm{End}(V)$.
Giả sử không gian véctơ $V$ được phân tích thành tổng trực tiếp:
\[
V= V_1\oplus\cdots \oplus V_m
\]
trong đó $V_i$ là các không gian con bất biến của $f$,
và ánh xạ thu hẹp $f|_{V_i}: V_i\rightarrow V_i$
có ma trận $A_i=(a_{jk}^{(i)})$ trong cơ sở $S_i$ của $V_i$ ($i=1,\dots,m$).
Khi đó, tồn tại cơ sở $S$ của $V$ sao cho $f$ có ma trận
trong cơ sở $S$ là
$$
M_{S}(f) = \begin{bmatrix}
A_1& 0& \dots& 0\\
0& A_2& \dots& 0\\
\vdots&\vdots&\ddots&\vdots\\
0&0&\dots&A_m
\end{bmatrix}.
$$
$\textbf{Chứng minh.} \ $
Ta đặt $S=\cup_{i=1}^mS_i$ và sắp xếp các phần tử của $S$ theo thứ tự như sau:
các phần tử thuộc $S_1$ rồi đến các phần tử thuộc $S_2,$ $S_3,\dots,S_m$.
Khi đó, theo Mệnh đề 14.11, $S$ là một cơ sở của $V$.
Viết $S_i=\{\mathbf{v}_{i_1},\mathbf{v}_{i_2},\dots,\mathbf{v}_{i_{n_i}}\}$
với $n_i=\dim(V_i)$. Vì $V_i$ là không gian con bất biến của $f$
nên $f(v_{i_l}) \in V_i$ với mọi $l=1,\dots,n_i$.
Do $A_i=(a_{jk}^{(i)})$ là ma trận của $f|_{V_i}$ trong cơ sở $S_i$ nên
$$
f(\mathbf{v}_{i_l}) = a_{1i_l}^{(i)}\mathbf{v}_{i_1}+\cdots
+ a_{n_ii_l}^{(i)}\mathbf{v}_{i_{n_i}}.
$$
Véctơ tọa độ của $f(\mathbf{v}_{i_l})$ đối với $S$ là
$
[f(\mathbf{v}_{i_l})]_S
= [0,\dots,0, a_{1i_l}^{(i)},\dots,a_{n_ii_l}^{(i)},0,\dots,0]^T,
$
điều này kéo theo
$$
\begin{bmatrix} [f(\mathbf{v}_{i_1})]_S,\dots,[f(\mathbf{v}_{i_{n_i}})]_S\end{bmatrix}
= \begin{bmatrix}\vdots\\ 0\\ A_i\\ 0\\ \vdots\end{bmatrix}.
$$
Vậy ta nhận được
\begin{align*}
M_{S}(f) &= \begin{bmatrix} [f(\mathbf{v}_{1_1})]_S,\dots,
[f(\mathbf{v}_{1_{n_1}})]_S,\dots, [f(\mathbf{v}_{m_1})]_S,\dots, [f(\mathbf{v}_{m_{n_m}})]_S\end{bmatrix} \\
&= \begin{bmatrix}
A_1&0&\dots&0\\
0&A_2&\dots&0\\
\vdots&\vdots&\ddots&\vdots\\
0&0&\dots&A_m
\end{bmatrix}.
\end{align*}
$\textbf{Ví dụ 22.6.}\ $
Xét tự đồng cấu $f: \mathbb{R}^2\rightarrow\mathbb{R}^2$ xác định bởi
$f\left(\begin{bmatrix}a\\ b\end{bmatrix}\right)=\begin{bmatrix}a+3b\\ 4a+2b\end{bmatrix}$
và các véctơ $\mathbf{v}_1 = \begin{bmatrix}1\\ -1\end{bmatrix}$ và
$\mathbf{v}_2 = \begin{bmatrix}3\\ 4\end{bmatrix}$.
Khi đó ma trận của $f$ trong cơ sở chính tắc $\mathcal{E}$
của $\mathbb{R}^2$ là
$$
M_{\mathcal{E}}(f) = \begin{bmatrix}1&3\\ 4&2\end{bmatrix}.
$$
Xét không gian $V_1= \langle\mathbf{v}_1\rangle_\mathbb{R}, V_2=\langle \mathbf{v}_2\rangle_\mathbb{R}.$
Gọi $a\mathbf{v}_1$ và $b\mathbf{v}_2$ tương ứng là các véctơ bất kỳ trong $V_1$ và $V_2$. Ta nhận thấy rằng
\begin{align*}
f(a\mathbf{v}_1) &= \begin{bmatrix}1&3\\ 4&2\end{bmatrix}\cdot \begin{bmatrix}a\\ -a\end{bmatrix}
= \begin{bmatrix}-2a\\ 2a\end{bmatrix} = -2a\mathbf{v}_1 \in V_1\\
f(b\mathbf{v}_2) &= \begin{bmatrix}1&3\\ 4&2\end{bmatrix}\cdot
\begin{bmatrix}3b\\ 4b\end{bmatrix}
= \begin{bmatrix}15b\\ 20b\end{bmatrix} = 5b\mathbf{v}_2\in V_2.
\end{align*}
Thế nên $V_1 = \langle \mathbf{v}_1\rangle_\mathbb{R}$ và $V_2 =\langle \mathbf{v}_2\rangle_\mathbb{R}$
là các không gian con bất biến của $\mathbb{R}^2$ với cơ sở lần lượt là
$S_1=\set{\mathbf{v}_1}$ và $S_2=\set{\mathbf{v}_2}$.
Hơn nữa, $S:= S_1\cup S_2 =\set{\mathbf{v}_1,\mathbf{v}_2}$
là hệ véctơ độc lập tuyến tính, nên nó cũng là cơ sở của $\mathbb{R}^2$.
Suy ra
$$
\mathbb{R}^2 = V_1\oplus V_2.
$$
Ta có các ánh xạ thu hẹp
$f|_{V_1}: V_1\rightarrow V_1, a\mathbf{v}_1\mapsto -2a\mathbf{v}_1$
với mọi $a\in \mathbb{R}$ và
$f|_{V_2}: V_2\rightarrow V_2, b\mathbf{v}_2\mapsto 5b\mathbf{v}_2$
với mọi $b\in \mathbb{R}$. Ma trận của $f|_{V_1}$ trong $S_1$ là
$A_1 = \begin{bmatrix}-2 \end{bmatrix}$ và ma trận của $f|_{V_2}$ trong $S_2$ là
$A_2 = \begin{bmatrix}5\end{bmatrix}$. Vì vậy, theo định lý trên ma trận của $f$
trong cơ sở $S$ là
$$
M_{S}(f) = \begin{bmatrix}A_1& 0\\ 0&A_2\end{bmatrix}
= \begin{bmatrix}-2&0\\ 0&5\end{bmatrix}.
$$
22.2. Véctơ riêng và giá trị riêng
Từ Định lý 22.5, ta thấy rằng ma trận của tự đồng cấu $f\in \mathrm{End}(V)$ có dạng càng đơn giản nếu các không gian con bất biến $V_i$ có số chiều càng nhỏ. Ta quan tâm đến các không gian con bất biến không tầm thường có số chiều nhỏ nhất là $1$. Nhắc lại rằng mỗi không gian véctơ con một chiều của không gian véctơ $V$ đều sinh bởi một véctơ $\mathbf{v}\not=\mathbf{0}$, và được viết dưới dạng $\langle \mathbf{v}\rangle_\mathbb{K} = \set{\lambda \mathbf{v}\mid \lambda\in \mathbb{K}}$. Ta có đặc trưng dưới đây cho không gian con bất biến 1-chiều của $f$. $\textbf{Mệnh đề 22.7.} \ $
Cho $f\in\mathrm{End}(V)$ và $\mathbf{v}\in V\setminus\{\mathbf{0}\}$.
Khi đó $\langle \mathbf{v}\rangle_\mathbb{K}$ là một không gian con bất biến của $f$
khi và chỉ khi tồn tại $\lambda\in\mathbb{K}$ sao cho
$f(\mathbf{v})=\lambda \mathbf{v}$.
$\textbf{Chứng minh.} \ $
Giả sử $\langle \mathbf{v}\rangle_\mathbb{K}$ là không gian con bất biến của $f$.
Khi đó, do $f(\mathbf{v})\in \langle \mathbf{v}\rangle_\mathbb{K}$ nên tồn tại
$\lambda\in\mathbb{K}$ sao cho $f(\mathbf{v})=\lambda\mathbf{v}$.
Ngược lại, giả sử có $\lambda\in\mathbb{K}$ sao cho
$f(\mathbf{v})=\lambda\mathbf{v}$. Với mọi véctơ
$\mathbf{w}=a\mathbf{v}\in \langle \mathbf{v}\rangle_\mathbb{K}$, ta có
$$
f(\mathbf{w})=f(a\mathbf{v})
=af(\mathbf{v})=a\lambda\mathbf{v}\in \langle \mathbf{v}\rangle_\mathbb{K}.
$$
Vậy $\langle \mathbf{v} \rangle_\mathbb{K}$ là một không gian con bất biến của $f$.
Từ kết quả trên ta đi đến định nghĩa sau.
$\textbf{Định nghĩa 22.8.}\ $
Cho $f \in \mathrm{End}(V)$.
- Số $\lambda\in \mathbb{K}$ được gọi là giá trị riêng của $f$ nếu tồn tại véctơ khác không $\mathbf{v}\in V$ sao cho $$ f(\mathbf{v})=\lambda \mathbf{v}. $$ Tập các giá trị riêng của $f$ được gọi là $\textbf{phổ}$ của $f$ và được ký hiệu là $\mathrm{Spec}(f)$.
- Với giá trị riêng $\lambda$ của $f$, mỗi véctơ khác không $\mathbf{v}\in V$ sao cho $f(\mathbf{v})=\lambda\mathbf{v}$ được gọi là véctơ riêng của $f$ ứng với $\lambda$.
$\textbf{Ví dụ 22.9.}\ $
Tự đồng cấu $f: \mathbb{R}^2\rightarrow\mathbb{R}^2$ với
$f\left(\begin{bmatrix}a\\ b\end{bmatrix}\right)=\begin{bmatrix}a+3b\\ 4a+2b\end{bmatrix}$
trong Ví dụ 22.6 có các giá trị riêng là $-2$
và $5$ vì $f(\mathbf{v}_1) = -2\mathbf{v}_1$ và
$f(\mathbf{v}_2) = 5\mathbf{v}_2$ với các véctơ riêng
$\mathbf{v}_1=\begin{bmatrix}1\\ -1\end{bmatrix}$ ứng với $-2$ và
$\mathbf{v}_2=\begin{bmatrix}3\\ 4\end{bmatrix}$ ứng với $5$.
$\textbf{Ví dụ 22.10.}\ $
Xét tự đồng cấu tuyến tính $f\colon \mathbb{R}^2\rightarrow\mathbb{R}^2$ với
$f\left(\begin{bmatrix}x\\ y\end{bmatrix}\right)= \begin{bmatrix}x\\ -y\end{bmatrix}$.
Ma trận của $f$ trong cơ sở chính tắc của $\mathbb{R}^2$
là $\begin{bmatrix}1&0\\ 0&-1\end{bmatrix}$. Về mặt hình học, $f$ là
phép đối xứng qua trục hoành, đặc biệt nó có hai không gian con bất biến
một chiều chính là hai trục tọa độ với các giá trị riêng tương
ứng là $1$ và $-1$.
Thực vậy, gọi $\begin{bmatrix}x\\ y\end{bmatrix}\ne\begin{bmatrix}0\\ 0\end{bmatrix}$ là một véctơ riêng
của $f$, khi đó có $\lambda\in\mathbb{R}$ sao cho
$$
f\left(\begin{bmatrix}x\\ y\end{bmatrix}\right)= \begin{bmatrix}x\\ -y\end{bmatrix}=\lambda\begin{bmatrix}x\\ y\end{bmatrix}.
$$
Điều này tương đương với $(1-\lambda)x=0$ và $(1+\lambda)y=0$.
Suy ra $x=0$ và $\lambda=-1$ hoặc $y=0$ và $\lambda=1$.
$\textbf{Ví dụ 22.11.}\ $
Xét tự đồng cấu $f\colon \mathbb{K}^2\rightarrow \mathbb{K}^2,\,
\begin{bmatrix}x\\ y\end{bmatrix}\mapsto \begin{bmatrix}-y\\ x\end{bmatrix}$.
Ta có $\begin{bmatrix}x\\ y\end{bmatrix}\in\mathbb{K}^2\setminus\set{\mathbf{0}}$
là véctơ riêng của $f$ ứng với giá trị riêng $\lambda$ khi và chỉ khi
$$
f\left(\begin{bmatrix}x\\ y\end{bmatrix}\right)
= \begin{bmatrix}-y\\ x\end{bmatrix}=\lambda\begin{bmatrix}x\\ y\end{bmatrix}.
$$
Điều này tương đương với $\lambda x=-y$ và $\lambda y=x$.
Nếu $y=0$ thì từ hai đẳng thức trên ta có ngay $x=0$, mâu thuẫn vì
$\begin{bmatrix}x\\ y\end{bmatrix}\ne \begin{bmatrix}0\\0\end{bmatrix}$.
Do đó $y\ne0$. Hơn thế nữa, từ hai đẳng thức
trên ta cũng có $y=-\lambda^2 y$. Vậy $\lambda^2=-1.$
- Nếu $\mathbb{K} =\mathbb{R}$, thì phương trình $\lambda^2=-1$ vô nghiệm nên tự đồng cấu $f$ không có giá trị riêng và do đó không có véctơ riêng. Bằng trực quan hình học, ta thấy $f$ là phép quay ngược chiều kim đồng hồ một góc $90^o$ quanh gốc tọa độ. Khi đó, không tồn tại đường thẳng nào đi qua gốc tọa độ mà bất biến qua phép quay trên. Do đó ta cũng thu được kết luận như trên.
- Nếu $\mathbb{K}=\mathbb{C}$ thì phương trình $\lambda^2=-1$ có hai nghiệm $\lambda=\pm i$. Từ đây, tính toán trực tiếp cho ta thấy hai véctơ riêng ứng với hai giá trị riêng $i, -i$ có dạng $\begin{bmatrix}x\\ -ix\end{bmatrix}$ với $x\ne 0$ và $\begin{bmatrix}y\\ iy\end{bmatrix}$ với $y\ne 0$.
Sau đây là một số điều kiện để một số là giá trị riêng của tự đồng cấu.
$\textbf{Mệnh đề 22.12.} \ $
Cho $f\in\mathrm{End}(V)$ và $\lambda\in\mathbb{K}$.
Khi đó, các phát biểu sau là tương đương:
- $\lambda$ là một giá trị riêng của $f$;
- $f-\lambda\cdot \mathrm{id}_V$ không đơn ánh;
- $f-\lambda\cdot \mathrm{id}_V$ không toàn ánh;
- $f-\lambda\cdot \mathrm{id}_V$ không song ánh.
$\textbf{Chứng minh.} \ $
Theo Hệ quả 17.17, ta có (b), (c) và (d) là tương đương.
Do đó, ta chỉ cần chứng minh (a) và (b) tương đương.
Giả sử $\lambda$ là một giá trị riêng của $f$, gọi $\mathbf{v}$
là véctơ riêng tương ứng với giá trị riêng $\lambda$. Ta có
$$
f(\mathbf{v})=\lambda\mathbf{v} \ \text{nên} \ (f-\lambda\cdot\mathrm{id}_V)(\mathbf{v})=\mathbf{0}.
$$
Do $\mathbf{v}\ne \mathbf{0}$ nên $f-\lambda\cdot\mathrm{id}_V$ không đơn ánh.
Ngược lại, giả sử $f-\lambda\cdot\mathrm{id}_V$ không đơn ánh.
Khi đó tồn tại $\mathbf{v}\ne \mathbf{0}$ sao cho
$(f-\lambda\cdot\mathrm{id}_V)(\mathbf{v})=\mathbf{0}.
$
Chuyển vế ta được $f(\mathbf{v})=(\lambda\cdot\mathrm{id}_V)(\mathbf{v})= \lambda\mathbf{v}.$
Vậy $\lambda$ là một giá trị riêng của $f.$
Từ chứng minh của mệnh đề trên, ta thấy rằng không gian con $\mathrm{Ker}(f-\lambda\cdot \mathrm{id}_V)$
chứa tất cả các véctơ riêng của $f$ ứng với giá trị $\lambda\in \mathbb{K}$.
Không gian này đóng vai trò quan trọng trong các mục tiếp theo và được đặt tên dưới đây.
$\textbf{Định nghĩa 22.13.}\ $
Với tự đồng cấu $f \in\mathrm{End}(V)$ và $\lambda\in \mathbb{K}$,
không gian con
$$
E_{f,\lambda} := \mathrm{Ker}(f-\lambda \cdot\mathrm{id}_V)
$$
của $V$ được gọi là không gian riêng của $f$ ứng với $\lambda$.
$\textbf{Ví dụ 22.14.}\ $
Xét tự đồng cấu $f: \mathbb{R}^2\rightarrow\mathbb{R}^2$ với
$f\left(\begin{bmatrix}a\\ b\end{bmatrix}\right)=\begin{bmatrix}a+3b\\ 4a+2b\end{bmatrix}$
trong Ví dụ 22.6.
- Với $\lambda =1$ ta có $$ (f-\mathrm{id}_V)\left(\begin{bmatrix}a\\ b\end{bmatrix}\right) =\begin{bmatrix}a+3b\\ 4a+2b\end{bmatrix}-\begin{bmatrix}a\\ b\end{bmatrix} =\begin{bmatrix}3b\\ 4a+b\end{bmatrix}. $$ Thế nên $$ \begin{bmatrix}a\\ b\end{bmatrix}\in E_{f,1} \Leftrightarrow \begin{bmatrix}a\\ b\end{bmatrix}\in \mathrm{Ker}(f -\mathrm{id}_V) \Leftrightarrow \begin{bmatrix}3b\\ 4a+b\end{bmatrix}=\begin{bmatrix}0\\ 0\end{bmatrix} \Leftrightarrow \begin{bmatrix}a\\ b\end{bmatrix}=\begin{bmatrix}0\\ 0\end{bmatrix}. $$ Vậy $E_{f,1}=\set{\mathbf{0}}$, tức $\lambda=1$ không phải là giá trị riêng của $f$.
- Với $\lambda=-2$, ta có $$ (f+2\mathrm{id}_V)\left(\begin{bmatrix}a\\ b\end{bmatrix}\right) =\begin{bmatrix}a+3b\\ 4a+2b\end{bmatrix}+2\begin{bmatrix}a\\ b\end{bmatrix} =\begin{bmatrix}3a+3b\\ 4a+4b\end{bmatrix}. $$ Do đó $\begin{bmatrix}a\\ b\end{bmatrix}\in E_{f,-2}$ nếu và chỉ nếu $\begin{bmatrix}3a+3b\\ 4a+4b\end{bmatrix}=\begin{bmatrix}0\\ 0\end{bmatrix}$ nếu và chỉ nếu $a=-b$. Suy ra $\lambda=-2$ là một giá trị riêng của $f$ và không gian riêng của $f$ ứng với $\lambda=-2$ là $E_{f,-2}=\set{\begin{bmatrix}a\\ -a\end{bmatrix} \;\Big|\; a\in\mathbb{R} }$.
$\textbf{Bổ đề 22.15.} \ $
Cho $f \in\mathrm{End}(V)$ và $\lambda\in \mathbb{K}$.
- $\lambda$ là giá trị riêng của $f$ nếu và chỉ nếu $E_{f,\lambda} \ne \set{\mathbf{0}}$.
- $E_{f,\lambda} \setminus \set{\mathbf{0}}$ là tập các véctơ riêng của $f$ ứng với $\lambda$.
- Nếu $\lambda\ne \mu\in \mathbb{K}$ thì $E_{f,\lambda}\cap E_{f,\mu} =\set{\mathbf{0}}$.
$\textbf{Chứng minh.} \ $
Các khẳng định (a) và (b) được suy ra từ định nghĩa.
Ta chứng minh (c). Giả sử $\mathbf{v}\in E_{f,\lambda}\cap E_{f,\mu}$.
Khi đó $f(\mathbf{v})=\lambda\mathbf{v}=\mu\mathbf{v}$, kéo theo
$(\lambda-\mu)\mathbf{v}=\mathbf{0}$. Vì $\lambda-\mu\ne 0$, nên
ta có $\mathbf{v}=\mathbf{0}$.
22.3. Tự đồng cấu và ma trận chéo hóa được
Trước khi giới thiệu tính chéo hóa được, ta chuyển các khái niệm được trình bày ở trên đối với tự đồng cấu sang ma trận vuông cấp $n\ge 1$. $\textbf{Định nghĩa 22.16.}\ $
Cho ma trận vuông $A\in \text{Mat}_{n}(\mathbb{K})$ và cho $f_A:\mathbb{K}^n\rightarrow\mathbb{K}^n,$
$\mathbf{v}\mapsto A\cdot\mathbf{v}$ là tự đồng cấu liên kết với $A$.
- Số $\lambda\in \mathbb{K}$ được gọi là giá trị riêng của $A$ nếu nó là giá trị riêng của $f_A$.
- Véctơ khác không $\mathbf{v}\in\mathbb{K}^n$ được gọi là véctơ riêng của $A$ nếu nó là véctơ riêng của $f_A$, tức tồn tại $\lambda\in \mathbb{K}$ sao cho $A\cdot\mathbf{v}=\lambda\mathbf{v}$.
- Với $\lambda\in\mathbb{K}$, $E_{A,\lambda}:=E_{f_A,\lambda}$ được gọi là không gian riêng của $A$ ứng với $\lambda$.
$\textbf{Định nghĩa 22.17.}\ $
Tự đồng cấu tuyến tính $f\in\mathrm{End}(V)$ được gọi là chéo hóa được
nếu tồn tại một cơ sở $S$ của $V$ sao cho ma trận $M_{S}(f)$
của $f$ trong cơ sở $S$ là một ma trận chéo, tức là
$$
M_{S}(f) = \begin{bmatrix}
\lambda_1&\dots&0\\
\vdots&\ddots&\vdots\\
0&\dots&\lambda_n
\end{bmatrix}.
$$
Một ma trận vuông $A\in \text{Mat}_{n}(\mathbb{K})$ được gọi là chéo hóa được
nếu tự đồng cấu $f_A:\mathbb{K}^n\rightarrow\mathbb{K}^n,
\mathbf{v}\mapsto A\cdot\mathbf{v}$, là chéo hóa được.
Từ định nghĩa ta thấy ngay rằng tự đồng cấu không và
$\mathrm{id}_V$ là các tự đồng cấu chéo hóa được. Hơn nữa,
theo Hệ quả 16.17, ma trận $A$ chéo hóa được
nếu và chỉ nếu tồn tại ma trận khả nghịch $C\in\text{Mat}_{n}(\mathbb{K})$ sao cho
$C^{-1}AC$ là ma trận chéo.
$\textbf{Ví dụ 22.18.}\ $
Xét tự đồng cấu $f: \mathbb{R}^2\rightarrow\mathbb{R}^2$ với
$f\left(\begin{bmatrix}a\\ b\end{bmatrix}\right)=\begin{bmatrix}a+3b\\ 4a+2b\end{bmatrix}$
trong Ví dụ 22.6. Ta biết rằng ma trận của $f$ trong
cơ sở chính tắc $\mathcal{E}$ của $\mathbb{R}^2$ là
$$
A := M_{\mathcal{E}}(f) = \begin{bmatrix}1&3\\ 4&2\end{bmatrix},
$$
và ma trận của $f$ trong cơ sở
$S=\set{\begin{bmatrix}1\\ -1\end{bmatrix},\,\begin{bmatrix}3\\ 4\end{bmatrix}}$ là
$$
M_{S}(f) = \begin{bmatrix}-2&0\\ 0&5\end{bmatrix}.
$$
Vậy $f$ là tự đồng cấu chéo hóa được, còn ma trận $A$
là ma trận chéo hóa được. Trong trường hợp này, ma trận chuyển cơ sở
từ $\mathcal{E}$ sang $S$ là $C=\begin{bmatrix}1 & 3 \\ -1 & 4\end{bmatrix}$,
và do đó $C^{-1}AC = \begin{bmatrix}-2&0\\ 0&5\end{bmatrix}$.
Trong ví dụ trên, $f$ có hai giá trị riêng phân biệt là $-2$
và $5$, và nếu chọn cơ sở $S$ được lập từ hai véctơ riêng tương ứng
với hai giá trị riêng này thì $M_{S}(f)$ là ma trận
chéo. Điều này sẽ được tổng quát hóa bởi kết quả dưới đây, ở đó
mệnh đề sau là công cụ cần thiết cho chứng minh.
$\textbf{Mệnh đề 22.19.} \ $
Cho $f\in\mathrm{End}(V)$, và cho $\mathbf{v}_1, \dots, \mathbf{v}_r$ là
các véctơ riêng của $f$ tương ứng với giá trị riêng
$\lambda_1, \dots,\lambda_r$ đôi một khác nhau. Khi đó
$\set{\mathbf{v}_1, \dots,\mathbf{v}_r}$ là hệ véctơ độc lập tuyến tính.
$\textbf{Chứng minh.} \ $ Ta chứng minh bằng phản chứng. Giả sử hệ véctơ
$\set{\mathbf{v}_1, \dots,\mathbf{v}_r}$ là phụ thuộc tuyến tính.
Gọi $k$ là số nguyên dương nhỏ nhất sao cho $\mathbf{v}_k\in\langle\mathbf{v}_1,\dots,\mathbf{v}_{k-1}\rangle_\mathbb{K}$.
Khi đó hệ véctơ $\{\mathbf{v}_1,\dots,\mathbf{v}_{k-1}\}$ là độc lập tuyến tính.
Do $\mathbf{v}_k\in \langle\mathbf{v}_1,\dots,\mathbf{v}_{k-1}\rangle_\mathbb{K}$, ta có thể viết
\begin{equation} \tag{22.2}
\mathbf{v}_k=a_1\mathbf{v}_1+\dots+a_{k-1}\mathbf{v}_{k-1},
\end{equation}
với $a_1,\dots,a_{k-1}\in\mathbb{K}$.
Tác động $f$ vào hai vế của (22.2), đồng thời chú ý rằng $f(\mathbf{v}_i)=\lambda_i\mathbf{v}_i$ ta được
\begin{equation}
\tag{22.3}
\lambda_k\mathbf{v}_k
=a_1\lambda_1\mathbf{v}_1+\dots+a_{k-1}\lambda_{k-1}\mathbf{v}_{k-1}.
\end{equation}
Nhân hai vế của (22.2) cho $\lambda_k$, sau đó trừ vế theo
vế với (22.3), ta được
$$
\mathbf{0}=a_1(\lambda_k-\lambda_1)\mathbf{v}_1+\dots
+a_{k-1}(\lambda_k-\lambda_{k-1})\mathbf{v}_{k-1}.
$$
Vì $\{\mathbf{v}_1,\dots,\mathbf{v}_{k-1}\}$ là độc lập tuyến tính và
$\lambda_i$ khác nhau đôi một, từ đẳng thức trên ta được $a_1=\dots=a_{k-1}=0$.
Từ đó ta có $\mathbf{v}_k=\mathbf{0}$, mâu thuẫn vì $\mathbf{v}_k$ là véctơ riêng.
Vậy hệ véctơ $\set{\mathbf{v}_1, \dots,\mathbf{v}_r}$ là độc lập tuyến tính.
$\textbf{Hệ quả 22.20.} \ $
Tự đồng cấu $f\in\mathrm{End}(V)$ có nhiều nhất $\dim(V)$ giá trị riêng phân biệt.
$\textbf{Chứng minh.} \ $
Gọi $\lambda_1,\dots,\lambda_m\in\mathbb{K}$ là các giá trị riêng phân biệt của $f$,
và gọi $\mathbf{v}_1,\dots,\mathbf{v}_m$ là các véctơ riêng tương ứng.
Theo Mệnh đề 22.19, hệ véctơ $\set{\mathbf{v}_1,\dots,\mathbf{v}_m}$
là độc lập tuyến tính. Do đó ta có $m\leq\dim(V)$.
$\textbf{Định lý 22.21.} \ $
Cho $n=\dim(V)$ và giả sử $f \in\mathrm{End}(V)$ có các giá trị riêng
$\lambda_1,\dots,\lambda_n$ đôi một khác nhau. Khi đó $f$
là tự đồng cấu chéo hóa được.
$\textbf{Chứng minh.} \ $
Gọi $\mathbf{v}_1,\dots,\mathbf{v}_n$ là các véctơ riêng của $f$
tương ứng với các giá trị riêng $\lambda_1,\dots,\lambda_n$.
Khi đó, $S=\set{\mathbf{v}_1,\dots,\mathbf{v}_n}$ là một cơ sở
của $V$ theo Mệnh đề 22.19. Do đó, ta có
$$
M_{S}(f) = \begin{bmatrix}
\lambda_1&\dots&0\\
\vdots&\ddots&\vdots\\
0&\dots&\lambda_n
\end{bmatrix}.
$$
Điều này cũng có thể được suy ra từ Định lý 22.5
và phân tích $V = \langle \mathbf{v}_1\rangle_\mathbb{K}\oplus
\cdots \oplus\langle\mathbf{v}_n\rangle_\mathbb{K}$.
$\textbf{Ví dụ 22.22.}\ $
Xét tự đồng cấu tuyến tính $f\colon \mathbb{R}^3\rightarrow \mathbb{R}^3$
xác định bởi
$$
f \left( \begin{bmatrix}a_1\\ a_2\\ a_3\end{bmatrix}\right)
= \begin{bmatrix}a_1+a_2\\ 2a_2+2a_3\\ 3a_3\end{bmatrix}.
$$
Ta sẽ xem xét việc áp dụng Định lý 22.21 để kiểm tra
tính chéo hóa của $f$. Ma trận của $f$ trong cơ sở chính tắc
của $\mathbb{R}^3$ là
$$
A := M_{\mathcal{E}}(f)
= \begin{bmatrix}1&1&0\\ 0&2&2\\ 0&0&3\end{bmatrix}.
$$
Để tìm các giá trị riêng $\lambda$ của $f$, ta xét
$\mathrm{Ker}(f -\lambda\mathrm{id}_V)$. Giả sử $\mathbf{v}\in\mathbb{R}^3$ là véctơ riêng
của $f$ ứng với $\lambda$. Khi đó ta có
\begin{align*}
(f -\lambda\mathrm{id}_V)(\mathbf{v}) = \mathbf{0}
&\Leftrightarrow
f(\mathbf{v}) -\lambda\mathbf{v} = \mathbf{0}
\\
&\Leftrightarrow
A\cdot \mathbf{v}-\lambda I_3\cdot\mathbf{v}= \mathbf{0}
\\
&\Leftrightarrow
(A-\lambda I_3)\cdot \mathbf{v}= \mathbf{0}.
\end{align*}
Thế nên hệ phương trình tuyến tính thuần nhất
$(A-\lambda I_3)\cdot \mathbf{v}= \mathbf{0}$ có nghiệm không tầm thường,
do đó $\det(A-\lambda I_3)=0$. Từ đây ta giải
\begin{align*}
&\det(A-\lambda I_3)= \left|\begin{matrix}
1-\lambda &1&0\\ 0&2-\lambda&2\\ 0&0&3-\lambda
\end{matrix}\right| = 0 \\
\;\Leftrightarrow\;&(1-\lambda)(2-\lambda)(3-\lambda)=0.
\end{align*}
Do vậy, ta nhận được các giá trị riêng của $f$ là $\lambda_1=1$,
$\lambda_2=2$ và $\lambda_3=3$.
Theo Định lý 22.21, tự đồng cấu $f$ (ma trận $A$)
là chéo hóa được.
Chú ý rằng ví dụ trên cũng chỉ ra cho ta cách để tìm các giá trị riêng
của $f$ và điều này sẽ được trình bày chi tiết ở mục tiếp theo.
Sử dụng Maple
Giá trị riêng và véctơ riêng của một tự đồng cấu trên không gian véctơ $n$-chiều $V$ hoàn toàn xác định thông qua ma trận của nó trong một cơ sở nào đó của $V$. Do đó, chúng ta có thể dùng $\texttt{Maple}$ để tính toán các giá trị riêng và véctơ riêng của một tự đồng cấu thông một ma trận của nó đối với một cơ sở nào đó. Trong gói lệnh $\texttt{LinearAlgebra}$ giá trị riêng của ma trận vuông $A$ cho trước có thể được tính với lệnh $\texttt{Eigenvalues},$ còn véctơ riêng của $A$ được tính bởi lệnh $\texttt{Eigenvectors}.$ Chúng ta tính giá trị riêng của ma trận $A =\begin{bmatrix}1&3\\ 4&2\end{bmatrix}$ như sau:$\texttt{> with(LinearAlgebra):}$
$\texttt{> A := Matrix([[1, 3], [4, 2]]):}$
$\texttt{> Eigenvalues(A);}$
và kết quả trả về là cột véctơ với hai giá trị riêng $5$ và $-2$
(so sánh với Ví dụ 22.9).
Véctơ riêng tương ứng được tính bởi:
$\texttt{> Eigenvectors(A);}$
lệnh này trả về
$$
\begin{bmatrix}5\\ -2\end{bmatrix},\begin{bmatrix}\frac{3}{4}&-1\\ 1&1\end{bmatrix}
$$
điều này có nghĩa rằng véctơ đầu tiên gồm các giá trị riêng $5,-2$
của $A$ còn ma trận thứ hai gồm các véctơ riêng tương ứng,
trong đó cột thứ nhất là véctơ riêng ứng với $5$ và cột thứ hai
là véctơ riêng ứng với $-2$. Tính toán với ma trận
$B=\begin{bmatrix}0&1\\ -1&0\end{bmatrix}$:
$\texttt{> B := Matrix([[0, 1], [-1, 0]]):}$
$\texttt{> Eigenvectors(B);}$
ta nhận được kết quả là
$$
\begin{bmatrix}I\\ -I\end{bmatrix},\begin{bmatrix}-I&I\\ 1&1\end{bmatrix}
$$
với $\texttt{I}$ là đơn vị ảo $i$ của $\mathbb{C}$, và như vậy ma trận $B$
không có giá trị riêng thực,
tuy nhiên có hai giá trị riêng phức như trong Ví dụ 22.11.
Tiếp theo, ta tính toán giá trị riêng và véctơ riêng của ma trận
$C=\begin{bmatrix}2&0&1\\ 1&2&1\\ 2&2&3\end{bmatrix}
\in\text{Mat}_3(\mathbb{R})$ với
$\texttt{> C := Matrix([[2,0,1],[1,2,1],[2,2,3]]);}$
$\texttt{> e,v := Eigenvectors(C);}$
và nhận được
$$
e,\, v \;:=\;
\begin{bmatrix}3+\sqrt{3}\\
3-\sqrt{3}\\ 1\end{bmatrix},
\begin{bmatrix}\frac{1}{1+\sqrt{3}}&\frac{1}{1-\sqrt{3}}&-1\\
\frac{1}{2}&\frac{1}{2}&0\\ 1&1&1 \end{bmatrix}
$$
trong đó ta gán $\texttt{e}$ là cột các giá trị riêng và $\texttt{v}$ là
ma trận với các cột là các véctơ riêng của $C$.
Với giá trị riêng $\lambda_1=3+\sqrt{3}$ của $C$, không gian riêng
$E_{C,\lambda_1}$ chính là tập nghiệm của hệ phương trình tuyến tính thuần nhất
có ma trận hệ số $C-\lambda_1I_3$. Do đó, cơ sở của không gian này
được tính với lệnh $\texttt{NullSpace}:$
$\texttt{> NullSpace(C-e[1]*IdentityMatrix(3));}$
kết quả là $\set{\begin{bmatrix}\frac{1}{1+\sqrt{3}},\frac{1}{2},1\end{bmatrix}^T}$.
Các không gian riêng còn lại của $C$ được tính toán hoàn toàn tương tự.
Bên cạnh đó, gói lệnh $\texttt{Student[LinearAlgebra]}$ lại cung cấp
các lệnh $\texttt{EigenvaluesTutor}$ và $\texttt{EigenvectorsTutor}$, nó
mở ra công cụ hộp thoại để thực hiện từng bước tính giá trị riêng của
ma trận vuông. Phương pháp tính toán của các lệnh này được thực hiện
thông qua đa thức đặc trưng sẽ được giới thiệu trong mục tiếp theo.
Comments
Post a Comment