Skip to main content

Mục lục

Bài 15: ÁNH XẠ TUYẾN TÍNH

15.1. Định nghĩa và các tính chất cơ bản

Trong phần này, ta giả sử $V$ và $W$ là các không gian véctơ trên trường số $\mathbb{K}$. Đối tượng khảo sát của chúng ta là lớp các ánh xạ giữa các không gian véctơ bảo toàn các phép toán cộng và nhân vô hướng. Các ánh xạ này được gọi là các $\textit{ánh xạ tuyến tính},$ hay $\textit{phép biến đổi tuyến tính},$ hay $\textit{toán tử tuyến tính},$ hay $\textit{đồng cấu tuyến tính}.$
$\textbf{Định nghĩa 15.1.}\ $ Ánh xạ $f\colon V\rightarrow W$ được gọi là một $\textbf{ánh xạ $\mathbb{K}$-tuyến tính}$ nếu các tính chất sau đây được thỏa mãn:
  1. Tính chất cộng tính: $f(\mathbf{v}_1+\mathbf{v}_2)=f(\mathbf{v}_1)+f(\mathbf{v}_2)$ với mọi véctơ $\mathbf{v}_1,\mathbf{v}_2\in V$;
  2. Tính chất thuần nhất: $f(\lambda \mathbf{v})=\lambda f(\mathbf{v})$ với mọi vô hướng $\lambda\in \mathbb{K}$, với mọi véctơ $\mathbf{v}\in V$.

Nếu không có nhầm lẫn, ta thường không nhắc đến trường khi nói đến các ánh xạ tuyến tính. Dễ dàng kiểm tra các ánh xạ dưới đây là những ánh xạ tuyến tính.

$\textbf{Ví dụ 15.2.}\ $ Ánh xạ không $\mathbf{0}\colon V\rightarrow W, \mathbf{v}\mapsto \mathbf{0}$ và ánh xạ đồng nhất $\mathrm{id}_V\colon V\rightarrow V, \mathbf{v}\mapsto\mathbf{v}$ là các ánh xạ tuyến tính.

Các tính chất sau đây của ánh xạ tuyến tính có thể suy ra ngay từ định nghĩa.

$\textbf{Mệnh đề 15.3.} \ $ Cho $f\colon V\rightarrow W$ là một ánh xạ tuyến tính. Khi đó
  1. $f(\mathbf{0})=\mathbf{0}$;
  2. $f(-\mathbf{v})=-f(\mathbf{v})$ với mọi véctơ $\mathbf{v}\in V$;
  3. $f(\sum_{i=1}^n\lambda_i\mathbf{v}_i)=\sum_{i=1}^n\lambda_if(\mathbf{v}_i)$, với mọi $n\in\mathbb{N}$, với mọi vô hướng $\lambda_1,\dots,\lambda_n\in\mathbb{K}$, với mọi véctơ $\mathbf{v}_1,\dots,\mathbf{v}_n\in V$.
$\textbf{Chứng minh.} \ $ (a) $\ $ Dùng tính chất của véctơ $\mathbf{0}$ và tính chất cộng tính của ánh xạ tuyến tính, ta có $f(\mathbf{0})=f(\mathbf{0}+\mathbf{0})=f(\mathbf{0})+f(\mathbf{0})$. Giản ước vế theo vế, ta được $f(\mathbf{0})=\mathbf{0}$.
(b) $\ $ Dùng tính chất của véctơ đối và tính cộng tính của ánh xạ tuyến tính, ta có $$ \mathbf{0}=f(\mathbf{0})=f(\mathbf{v}+(-\mathbf{v}))=f(\mathbf{v})+f(-\mathbf{v}). $$ Chuyển vế ta thu được $f(-\mathbf{v})=-f(\mathbf{v})$.
(c) $\ $ Ta chứng minh khẳng định này bằng quy nạp theo $n$. Với $n=1$, khẳng định đúng theo tính thuần nhất của ánh xạ tuyến tính. Giả sử khẳng định đúng với $n=n_0$ với $n_0\in\mathbb{N},n_0\geq 1$. Ta chứng minh khẳng định đúng với $n=n_0+1$. Giả sử $\lambda_1,\dots,\lambda_{n_0+1}\in\mathbb{K}$ là các vô hướng và $\mathbf{v}_1,\dots,\mathbf{v}_{n_0+1}$ là các véctơ trong $V$. Khi đó, $$ \begin{aligned} f\bigg(\sum_{i=1}^{n_0+1}\lambda_i\mathbf{v}_i\bigg) &= f\bigg(\sum_{i=1}^{n_0}\lambda_i\mathbf{v}_i\bigg) +f(\lambda_{n_0+1}\mathbf{v}_{n_0+1})\\ &=\bigg(\sum_{i=1}^{n_0}\lambda_i f(\mathbf{v}_i)\bigg) +\lambda_{n_0+1}f(\mathbf{v}_{n_0+1}) \quad (\text{theo giả thiết quy nạp})\\ &=\sum_{i=1}^{n_0+1}\lambda_if(\mathbf{v}_i) \quad (\text{từ tính kết hợp}). \end{aligned} $$ Theo nguyên lý quy nạp, khẳng định đúng với mọi $n\in\mathbb{N}$.

Tương tự như việc kiểm tra không gian con của không gian véctơ, hai điều kiện trong định nghĩa ánh xạ tuyến tính có thể kiểm tra đồng thời thông qua tiêu chuẩn sau đây.

$\textbf{Mệnh đề 15.4.} \ $ Ánh xạ $f\colon V\rightarrow W$ là một ánh xạ tuyến tính nếu và chỉ nếu \[ f(\lambda_1\mathbf{v}_1+\lambda_2\mathbf{v}_2) = \lambda_1 f(\mathbf{v}_1) + \lambda_2 f(\mathbf{v}_2), \] với mọi véctơ $\mathbf{v}_1,\mathbf{v}_2\in V$, với mọi vô hướng $ \lambda_1,\lambda_2\in \mathbb{K}$.
$\textbf{Chứng minh.} \ $ Nếu $f$ là ánh xạ tuyến tính, ta áp dụng tính chất $(c)$ của Mệnh đề 15.3 với $n=2$. Ngược lại, giả sử \[ f(\lambda_1\mathbf{v}_1+\lambda_2\mathbf{v}_2) = \lambda_1 f(\mathbf{v}_1) + \lambda_2 f(\mathbf{v}_2), \] với mọi véctơ $\mathbf{v}_1,\mathbf{v}_2\in V$ và mọi $\lambda_1,\lambda_2\in \mathbb{K}$. Khi đó chọn $\lambda_1=\lambda_2=1$, ta thu được tính chất cộng tính, chọn $\lambda=\lambda_1,\mathbf{v}=\mathbf{v}_1,\lambda_2=0$ ta thu được tính chất thuần nhất.

Dùng tiêu chuẩn trên ta chứng minh các ánh xạ dưới đây là ánh xạ tuyến tính.

$\textbf{Ví dụ 15.5.}\ $ Ta xem $\mathbb{C}$ là một $\mathbb{R}$-không gian véctơ. Khi đó, phép liên hợp \begin{align*} f\colon \mathbb{C} & \longrightarrow \mathbb{C}\\ a+ib& \longmapsto a-ib \end{align*} là một ánh xạ $\mathbb{R}$-tuyến tính. Thật vậy, với mọi $r_1,r_2\in \mathbb{R}$ và với mọi $a_1+ib_1,a_2+ib_2\in\mathbb{C}$, ta có $$ \begin{aligned} & f(r_1(a_1+ib_1)+r_2(a_2+ib_2))=f(r_1a_1+r_2a_2+i(r_1b_1+r_2b_2))\\ & =r_1a_1+r_2a_2-i(r_1b_1+r_2b_2)=r_1a_1-ir_1b_1+r_2a_2-ir_2b_2\\ & =r_1f(a_1+ib_1)+r_2f(a_2+ib_2). \end{aligned} $$ Vậy $f$ là một ánh xạ $\mathbb{R}$-tuyến tính. Tuy nhiên, nếu xem $\mathbb{C}$ là một không gian véctơ phức thì $f$ không phải là một ánh xạ $\mathbb{C}$-tuyến tính. Bởi vì, với $i\in \mathbb{C}$ ta thấy $$ f(i\cdot i) =f(-1)=-1 \ne 1 = i\cdot f(i) $$ tức là $f$ không thỏa tính thuần nhất.

$\textbf{Ví dụ 15.6.}\ $ Đạo hàm hình thức \begin{align*} \frac{d}{dx}\colon \mathbb{K}[x]&\longrightarrow \mathbb{K}[x]\\ a_0+a_1x+\cdots+a_nx^n&\longmapsto a_1+2a_2x+\cdots+na_nx^{n-1} \end{align*} là một ánh xạ $\mathbb{K}$-tuyến tính. Với $f(x)\in\mathbb{K}[x]$, $\frac{d}{dx}(f(x))$ thường được viết là $f'(x)$. Thật vậy, cho $f(x)=a_0+a_1x+\cdots+a_nx^n,$ $g(x)=b_0+b_1x+\cdots+b_mx^m$ trong $\mathbb{K}[x]$ và $a, b\in \mathbb{K}$. Giả sử $n\le m$. Ta có $$ \begin{aligned} &\frac{d}{dx}(af(x)+bg(x))\\ &=\frac{d}{dx}(a(a_0+a_1x+\cdots+a_nx^n)+b(b_0+b_1x+\cdots+b_mx^m))\\ &=\frac{d}{dx}((aa_0+bb_0)+\cdots + (aa_n+bb_n)x^n + bb_{n+1}x^{n+1}+\cdots+bb_{m}x^{m})\\ &=(aa_1+bb_1)+\cdots + n(aa_n+bb_n)x^{n-1}+(n+1)bb_{n+1}x^{n}+\cdots+mbb_{m}x^{m-1} \\ &=a(a_1+\cdots+na_nx^{n-1})+b(b_1+\cdots+mb_mx^{m-1})\\ &=a\frac{d}{dx}(f(x))+b\frac{d}{dx}(g(x)). \end{aligned} $$ Vậy đạo hàm hình thức là một ánh xạ $\mathbb{K}$-tuyến tính.

$\textbf{Ví dụ 15.7.}\ $ Cho $C_{[a,b]}$ là không gian véctơ của các hàm số thực liên tục trên đoạn $[a,b]\subset\mathbb{R}$. Khi đó, phép lấy tích phân $$ \varphi\colon C_{[a,b]}\rightarrow\mathbb{R}, f(t)\mapsto\int_a^bf(t)dt $$ là một ánh xạ $\mathbb{R}$-tuyến tính. Thật vậy, với mọi $f(t), g(t)\in C_{[a,b]}$ và với mọi $\lambda_1,\lambda_2\in \mathbb{R}$ ta có $$ \begin{aligned} \varphi(\lambda_1f(t)+\lambda_2g(t)) &=\int_a^b(\lambda_1f(t)+\lambda_2g(t))dt\\ &= \lambda_1\int_a^bf(t)dt +\lambda_2\int_a^bg(t)dt\\ &=\lambda_1\varphi(f(t))+\lambda_2\varphi(g(t)). \end{aligned} $$ Thế nên $\varphi$ là ánh xạ tuyến tính.

$\textbf{Ví dụ 15.8.}\ $ Cho $V_1,V_2$ là hai không gian con của $V$ sao cho $V=V_1\oplus V_2$. Khi đó các phép chiếu tự nhiên xuống thành phần thứ nhất và thứ hai $$ \begin{aligned} \mathrm{pr}_1\colon V&\longrightarrow V_1,\; \mathbf{v}=\mathbf{v}_1+\mathbf{v}_2\longmapsto \mathbf{v}_1,\\ \mathrm{pr}_2\colon V&\longrightarrow V_2,\; \mathbf{v}=\mathbf{v}_1+\mathbf{v}_2\longmapsto \mathbf{v}_2 \end{aligned} $$ là các ánh xạ tuyến tính.
Do vai trò như nhau của $\mathrm{pr}_1, \mathrm{pr}_2$, ta chỉ cần chứng minh $\mathrm{pr}_1$ là ánh xạ tuyến tính. Với $\mathbf{u}=\mathbf{u}_1+\mathbf{u}_2$ và $\mathbf{v}=\mathbf{v}_1+\mathbf{v}_2$ trong $V$, $\mathbf{u}_i,\mathbf{v}_i\in V_i$ ($i=1,2$), và với $a, b\in \mathbb{K}$ ta có $$ \begin{aligned} \mathrm{pr}_1(a\mathbf{u}+b\mathbf{v}) &=\mathrm{pr}_1(a(\mathbf{u}_1+\mathbf{u}_2)+b(\mathbf{v}_1+\mathbf{v}_2))\\ &=\mathrm{pr}_1((a\mathbf{u}_1+b\mathbf{v}_1)+(a\mathbf{u}_2+b\mathbf{v}_2))\\ &=a\mathbf{u}_1+b\mathbf{v}_1=a\mathrm{pr}_1(\mathbf{u})+b\mathrm{pr}_1(\mathbf{v}). \end{aligned} $$ Như vậy, $\mathrm{pr}_1$ là ánh xạ tuyến tính.

$\textbf{Ví dụ 15.9.}\ $ Cho $W$ là không gian véctơ con của $V$. Khi đó phép chiều chính tắc $$ \pi: V\longrightarrow V/W,\, \mathbf{v}\longmapsto \mathbf{v}+W $$ là một ánh xạ tuyến tính.
Thật vậy, với $\mathbf{v}_1, \mathbf{v}_2\in V$ và $a, b\in \mathbb{K}$, ta có $$ \begin{aligned} \pi(a\mathbf{v}_1+b\mathbf{v}_2) &=a\mathbf{v}_1+b\mathbf{v}_2+W \\ &=a(\mathbf{v}_1+W)+b(\mathbf{v}_2+W)\\ &=a\pi(\mathbf{v}_1)+b\pi(\mathbf{v}_2). \end{aligned} $$ Do đó, ánh xạ $\pi$ là tuyến tính.

$\textbf{Ví dụ 15.10.}\ $ Cho ma trận $A=\begin{bmatrix} 1 & 2 & -1\\ 2 & -3 & 5 \end{bmatrix} \in \text{Mat}_{2, 3}(\mathbb{R})$. Xét ánh xạ $$ f\colon \mathbb{R}^3\longrightarrow \mathbb{R}^2,\; \mathbf{v}=\begin{bmatrix} x_1\\ x_2\\ x_3\\ \end{bmatrix} \longmapsto A\mathbf{v} = \begin{bmatrix} x_1+2x_2-x_3\\ 2x_1-3x_2+5x_3 \end{bmatrix}. $$ Vì $f(\lambda \mathbf{u}+\mu\mathbf{v})=A(\lambda \mathbf{u}+\mu\mathbf{v}) = \lambda A\mathbf{u}+\mu A\mathbf{v}=\lambda f(\mathbf{u})+\mu f(\mathbf{v})$ với mọi $\mathbf{u},\mathbf{v}\in\mathbb{R}^3$ và $\lambda,\mu\in\mathbb{R}$, nên ánh xạ $f$ là một ánh xạ $\mathbb{R}$-tuyến tính.
Tổng quát hơn, với mỗi ma trận $A\in\text{Mat}_{m, n}(\mathbb{K})$, ánh xạ $$ f\colon \mathbb{K}^n\longrightarrow\mathbb{K}^m, \mathbf{v}\longmapsto A\mathbf{v}\quad \mbox{với mọi $\mathbf{v}=\begin{bmatrix}x_1\\ \vdots\\ x_n\end{bmatrix}\in \mathbb{K}^n$} $$ là một ánh xạ tuyến tính.

15.2. Định lý cơ bản về sự xác định ánh xạ tuyến tính

Mỗi một ánh xạ tuyến tính hoàn toàn được xác định khi biết được {\it ảnh của nó trên một cơ sở} của $V$. Tính chất này được phát biểu thông qua định lý sau.

$\textbf{Định lý 15.11.} \ $ Giả sử $\set{\mathbf{v}_1, \mathbf{v}_2, \dots, \mathbf{v}_n}$ là một cơ sở của $V$ và $\set{\mathbf{w}_1, \mathbf{w}_2, \dots, \mathbf{w}_n}$ là một tập gồm $n$ véctơ trong $W$. Khi đó tồn tại duy nhất một ánh xạ tuyến tính $f\colon V\rightarrow W$ sao cho $f(\mathbf{v}_i)=\mathbf{w}_i$ với mọi $i=1, \dots,n$.
$\textbf{Chứng minh.} \ $ Trước hết ta chứng minh sự tồn tại của ánh xạ $f:V\rightarrow W$. Lấy $\mathbf{v}$ là một véctơ bất kỳ của $V$. Do $\set{\mathbf{v}_1,\dots,\mathbf{v}_n}$ là cơ sở của $V$, tồn tại duy nhất $\lambda_1, \lambda_2, \dots, \lambda_n\in \mathbb{K}$ sao cho $\mathbf{v}=\sum_{i=1}^n\lambda_i\mathbf{v}_i$. Ta đặt \[ f(\mathbf{v}) := \lambda_1\mathbf{w}_1 + \lambda_2\mathbf{w}_2 + \cdots +\lambda_n\mathbf{w}_n. \] Khi đó $f:V\rightarrow W$ là một ánh xạ thỏa mãn $f(\mathbf{v}_i)=\mathbf{w}_i$ với mọi $i=1,\dots,n$. Tiếp theo, ta kiểm tra rằng $f$ xác định như trên là một ánh xạ tuyến tính. Thật vậy, với mọi véctơ $\mathbf{u}=\sum_{i=1}^n\mu_i\mathbf{v}_i$, $\mathbf{v}=\sum_{i=1}^n\lambda_i\mathbf{v}_i$ trong $V$ ($\mu_i,\lambda_i\in\mathbb{K}$ với mọi $1\leq i\leq n$) và với mọi $c_1, c_2\in \mathbb{K}$ ta có $$ \begin{aligned} f(c_1\mathbf{u}+c_2\mathbf{v}) &= f\Big(\sum_{i=1}^n(c_1\mu_i+c_2\lambda_i)\mathbf{v}_i\Big) = \sum_{i=1}^n(c_1\mu_i+c_2\lambda_i)\mathbf{w}_i\\ &=c_1\Big(\sum_{i=1}^n\mu_i\mathbf{w}_i\Big) + c_2\Big(\sum_{i=1}^n\lambda_i\mathbf{w}_i\Big) = c_1f(\mathbf{u})+c_2f(\mathbf{v}). \end{aligned} $$ Thế nên $f$ là ánh xạ tuyến tính.
Bây giờ ta chứng minh tính duy nhất. Giả sử $g\colon V\rightarrow W$ là một ánh xạ tuyến tính thỏa mãn điều kiện $g(\mathbf{v}_i)=\mathbf{w}_i$ với mọi $i=1,\dots,n$. Khi đó, với mọi véctơ $\mathbf{v}=\sum_{i=1}^n\lambda_i\mathbf{v}_i$ trong $V$ ta có $$ \begin{aligned} g(\mathbf{v}) &= g(\sum_{i=1}^n\lambda_i\mathbf{v}_i) = \sum_{i=1}^n\lambda_ig(\mathbf{v}_i)\\ &=\sum_{i=1}^n\lambda_i\mathbf{w}_i = f(\mathbf{v}). \end{aligned} $$ Vậy $g\equiv f$, ta kết thúc chứng minh tính duy nhất của $f$.

$\textbf{Ví dụ 15.12.}\ $ Xét cơ sở chính tắc $$ \set{\mathbf{e}_1=\begin{bmatrix}1\\0\\0\end{bmatrix},\, \mathbf{e}_2=\begin{bmatrix}0\\1\\0\end{bmatrix},\, \mathbf{e}_3=\begin{bmatrix}0\\0\\1\end{bmatrix}} $$ của $\mathbb{R}^3$ và các véctơ $\mathbf{w}_1=\begin{bmatrix}1\\ 2\end{bmatrix}$, $\mathbf{w}_2=\begin{bmatrix}2\\ -3\end{bmatrix}$, và $\mathbf{w}_3=\begin{bmatrix}-1\\ 5\end{bmatrix}$ trong $\mathbb{R}^2$. Theo định lý trên, tồn tại duy nhất ánh xạ tuyến tính $f\colon \mathbb{R}^3\rightarrow \mathbb{R}^2$ sao cho $f(\mathbf{e}_i)=\mathbf{w}_i$ với $i=1,\dots,3$. Hơn nữa, ánh xạ $f$ được xác định cụ thể như sau: $$ \begin{aligned} f\left(\begin{bmatrix}x_1\\ x_2\\ x_3\end{bmatrix}\right) &= f(x_1\mathbf{e}_1+x_2\mathbf{e}_2+x_3\mathbf{e}_3) = x_1\mathbf{w}_1 +x_2\mathbf{w}_2 +x_3\mathbf{w}_3\\ &= x_1 \begin{bmatrix}1\\ 2\end{bmatrix} +x_2\begin{bmatrix}2\\ -3\end{bmatrix}+x_3\begin{bmatrix}-1\\ 5\end{bmatrix} = \begin{bmatrix}x_1+2x_2-x_3\\ 2x_1-3x_2+5x_3\end{bmatrix}. \end{aligned} $$

15.3. Không gian các ánh xạ tuyến tính

Cho $V$ là $W$ là các không gian véctơ trên trường $\mathbb{K}$. Ký hiệu $\mathcal{L}(V, W)$ là tập hợp tất cả ánh xạ tuyến tính từ $V$ vào $W$. Trên $\mathcal{L}(V, W)$ ta định nghĩa phép cộng và phép nhân vô hướng bởi $$ (f+g)(\mathbf{v}) \;:=\; f(\mathbf{v})+g(\mathbf{v}) \quad \text{ và }\quad (\lambda f)(\mathbf{v}) \;:=\; \lambda(f(\mathbf{v})) $$ với mọi $f,g\in \mathcal{L}(V,W)$, $\mathbf{v}\in V$ và $\lambda\in \mathbb{K}$. % Khi đó, ta dễ dàng kiểm tra rằng $\mathcal{L}(V,W)$ với hai phép toán ở trên lập thành một không gian véctơ trên $\mathbb{K}$. Đặc biệt, phần tử không của $\mathcal{L}(V,W)$ là ánh xạ không từ $V$ vào $W$ và ánh xạ đối của $f\in \mathcal{L}(V,W)$ là $-f$ được xác định bởi $(-f)(\mathbf{v}) = -f(\mathbf{v})$ với mọi $\mathbf{v}\in V$.

$\textbf{Định nghĩa 15.13.}\ $ Không gian véctơ $\mathcal{L}(V,W)$ được gọi là không gian các ánh xạ tuyến tính từ $V$ vào $W$.

$\textbf{Ví dụ 15.14.}\ $ Xét $f: \mathbb{R}\rightarrow \mathbb{R}$ là một ánh xạ tuyến tính. Do tính tuyến tính, ta có $f(x)=xf(1)$. Nếu đặt $a:=f(1)$ thì $f(x)=ax$ với mọi $x\in\mathbb{R}$. Do đó, mỗi giá trị $a\in \mathbb{R}$ xác định duy nhất một ánh xạ tuyến tính $$ f_a:\mathbb{R}\longrightarrow \mathbb{R},\, f_a(x)=ax. $$ Vì vậy, không gian các ánh xạ tuyến tính từ $\mathbb{R}$ vào $\mathbb{R}$ là $$ \mathcal{L}(\mathbb{R},\mathbb{R})= \set{ f_a\colon\mathbb{R}\rightarrow\mathbb{R}, f_a(x)=ax \mid a\in \mathbb{R} }. $$

Trong trường hợp đặc biệt khi $W=V$, ta có khái niệm dưới đây.

$\textbf{Định nghĩa 15.15.}\ $ Mỗi ánh xạ tuyến tính $f\colon V\rightarrow V$ được gọi là một $\textbf{tự đồng cấu}$ của không gian $V$. Ta thường viết $\mathrm{End}(V)$ thay cho $\mathcal{L}(V,V)$ để chỉ không gian các tự đồng cấu trên $V$.

$\textbf{Mệnh đề 15.16.} \ $ Cho $U,V,W$ là các không gian véctơ trên $\mathbb{K}$ và cho $f\in \mathcal{L}(U,V)$, $g\in \mathcal{L}(V,W)$. Khi đó ánh xạ hợp thành $g\circ f: U\rightarrow W$ cũng là một ánh xạ tuyến tính, tức là $g\circ f\in\mathcal{L}(U,W)$.
$\textbf{Chứng minh.} \ $ Với mọi véctơ $\mathbf{u}_1, \mathbf{u}_2\in U$ và với mọi $\lambda_1 ,\lambda_2\in \mathbb{K}$ ta có $$ \begin{aligned} (g\circ f) (\lambda_1\mathbf{u}_1 + \lambda_2\mathbf{u}_2) &= g(f(\lambda_1\mathbf{u}_1 + \lambda_2\mathbf{u}_2))\\ &= g(\lambda_1f(\mathbf{u}_1) + \lambda_2f(\mathbf{u}_2))\\ &= \lambda_1g(f(\mathbf{u}_1)) + \lambda_2g(f(\mathbf{u}_2))\\ &= \lambda_1(g\circ f)(\mathbf{u}_1) + \lambda_2(g\circ f)(\mathbf{u}_2). \end{aligned}. $$ Vậy $g\circ f$ là một ánh xạ tuyến tính.

$\textbf{Ví dụ 15.17.}\ $ Cho $U=\text{Mat}_2(\mathbb{R})$ và $\mathbb{R}[x]_{\le 2} =\set{p\in\mathbb{R}[x] \mid \deg(p)\le 2}$ và xét các ánh xạ tuyến tính \begin{align*} f \colon U &\longrightarrow \mathbb{R}[x]_{\le 2}\\ \begin{bmatrix}a& b\\ c& d\end{bmatrix} & \longmapsto (a-c)+(b+2c)x+(3c-d)x^2 \end{align*} \begin{align*} g &\colon \mathbb{R}[x]_{\le 2} \longrightarrow \mathbb{R}^2 \\ a_0+a_1x+a_2x^2 &\longmapsto \begin{bmatrix}a_0-a_1\\ 2a_1+a_2\end{bmatrix}. \end{align*} Khi đó, ánh xạ hợp thành $g\circ f\colon U\rightarrow \mathbb{R}^2$ là ánh xạ tuyến tính xác định bởi \begin{align*} (g\circ f)\left( \begin{bmatrix}a & b\\ c & d\end{bmatrix}\right) &= g\left(f\left( \begin{bmatrix}a & b\\ c & d\end{bmatrix}\right)\right)\\ &= g((a-c)+(b+2c)x+(3c-d)x^2) \\ &= \begin{bmatrix}a-b-3c\\ 2b+7c-d\end{bmatrix}. \end{align*} Trong khi đó $f\circ g$ không xác định, vì nếu $p(x)\in \mathbb{R}[x]_{\le 2}$ thì $g(p(x))=\mathbf{v}\in \mathbb{R}^2$, nhưng $(f\circ g)(p(x)) = f(\mathbf{v})$ và $\mathbf{v}\notin U$.

15.4. Đơn cấu, toàn cấu, đẳng cấu

$\textbf{Định nghĩa 15.18.}\ $ Cho $V,W$ là các không gian véctơ trên $\mathbb{K}$ và $f\in \mathcal{L}(V,W)$.
  1. Ánh xạ tuyến tính $f$ được gọi là đơn cấu nếu $f$ là một đơn ánh.
  2. Ánh xạ tuyến tính $f$ được gọi là toàn cấu nếu $f$ là một toàn ánh.
  3. Ánh xạ tuyến tính $f$ được gọi là đẳng cấu nếu $f$ là một song ánh.

$\textbf{Ví dụ 15.19.}\ $
  1. Ánh xạ đồng nhất $\mathrm{id}_V\colon V\rightarrow V, \mathbf{v}\mapsto\mathbf{v}$ là một đẳng cấu.
  2. Cho $U$ là không gian con của không gian véctơ $V$. Khi đó phép nhúng $j\colon U\rightarrow V$, $\mathbf{u}\mapsto \mathbf{u}$ với mọi $\mathbf{u}\in U$ là một đơn cấu. Phép chiếu chính tắc $\pi: V\rightarrow V/U$, $\mathbf{v}\mapsto \mathbf{v}+U$ là một toàn cấu.

Từ Mệnh đề 2.15 và Ví dụ 15.19(a), ta có ngay một tiêu chuẩn để một ánh xạ là đơn cấu và toàn cấu như sau.

$\textbf{Mệnh đề 15.20.} \ $ Cho $f\in \mathcal{L}(V,W)$ và $g\in \mathcal{L}(W,V)$, tức $f\colon V\rightarrow W$ và $g\colon W \rightarrow V$ là các ánh xạ tuyến tính. Khi đó:
  1. Nếu $f\circ g=\mathrm{id}_W$ thì $f$ là một toàn cấu.
  2. Nếu $g\circ f=\mathrm{id}_V$ thì $f$ là một đơn cấu.

$\textbf{Nhận xét 15.21.} \ $ Nếu $f\colon V\rightarrow W$ là một đẳng cấu thì $f^{-1}\colon W\rightarrow V$ cũng là một đẳng cấu và được gọi là $\textbf{nghịch đảo}$ của $f$. Ta có $f\circ f^{-1}=\mathrm{id}_W$ và $f^{-1}\circ f=\mathrm{id}_V$.
Hơn thế, nếu tồn tại $g\colon W\rightarrow V$ sao cho $g\circ f=\mathrm{id}_V$ và $f\circ g=\mathrm{id}_W$, thì $f$ là một đơn cấu do $g\circ f=\mathrm{id}_V$ và $f$ là một toàn cấu do $f\circ g=\mathrm{id}_W$ theo Mệnh đề 15.20. Vậy $f$ là một đẳng cấu. Khi đó tác động vào hai vế của đẳng thức $f\circ g=\mathrm{id}_W$ với $f^{-1}$ ta được $g=f^{-1}$.

Nếu có một đẳng cấu $f\colon V\rightarrow W$ giữa hai không gian véctơ $V$ và $W$ thì ta nói hai không gian này đẳng cấu với nhau, ký hiệu $V\cong W$.

$\textbf{Định lý 15.22} [\textbf{Đặc trưng đẳng cấu qua số chiều}] \ $ Giả sử $V$ và $W$ là các không gian véctơ hữu hạn chiều trên trường $\mathbb{K}$. Khi đó $$ V\cong W \;\Leftrightarrow\; \dim(V)=\dim(W). $$
$\textbf{Chứng minh.} \ $ Đặt $n :=\dim(V)$ và gọi $S:=\set{\mathbf{v}_1, \mathbf{v}_2, \dots, \mathbf{v}_n}$ là một cơ sở của $V$.
Giả sử $V\cong W$, tức là tồn tại một đẳng cấu $f\colon V\rightarrow W$. Ta sẽ chứng minh rằng $T := \set{f(\mathbf{v}_1), f(\mathbf{v}_2), \dots, f(\mathbf{v}_n)}$ là một cơ sở của $W$. Lấy một véctơ $\mathbf{w}\in W$ bất kỳ. Do $f$ là một toàn ánh nên tồn tại $\mathbf{v}\in V$ sao cho $f(\mathbf{v})=\mathbf{w}$. Do $S$ là một cơ sở của $V$ nên tồn tại các vô hướng $\lambda_1, \lambda_2, \dots, \lambda_n\in \mathbb{K}$ sao cho $\mathbf{v}=\lambda_1\mathbf{v}_1+\lambda_2\mathbf{v}_2+\cdots+\lambda_n\mathbf{v}_n$. Từ đó ta có \[ \begin{aligned} \mathbf{w} &= f(\mathbf{v}) = f(\lambda_1\mathbf{v}_1 + \lambda_2\mathbf{v}_2 + \cdots + \lambda_n\mathbf{v}_n)\\ &= \lambda_1f(\mathbf{v}_1) + \lambda_2f(\mathbf{v}_2) + \cdots + \lambda_nf(\mathbf{v}_n). \end{aligned} \] Vậy $T$ là một hệ sinh của $W$. Việc còn lại là chỉ ra rằng $T$ là một hệ độc lập tuyến tính. Thật vậy, giả sử tồn tại $\lambda_1,\dots,\lambda_n\in\mathbb{K}$ sao cho $$ \mathbf{0} = \lambda_1f(\mathbf{v}_1) + \lambda_2f(\mathbf{v}_2) + \cdots + \lambda_nf(\mathbf{v}_n). $$ Do $f$ là tuyến tính, đẳng thức trên tương đương với \[ f(\lambda_1\mathbf{v}_1+\lambda_2\mathbf{v}_2+\cdots+\lambda_n\mathbf{v}_n) = \mathbf{0}. \] Bây giờ, sử dụng tính đẳng cấu của $f$ ta được $$ \lambda_1\mathbf{v}_1 + \lambda_2\mathbf{v}_2 + \cdots + \lambda_n\mathbf{v}_n=\mathbf{0}. $$ Do $S$ là một cơ sở của $V$, từ quan hệ tuyến tính trên ta có $\lambda_1=\lambda_2=\dots=\lambda_n=0$. Do đó $T$ là một hệ độc lập tuyến tính. Ta kết luận rằng $T$ là một cơ sở của $W$. Do cơ sở này có $n$ phần tử, ta được $\dim(W)=n=\dim (V)$.
Ngược lại, giả sử $\dim V=\dim W$ và gọi $T'=\set{\mathbf{w}_1, \mathbf{w}_2, \dots, \mathbf{w}_n}$ là một cơ sở của $W$. Khi đó, theo Định lý 15.11, tồn tại duy nhất một ánh xạ tuyến tính $f\colon V\rightarrow W$ sao cho $f(\mathbf{v}_i)=\mathbf{w}_i$ với mọi $i=1, \dots, n$. Đồng thời, Định lý 15.11 cũng đảm bảo sự tồn tại của ánh xạ tuyến tính $g\colon W\rightarrow V$ sao cho $g(\mathbf{w}_i)=\mathbf{v}_i$ với $i=1,\dots,n$. Khi đó $g\circ f=\mathrm{id}_V$ và $f\circ g=\mathrm{id}_W$. Vậy $f$ là một đẳng cấu từ $V$ vào $W$. Mệnh đề đã được chứng minh.

$\textbf{Ví dụ 15.23.}\ $ Xét không gian con $\mathbb{R}[x]_{\le n} = \{f\in \mathbb{R}[x] \mid \deg(f)\le n\}$ của không gian $\mathbb{R}[x]$. Ta biết rằng $\mathbb{R}[x]_{\le n}$ là không gian véctơ $n+1$-chiều, cùng số chiều với không gian $\mathbb{R}^{n+1}.$ Theo Định lý 15.22, $\mathbb{R}[x]_{\le n}$ đẳng cấu với $\mathbb{R}^{n+1}$.
Trong trường hợp $n=3$, cho $U$ là không gian con của $\mathbb{R}[x]_{\le 3}$ xác định bởi $$ U =\set{a_0+a_1x+a_2x^2+a_3x^3 \mid a_3 = -2a_0+3a_1+a_2}. $$ Khi đó tập các đa thức $\set{1-2x^3, x+3x^3,x^2+x^3}$ là một cơ sở của $U$, do đó $\dim(U)=3$. Vì vậy $U$ đẳng cấu với $\mathbb{R}^3$. Nếu $\set{\mathbf{e}_1,\mathbf{e}_2,\mathbf{e}_3}$ là cơ sở chính tắc của $\mathbb{R}^3$ thì ánh xạ $f: U\rightarrow \mathbb{R}^3$ được định nghĩa bởi $$ f(1-2x^3)=\mathbf{e}_1,\; f(x+3x^3)=\mathbf{e}_2,\; f(x^2+x^3)=\mathbf{e}_3 $$ là một đẳng cấu. Biểu diễn $p(x)\in U$ bởi $p(x)=a_0+a_1x+a_2x^2+a_3x^3 =a_0(1-2x^3) +a_1(x+3x^3) +a_2(x^2+x^3),$ kéo theo $$ \begin{aligned} f(p(x)) &= a_0f(1-2x^3) +a_1f(x+3x^3) +a_2f(x^2+x^3) \\ &= a_0\mathbf{e}_1+a_1\mathbf{e}_2+a_2\mathbf{e}_3 =[a_0, a_1, a_2]^T. \end{aligned} $$

$\textbf{Ví dụ 15.24.}\ $ Với hai số nguyên dương $m,n\ge 1$, không gian véctơ $\text{Mat}_{m, n}(\mathbb{R})$ gồm các ma trận cấp $m\times n$ trên $\mathbb{R}$ có số chiều bằng $\dim(\text{Mat}_{m, n}(\mathbb{R})) = mn$. Vì vậy, Định lý 15.22 suy ra rằng $\text{Mat}_{m, n}(\mathbb{R})\cong \mathbb{R}^{mn}$. Chẳng hạn với $m=n=2$, ta có đẳng cấu $$ f\colon \text{Mat}_{2}(\mathbb{R})\stackrel{\sim}{\longrightarrow} \mathbb{R}^4,\, \begin{bmatrix}a& b\\ c& d\end{bmatrix} \longmapsto [a, b, c, d]^T. $$

Sử dụng Maple

Tùy thuộc vào các không gian véctơ đang xét, các ánh xạ tuyến tính giữa chúng có thể được xây dựng và tính toán với $\texttt{Maple}$, đặc biệt điều này dễ dàng thực hiện với lớp các ánh xạ tuyến tính dạng $f:\mathbb{R}^n\rightarrow \mathbb{R}^m$ được xác định bởi một ma trận $A\in\text{Mat}_{m, n}(\mathbb{R})$ như trong Ví dụ 15.10. Chẳng hạn, với $A=\begin{bmatrix}1&2&-1\\ 2&-3&5\end{bmatrix}$ ta định nghĩa ánh xạ tuyến tính $f:\mathbb{R}^3\rightarrow \mathbb{R}^2$ tương ứng trong $\texttt{Maple}$ như sau:

$\texttt{> with(LinearAlgebra):}$
$\texttt{> A := Matrix([[1,2,-1],[2,-3,5]]):}$
$\texttt{> f := v -> A.v;}$
Như vậy, để tính $f(\mathbf{v})$ với $\mathbf{v}=[a, b, c]^T\in\mathbb{R}^3$ ta chỉ cần gọi lệnh:
$\texttt{> v := <<a,b,c>>: f(v);}$
và nhận được $$ f(\mathbf{v}) = \begin{bmatrix}a+2b-c\\ 2a-3b+5c\end{bmatrix}. $$ Ánh xạ tuyến tính $f$ còn có thể được định nghĩa thông qua hàm $\texttt{proc}$ trong $\texttt{Maple}$ bởi dòng lệnh:
$\texttt{> f := proc(v) A.v; end proc:}$
Xét ánh xạ tuyến tính $g:\mathbb{R}^2\rightarrow \mathbb{R}^3, \mathbf{u}\mapsto B\cdot \mathbf{u}$ với $B= \begin{bmatrix}1&0\\2&1\\1&-1\end{bmatrix}$. Ta có thể lập các ánh xạ hợp thành $g\circ f: \mathbb{R}^3\rightarrow \mathbb{R}^3$ và $f\circ g: \mathbb{R}^2\rightarrow \mathbb{R}^2$ với $\texttt{@}$ như sau:
$\texttt{> B := Matrix([[1, 0], [2, 1], [1, -1]]);}$
$\texttt{> g := u -> B.u;}$
$\texttt{> gf := g@f;}$
$\texttt{> fg := f@g;}$
Với $\mathbf{u}=\begin{bmatrix}x\\ y\end{bmatrix}\in\mathbb{R}^2$ và $\mathbf{v}=\begin{bmatrix}a\\ b\\ c\end{bmatrix}\in\mathbb{R}^3$, ta tính $g(\mathbf{u})$ và $(f\circ g)(\mathbf{u})$ và $(g\circ f)(\mathbf{v})$ bởi
$\texttt{> g(u); fg(u); gf(v);}$
và kết quả là $$ g(\mathbf{u}) = \begin{bmatrix}x\\ 2x+y\\ x-y\end{bmatrix}, (f\circ g)(\mathbf{u}) = \begin{bmatrix}4x+3y\\ x-8y\end{bmatrix}, (g\circ f)(\mathbf{v}) =\begin{bmatrix}a+2b-c\\ 4a+b+3c\\ -a+5b-6c\end{bmatrix}. $$ Cuối cùng, chúng ta thiết lập các ánh xạ $f: U\rightarrow \mathbb{R}[x]_{\le 2}$, $g:\mathbb{R}[x]_{\le 2}\rightarrow\mathbb{R}^2$, và $g\circ f: U\rightarrow\mathbb{R}^2$ trong Ví dụ 15.17 với $\texttt{Maple}$:
$\texttt{> f:= A -> A[1,1]-A[2,1] +(A[1,2]+2*A[2,1])*x }$
$\hspace{1.5cm}\texttt{ +(3*A[2,1]-A[2,2])*x^2;}$
$\texttt{> g:= p -> Matrix([[coeff(p,x,0)-coeff(p,x,1)],}$
$\hspace{2cm}\texttt{ [2*coeff(p,x,1)+coeff(p,x,2)]]);}$
$\texttt{> gf := g@f;}$
Với $A=\begin{bmatrix}a&b\\ c& d\end{bmatrix}\in U$ và $p = a+bx+cx^2 \in \mathbb{R}[x]_{\le 2}$, ta tính $f(A)$, $g(p)$ và $(g\circ f)(A)$ bởi
$\texttt{> A := Matrix([[a,b],[c,d]]);}$
$\texttt{> p := a +b*x +c*x^2;}$
$\texttt{> f(A); g(p); gf(A);}$
và nhận được kết quả là \[ f(A)=a-c+(b+2c)x+(3c-d)x^2, \] \[ g(p) = \begin{bmatrix}a-b\\ 2b+c\end{bmatrix}, \] \[ (g\circ f)(A) = \begin{bmatrix}a-b-3c\\ 2b+7c-d\end{bmatrix}. \]

Comments

Popular posts from this blog

Mục lục

LỜI NÓI ĐẦU Chương I: KIẾN THỨC CHUẨN BỊ    1 TẬP HỢP  2 ÁNH XẠ  3 VÀNH VÀ TRƯỜNG SỐ  Chương II: MA TRẬN VÀ HỆ PHƯƠNG TRÌNH TUYẾN TÍNH   4 GIỚI THIỆU VỀ HỆ PHƯƠNG TRÌNH TUYẾN TÍNH  5 MA TRẬN   6 PHƯƠNG PHÁP KHỬ GAUSS-JORDAN   7 BIỆN LUẬN HỆ PHƯƠNG TRÌNH VÀ ỨNG DỤNG  8 CÁC PHÉP TOÁN TRÊN MA TRẬN  9 MA TRẬN KHẢ NGHỊCH VÀ CÁC TÍNH CHẤT  Chương III: KHÔNG GIAN VÉCTƠ  10 KHÁI NIỆM VỀ KHÔNG GIAN VÉCTƠ  11 HỆ VÉCTƠ ĐỘC LẬP TUYẾN TÍNH 12 CƠ SỞ VÀ CHIỀU CỦA KHÔNG GIAN VÉCTƠ 13 TỌA ĐỘ VÀ MA TRẬN CHUYỂN CƠ SỞ  14 TỔNG VÀ TỔNG TRỰC TIẾP Chương  IV: ÁNH XẠ TUYẾN TÍNH   15 ÁNH XẠ TUYẾN TÍNH  16 MA TRẬN CỦA ÁNH XẠ TUYẾN TÍNH  17 ẢNH VÀ HẠT NHÂN CỦA ĐỒNG CẤU  18 KHÔNG GIAN VÉCTƠ ĐỐI NGẪU Chương V: ĐỊNH THỨC VÀ ỨNG DỤNG   19 ĐỊNH THỨC CỦA MA TRẬN   20 KHAI TRIỂN ĐỊNH THỨC.  21 CÁC ỨNG DỤNG CỦA ĐỊNH THỨC   Chương VI: GIÁ TRỊ RIÊNG VÀ BÀI TOÁN CHÉO HÓA  22 KHÔNG GIAN CON BẤT BIẾN 23 ĐA THỨC ĐẶC TRƯNG  24 BÀI TOÁN CHÉO HÓA VÀ ỨNG DỤNG 

Bài 8: CÁC PHÉP TOÁN TRÊN MA TRẬN

Trong các mục trước, ma trận là một công cụ hữu hiệu dùng để giải hệ phương trình tuyến tính. Thật ra, chính bản thân nội tại của ma trận cũng có nhiều tính chất thú vị. Các phép toán được giới thiệu sau đây cho thấy sự hữu ích của nó về cả lý thuyết và thực hành trong các chương tiếp theo. Chẳng hạn, nếu xem ma trận là một ngôn ngữ để diễn tả khái niệm trừu tượng ánh xạ tuyến tính trong Chương 4, thì các phép toán này là vốn từ vựng cần thiết. 8.1. Cộng hai ma trận, nhân ma trận với một số Hai phép toán đầu tiên được giới thiệu ở đây là phép cộng hai ma trận và nhân ma trận với một số. Cho $\mathbb{K}$ là trường số ($\mathbb{Q}$, $\mathbb{R}$ hay $\mathbb{C}$), $m,n$ là hai số nguyên dương, và cho hai ma trận $A=(a_{ij})_{m\times n}$, $B=(b_{ij})_{m\times n} \in\mathrm{Mat}_{m,n}(\mathbb{K})$ và $\lambda\in \mathbb{K}$. $\textbf{Định nghĩa 8.1.}\ $ $\textbf{Tổng}$ của hai ma trận $A$ và $B$, ký hiệu là $A+B$, là một ma trận cấp $m\times n$ trên trường $\mathbb{K}$ xác định bởi

Bài 1: TẬP HỢP

1.1. Khái niệm tập hợp Đối tượng của toán học gồm nhiều loại khác nhau, trong đó chúng ta đã quen thuộc với các đối tượng như các số, điểm, đường thẳng, mặt phẳng, tam giác, đường tròn, phương trình, vv. Thông thường các đối tượng có cùng một tính chất chung được gom thành các tập hợp, và chúng có thể là hữu hạn hoặc vô hạn. Tập hợp là một khái niệm cơ bản và thâm nhập vào toàn bộ cách nghĩ trong toán học ngày nay. Tập hợp là một khái niệm không được định nghĩa mà được hiểu một cách trực giác như sau. Tất cả những đối tượng được xác định theo một quy tắc nào đó được xem là $\textbf{một tập hợp}$. Những đối tượng này được gọi là các $\textbf{phần tử}$ của tập hợp đó. (Để ngắn gọn, đôi khi ta nói $\textbf{tập}$ thay cho tập hợp.) Một tập hợp có thể không có một phần tử nào cả, một tập như vậy được gọi là $\textbf{tập rỗng}$, ký hiệu là $\varnothing$. $\textbf{Định nghĩa 1.1.}$ Cho $A$ là một tập hợp khác rỗng. Nếu $a$ là một phần tử của của $A$, thì người ta nói rằng ``$\te