5.1. Định nghĩa về ma trận
$\textbf{Nhận xét 5.3.} \ $ Trường hợp $m=1$, ma trận $A=(a_{ij})_{1\times n} = \begin{bmatrix} a_{11} & a_{12}&\dots &a_{1n} \end{bmatrix}$ được gọi là $\textbf{ma trận dòng}$. Nếu $n=1$ thì $$ A=(a_{ij})_{m\times 1} = \begin{bmatrix} a_{11} \\ a_{21}\\ \vdots \\ a_{m1} \end{bmatrix} $$ được gọi là $\textbf{ma trận cột}$. Với $1\le i\le m$ và $1\le j\le n$, $\textbf{dòng thứ $i$}$ của ma trận $A=(a_{ij})_{m\times n}$ là ma trận dòng $\begin{bmatrix} a_{i1} & a_{i2}&\dots &a_{in} \end{bmatrix}$ hay $\begin{bmatrix} a_{i1}, a_{i2},\dots,a_{in} \end{bmatrix}$, còn $\textbf{cột thứ j}$ của $A$ là ma trận cột $$ \begin{bmatrix} a_{1j} \\ a_{2j}\\ \vdots \\ a_{mj} \end{bmatrix}. $$ Khi $m=n=1$ thì ta có thể đồng nhất ma trận $A$ với phần tử duy nhất của nó trong $\mathbb{K}$.
- Một ma trận cấp $m\times n$ được gọi là $\textbf{ma trận không}$, ký hiệu $O$, nếu mọi phần tử đều bằng 0.
- Một ma trận $A=(a_{ij})_{m\times n}$ được gọi là $\textbf{ma trận vuông}$ (cấp $n$), nếu $m=n$, tức là $$ A = \begin{bmatrix} a_{11}&a_{12}&\dots&a_{1n}\\ a_{21}&a_{22}&\dots&a_{2n}\\ \vdots&\vdots&\ddots&\vdots\\ a_{n1}&a_{n2}&\dots&a_{nn} \end{bmatrix}. $$ Các phần tử $a_{11}, a_{22},\dots,a_{nn}$ (có cùng chỉ số dòng và cột) gọi là các phần tử nằm trên đường chéo chính, còn các phần tử $a_{1n}, a_{2\, n-1},\dots,a_{n1}$ gọi là các phần tử nằm trên đường chéo phụ. Tập tất cả các ma trận vuông cấp $n$ còn được ký hiệu là $\mathrm{Mat}_n(\mathbb{K})$.
- Ma trận vuông $A$ cấp $n$ được gọi là $\textbf{ma trận chéo}$ nếu tất cả các phần tử nằm ngoài đường chéo chính đều bằng 0, tức $A$ có dạng $$ A = \begin{bmatrix} a_{11}&0&\dots&0\\ 0&a_{22}&\dots&0\\ \vdots&\vdots&\ddots&\vdots\\ 0&0&\dots&a_{nn} \end{bmatrix}. $$
- Một ma trận vuông cấp $n$ được gọi là $\textbf{ma trận đơn vị}$, ký hiệu $I_n$, nếu nó là ma trận chéo có các phần tử nằm trên đường chéo chính đều bằng 1, tức là $$ I_n = \begin{bmatrix} 1&0&\dots&0\\ 0&1&\dots&0\\ \vdots&\vdots&\ddots&\vdots\\ 0&0&\dots&1 \end{bmatrix}. $$
- Ma trận vuông $A=(a_{ij})_{n\times n}$ được gọi là ma trận tam giác trên (t.ư. dưới) nếu $a_{ij}=0$ với mọi $1\le j< i\le n$ (t.ư. với mọi $1\le i< j\le n$), tức là $$ A = \begin{bmatrix} a_{11}&a_{12}&\dots&a_{1n}\\ 0&a_{22}&\dots&a_{2n}\\ \vdots&\vdots&\ddots&\vdots\\ 0&0&\dots&a_{nn} \end{bmatrix} \quad(\mbox{t.ư.}\quad A = \begin{bmatrix} a_{11}&0&\dots&0\\ a_{21}&a_{22}&\dots&0\\ \vdots&\vdots&\ddots&\vdots\\ a_{n1}&a_{n2}&\dots&a_{nn} \end{bmatrix}). $$ Một ma trận được gọi là $\textbf{ma trận tam giác}$ nếu nó là ma trận tam giác trên hoặc dưới.
5.2. Ma trận biểu diễn của hệ phương trình tuyến tính
Nhằm minh họa cho việc sử dụng ma trận để biểu diễn hệ phương trình tuyến tính, ta xét hệ phương trình tuyến tính \begin{equation}\tag{5.1} \begin{cases} x_1+2x_2+x_3&=1\\ 3x_1-x_3&=2. \end{cases} \end{equation} Các hệ số và hệ số tự do của hệ phương trình (5.1) được biểu diễn dưới dạng ma trận như sau: $$ \overline{A} = \left[ \begin{array}{cccc} 1 & 2 & 1 & 1\\ 3 & 0 & -1& 2 \end{array} \right]. $$ Khi đó, ta đã biểu diễn các thông tin cần thiết của hệ phương trình (5.1) một cách tự nhiên và ngắn ngọn qua ma trận $\overline{A}$. Trong trường hợp tổng quát, xét hệ phương trình tuyến tính cấp $m\times n$ trên trường $\mathbb{K}$ \begin{equation}\tag{5.2} \begin{cases} a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n &=b_1\\ a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n &=b_2\\ \dots \qquad \dots \qquad \dots\qquad \dots &\dots\\ a_{m1}x_1+a_{m2}x_2+\cdots+a_{mn}x_n&=b_m. \end{cases} \end{equation} Khi đó, các ma trận liên kết với hệ phương trình (5.2) là:- Ma trận $$ A= \begin{bmatrix} a_{11} & a_{12}& \dots & a_{1n}\\ a_{21} & a_{22}& \dots & a_{2n}\\ \vdots & \vdots & \ddots & \vdots\\ a_{m1} & a_{m2}& \dots & a_{mn} \end{bmatrix} $$ được gọi là $\textbf{ma trận hệ số}$ của hệ phương trình (5.2).
- Ma trận $$ \overline{A} = \begin{bmatrix} a_{11} & a_{12}& \dots & a_{1n} & b_1 \\ a_{21} & a_{22}& \dots & a_{2n} & b_2\\ \vdots & \vdots & \ddots & \vdots & \vdots \\ a_{m1} & a_{m2}& \dots & a_{mn} & b_m \end{bmatrix} $$ được gọi là $\textbf{ma trận mở rộng}$ của hệ phương trình (5.2).
5.3. Các phép biến đổi sơ cấp
Chúng ta biết rằng hai hệ phương trình tuyến tính cùng số biến là tương đương nếu chúng có cùng tập nghiệm. Để giải hệ phương trình tuyến tính cho trước chúng ta thường biến đổi các phương trình của hệ để đưa về hệ tương đương gồm các phương trình dạng đơn giản hơn. Từ đó đưa ra nghiệm tổng quát của hệ phương trình tuyến tính.- Đổi chỗ hai phương trình thứ $i$ và thứ $j$ cho nhau, ký hiệu $P_i\leftrightarrow P_j$.
- Nhân phương trình thứ $i$ với một hằng số $\lambda$ khác không thuộc $\mathbb{K}$, ký hiệu $\lambda P_i$.
- Nhân phương trình thứ $j$ với hằng số $\lambda\in \mathbb{K}$ rồi cộng vào phương trình thứ $i$, ký hiệu $P_i + \lambda P_j$.
$\textbf{Chứng minh.} \ $ Gọi $\mathcal{Z}$ là tập nghiệm của hệ phương trình (5.2). Phép biến đổi sơ cấp loại (1) rõ ràng không thay đổi số phương trình, vậy nên hệ phương trình mới qua phép biến đổi loại (1) có tập nghiệm là $\mathcal{Z}$. Xét phép biến đổi sơ cấp loại (2) và gọi $\mathcal{Z}'$ là tập nghiệm hệ phương trình mới nhận từ (5.2) chỉ qua phép biến đổi $\lambda P_i$ với $\lambda\ne 0$. Gọi $(s_1,\dots,s_n)\in\mathcal{Z}$. Ta có $a_{i1}s_1+\cdots+a_{in}s_n =b_i$, và khi nhân với $\lambda$ ta nhận được $\lambda a_{i1}s_1+\cdots+ \lambda a_{in}s_n =\lambda b_i$. Điều này chỉ ra $(s_1,\dots,s_n)$ thỏa mãn phương trình $\lambda a_{i1}x_1+\cdots+\lambda a_{in}x_n =\lambda b_i$, do đó $(s_1,\dots,s_n)\in\mathcal{Z}'$. Suy ra $\mathcal{Z} \subseteq \mathcal{Z}'$. Đảo lại, nếu $(s_1,\dots,s_n)\in\mathcal{Z}'$ thì $\lambda a_{i1}x_1+\cdots+\lambda a_{in}x_n =\lambda b_i$. Vì $\lambda\ne 0$, nên chia phương trình cho $\lambda$ ta có $a_{i1}s_1+\cdots+a_{in}s_n =b_i$, do đó kéo theo $(s_1,\dots,s_n)\in \mathcal{Z}$. Vậy $\mathcal{Z} =\mathcal{Z}'$. Cuối cũng, ta xét phép biến đổi sơ cấp loại (3) và gọi $\mathcal{Z}'$ là tập nghiệm hệ phương trình mới nhận từ (5.2) chỉ qua phép biến đổi $P_i+\lambda P_j$ với $\lambda\in \mathbb{K}$. Với $(s_1,\dots,s_n)\in\mathcal{Z}$, ta có \begin{equation} \tag{5.3} \begin{aligned} a_{j1}s_1+\cdots+a_{jn}s_n &=b_j,\\ a_{i1}s_1+\cdots+a_{in}s_n &=b_i. \end{aligned} \end{equation} Nhân phương trình thứ nhất với $\lambda\in \mathbb{K}$ và tiếp đó cộng với phương trình thứ hai của (5.3) ta nhận được \begin{equation} \tag{5.4} \begin{aligned} a_{j1}s_1+\cdots+a_{jn}s_n &=b_j,\\ (a_{i1}+\lambda a_{j1})s_1+\cdots+(a_{in}+\lambda a_{jn})s_n &=b_i+\lambda b_j. \end{aligned} \end{equation} Điều này kéo theo $(s_1,\dots,s_n)\in\mathcal{Z}'$. Đảo lại, nếu $(s_1,\dots,s_n)\in\mathcal{Z}'$ thì $(s_1,\dots,s_n)$ thỏa mãn (5.4), do đó giữ nguyên phương trình thứ nhất và lấy phương trình thứ hai trừ đi tích của $\lambda$ và phương trình thứ nhất của (5.4) ta nhận được (5.3). Thế nên $(s_1,\dots,s_n)\in\mathcal{Z}$. Vì vậy ta đã chỉ ra rằng $\mathcal{Z} =\mathcal{Z}'$.
Ta minh họa việc sử dụng các phép biến đổi sơ cấp để giải hệ phương trình tuyến tính qua ví dụ cụ thể sau.- Đổi chỗ hai dòng thứ $i$ và thứ $j$ cho nhau, ký hiệu $d_i\leftrightarrow d_j$.
- Nhân một hằng số khác không $\lambda\in \mathbb{K}$ vào dòng thứ $i$, ký hiệu $\lambda d_i$.
- Nhân dòng thứ $j$ với hằng số $\lambda\in \mathbb{K}$ và cộng vào dòng thứ $i$, ký hiệu $d_i+\lambda d_j.$ Các phép biến đổi như trên được gọi là các $\textbf{phép biến đổi dòng sơ cấp}$ trên $A$.
$\textbf{Nhận xét 5.13.} \ $ Từ Mệnh đề 5.9, nếu $A$ là ma trận mở rộng của một hệ phương trình tuyến tính cho trước và $B$ là ma trận tương đương của ma trận $A$ thì $B$ cũng là ma trận mở rộng của một hệ phương trình tuyến tính tương đương với hệ đã cho. Do đó chúng ta có thể giải hệ phương trình tuyến tính theo các bước sau:
- Viết ma trận mở rộng $\overline{A}$ của hệ phương trình tuyến tính.
- Áp dụng các phép biến dổi dòng sơ cấp để biến đổi ma trận $\overline{A}$ thành ma trận tương đương $B$ đơn giản hơn.
- Giải hệ phương trình tuyến tính được biểu diễn bởi ma trận $B$.
Dưới đây, ta sẽ vận dụng Nhận xét 5.13 để giải hệ phương trình trong Ví dụ 5.7.
$\textbf{Hệ phương trình:}$ | $\textbf{Ma trận mở rộng} \overline{A}$: |
---|---|
\[\begin{cases} x_1-2x_2+x_3 &=2\\ 2x_1+x_2-x_3 &=1\\ -3x_1+x_2-2x_3&=-5 \end{cases}\] | \[\begin{bmatrix} 1&-2&1&2\\ 2&1&-1&1\\ -3&1&-2&-5 \end{bmatrix}\] |
$P_2+(-2)P_1$: | $d_2+(-2)d_1$: |
\[\begin{cases} x_1-2x_2+x_3 &=2\\ \qquad\ 5x_2-3x_3 &=-3\\ -3x_1+x_2-2x_3&=-5 \end{cases}\] | \[\begin{bmatrix} 1&-2&1&2\\ 0&5&-3&-3\\ -3&1&-2&-5 \end{bmatrix}\] |
$P_3+3P_1$: | $d_3+3d_1$: |
\[\begin{cases} x_1-2x_2+x_3 &=2\\ \qquad\ 5x_2-3x_3 &=-3\\ \qquad -5x_2+x_3&=1 \end{cases}\] | \[\begin{bmatrix} 1&-2&1&2\\ 0&5&-3&-3\\ 0&-5&1&1 \end{bmatrix}\] |
$P_3+P_2$: | $d_3+d_2$: |
\[\begin{cases} x_1-2x_2+x_3 &=2\\ \qquad\ 5x_2-3x_3 &=-3\\ \qquad\qquad\ -2x_3&=-2 \end{cases}\] | \[\begin{bmatrix} 1&-2&1&2\\ 0&5&-3&-3\\ 0&0&-2&-2 \end{bmatrix}\] |
$\frac{-1}{2}P_3$: | $\frac{-1}{2}d_3$: |
\[\begin{cases} x_1-2x_2+x_3 &=2\\ \qquad\ 5x_2-3x_3 &=-3\\ \qquad\qquad\quad x_3&=1 \end{cases}\] | \[\begin{bmatrix} 1&-2&1&2\\ 0&5&-3&-3\\ 0&0&1&1 \end{bmatrix}\] |
$P_2+3P_3,\, P_1+(-1)P_3$: | $d_2+3d_3,\, d_1+(-1)d_3$: |
\[\begin{cases} x_1-2x_2\quad &=1\\ \qquad\ 5x_2\quad &=0\\ \qquad\qquad\quad x_3&=1 \end{cases}\] | \[\begin{bmatrix} 1&-2&0&1\\ 0&5&0&0\\ 0&0&1&1 \end{bmatrix}\] |
$P_1+\frac{2}{5}P_2,\, \frac{1}{5}P_2$: | $d_1+\frac{2}{5}d_2,\, \frac{1}{5}d_2$: |
\[\begin{cases} x_1\qquad\quad &=1\\ \qquad\ x_2\quad &=0\\ \qquad\qquad\quad x_3&=1 \end{cases}\] | \[\begin{bmatrix} 1&0&0&1\\ 0&1&0&0\\ 0&0&1&1 \end{bmatrix}.\] |
Comments
Post a Comment