矩阵的运算

前面我们通过求解线性方程组导出了矩阵的概念,也看到了矩阵的概念在求线性方程组中的重要应用。但是矩阵它有它自身的理论。这一节主要叙述矩阵的运算。

1,矩阵的加法:两个同型矩阵 \(A_{m\times n}, B_{m\times n}\) 相加,等于它们对应位置上的元素相加。即若 \(A_{m\times n}+B_{m\times n}=C_{m\times n}\),则 \(c_{ij}=a_{ij}+b_{ij}\)。若我们简记 \[A_{m\times n}=(a_{ij}), B_{m\times n}=(b_{ij}), C_{m\times n}=(c_{ij})\]

则 \(A_{m\times n}+B_{m\times n}=(a_{ij}+b_{ij})\)。同理我们可以定义矩阵的相减。\(A_{m\times n}-B_{m\times n}=(a_{ij}-b_{ij})\)

注意:只有同型的矩阵才能相加。

2,矩阵的数乘:将矩阵乘以一个数,等于矩阵的每一个元素乘以这个数。即\[\lambda A=(\lambda a_{ij})\]或者 \[A=\begin{pmatrix}a_{11}&a_{12}&\cdots&a_{1n}\\ a_{21}&a_{22}&\cdots&a_{2n}\\ \vdots&\vdots&&\vdots\\ a_{m1}&a_{m2}&\cdots&a_{mn}\end{pmatrix}\quad \Rightarrow\quad \lambda A=\begin{pmatrix}\lambda a_{11}&\lambda a_{12}&\cdots&\lambda a_{1n}\\ \lambda a_{21}&\lambda a_{22}&\cdots&\lambda a_{2n}\\ \vdots&\vdots&&\vdots\\ \lambda a_{m1}&\lambda a_{m2}&\cdots&\lambda a_{mn}\end{pmatrix}\]

矩阵的加法与数乘满足交换律与结合律,我们列举如下:

  • \(A+B=B+A\);
  • \((A+B)+C=A+(B+C)\);
  • \(A+(-A)=0\);
  • \((kl)A=k(lA)\);
  • \((k+l)A=kA+kB\);
  • \(k(A+B)=kA+kB\)。

3,矩阵的乘法:矩阵的乘法运算定义\[A_{m\times n}\times B_{n\times l}=C_{m\times l}\]其中 \(C_{m\times l}\) 中的元素 \(c_{ij}=\sum_{k=1}^n a_{ik}b_{kj}\)。矩阵的乘法一般简记为 \(AB\)。

这个定义,我们只需要记住两点:

  • 左边的矩阵的列数要等于右边矩阵的行数才可以相乘。结果是左边矩阵的行数,右边矩阵的列数。
  • \(A\) 中第 \(i\) 行的元素乘以 \(B\) 的第 \(j\) 列的元素,然后再相加, 为 \(C\) 中第 \(i\) 行第 \(j\) 列的元素。简单记为 \(i\) 行乘以 \(j\) 列。

我们用例题来理解这个定义。

例1:设 \(A=\begin{pmatrix}1&0&-1\\ 1&1&-3\end{pmatrix},B=\begin{pmatrix}0&3\\ 1&2\\ 3&1\end{pmatrix}\),求 \(A\times B, B\times A\)。

解:从我们前面的说明,\(A\) 的第一行乘以 \(B\) 的第一列,等于新矩阵的第一行第一列元素;\(A\) 的第一行乘以 \(B\) 的第二列,等于新矩阵的第一行第二列元素;\(A\) 的第二行乘以 \(B\) 的第一列,等于新矩阵的第二行第一列元素。依此类推。

所以

\[A\times B=\begin{pmatrix}1&0&-1\\ 1&1&-3\end{pmatrix}\begin{pmatrix}0&3\\ 1&2\\ 3&1\end{pmatrix}=\begin{pmatrix}-3&2\\-8&2\end{pmatrix}\]

\[B\times A=\begin{pmatrix}0&3\\ 1&2\\ 3&1\end{pmatrix}\begin{pmatrix}1&0&-1\\ 1&1&-3\end{pmatrix}=\begin{pmatrix}3&3&9\\ 3&2&-8\\ 4&1&-6\end{pmatrix}\]

这里我们看到,\(AB\ne BA\)。一般的情况下,\(AB\ne BA\),这是我们需要注意的地方。

4,矩阵的转置:若 \(A=(a_{ij})\),则它的转置 \(A^T=(a_{ji})\)。

转置就是将矩阵的行列互换,行写成列,列写成行。

例:\(A=\begin{pmatrix}1&0&-1\\ 1&1&-3\end{pmatrix}\),则 \(A^T=\begin{pmatrix}1&1\\ 0&1\\ -1&-3\end{pmatrix}\)

转置的运算法则:

  • \((A^T)^T=A\);
  • \((A+B)^T=A^T+B^T\);
  • \((\lambda A)^T=\lambda A^T\);
  • \((AB)^T=B^TA^T\)。

前面几个法则都是显然的,直接利用转置的定义就可以证明。我们只证明最后一个法则。

证明:我们记 \(C=(c_{ij})\),由矩阵的乘法定义, \(c_{ij}=\sum_{k=1}^n a_{ik}b_{kj}\)。

我们记 \(D=B^TA^T=d_{ij}\)。\(B^T\) 的第 \(i\) 行为 \(B\) 的第 \(i\) 列,为 \((b_{1i}, b_{2i}, \cdots, b_{ni})\)。

而 \(A^T\) 的第 \(j\) 列为 \(A\) 的第 \(j\) 行,为 \((a_{j1},a_{j2}, \cdots,a_{jn} )^T\)。所以 \[d_{ij}=\sum_k^{n}b_{ki}a_{jk}=\sum_{k=1}^na_{jk}b_{ki}=c_{ji}\]

所以 \(D=C^T\),也就是 \(B^TA^T=(AB)^T\)。