矩阵的运算 – 四都教育

前面我们通过求解线性方程组导出了矩阵的概念，也看到了矩阵的概念在求线性方程组中的重要应用。但是矩阵它有它自身的理论。这一节主要叙述矩阵的运算。

1，矩阵的加法：两个同型矩阵 \(A_{m\times n}, B_{m\times n}\) 相加，等于它们对应位置上的元素相加。即若 \(A_{m\times n}+B_{m\times n}=C_{m\times n}\)，则 \(c_{ij}=a_{ij}+b_{ij}\)。若我们简记 \[A_{m\times n}=(a_{ij}), B_{m\times n}=(b_{ij}), C_{m\times n}=(c_{ij})\]

则 \(A_{m\times n}+B_{m\times n}=(a_{ij}+b_{ij})\)。同理我们可以定义矩阵的相减。\(A_{m\times n}-B_{m\times n}=(a_{ij}-b_{ij})\)

注意：只有同型的矩阵才能相加。

2，矩阵的数乘：将矩阵乘以一个数，等于矩阵的每一个元素乘以这个数。即\[\lambda A=(\lambda a_{ij})\]或者 \[A=\begin{pmatrix}a_{11}&a_{12}&\cdots&a_{1n}\\ a_{21}&a_{22}&\cdots&a_{2n}\\ \vdots&\vdots&&\vdots\\ a_{m1}&a_{m2}&\cdots&a_{mn}\end{pmatrix}\quad \Rightarrow\quad \lambda A=\begin{pmatrix}\lambda a_{11}&\lambda a_{12}&\cdots&\lambda a_{1n}\\ \lambda a_{21}&\lambda a_{22}&\cdots&\lambda a_{2n}\\ \vdots&\vdots&&\vdots\\ \lambda a_{m1}&\lambda a_{m2}&\cdots&\lambda a_{mn}\end{pmatrix}\]

矩阵的加法与数乘满足交换律与结合律，我们列举如下：

\(A+B=B+A\);
\((A+B)+C=A+(B+C)\)；
\(A+(-A)=0\);
\((kl)A=k(lA)\)；
\((k+l)A=kA+kB\);
\(k(A+B)=kA+kB\)。

3，矩阵的乘法：矩阵的乘法运算定义\[A_{m\times n}\times B_{n\times l}=C_{m\times l}\]其中 \(C_{m\times l}\) 中的元素 \(c_{ij}=\sum_{k=1}^n a_{ik}b_{kj}\)。矩阵的乘法一般简记为 \(AB\)。

这个定义，我们只需要记住两点：

左边的矩阵的列数要等于右边矩阵的行数才可以相乘。结果是左边矩阵的行数，右边矩阵的列数。
\(A\) 中第 \(i\) 行的元素乘以 \(B\) 的第 \(j\) 列的元素，然后再相加，为 \(C\) 中第 \(i\) 行第 \(j\) 列的元素。简单记为 \(i\) 行乘以 \(j\) 列。

我们用例题来理解这个定义。

例1：设 \(A=\begin{pmatrix}1&0&-1\\ 1&1&-3\end{pmatrix},B=\begin{pmatrix}0&3\\ 1&2\\ 3&1\end{pmatrix}\)，求 \(A\times B, B\times A\)。

解：从我们前面的说明，\(A\) 的第一行乘以 \(B\) 的第一列，等于新矩阵的第一行第一列元素；\(A\) 的第一行乘以 \(B\) 的第二列，等于新矩阵的第一行第二列元素；\(A\) 的第二行乘以 \(B\) 的第一列，等于新矩阵的第二行第一列元素。依此类推。

所以

\[A\times B=\begin{pmatrix}1&0&-1\\ 1&1&-3\end{pmatrix}\begin{pmatrix}0&3\\ 1&2\\ 3&1\end{pmatrix}=\begin{pmatrix}-3&2\\-8&2\end{pmatrix}\]

\[B\times A=\begin{pmatrix}0&3\\ 1&2\\ 3&1\end{pmatrix}\begin{pmatrix}1&0&-1\\ 1&1&-3\end{pmatrix}=\begin{pmatrix}3&3&9\\ 3&2&-8\\ 4&1&-6\end{pmatrix}\]

这里我们看到，\(AB\ne BA\)。一般的情况下，\(AB\ne BA\)，这是我们需要注意的地方。

4，矩阵的转置：若 \(A=(a_{ij})\)，则它的转置 \(A^T=(a_{ji})\)。

转置就是将矩阵的行列互换，行写成列，列写成行。

例：\(A=\begin{pmatrix}1&0&-1\\ 1&1&-3\end{pmatrix}\)，则 \(A^T=\begin{pmatrix}1&1\\ 0&1\\ -1&-3\end{pmatrix}\)

转置的运算法则：

\((A^T)^T=A\);
\((A+B)^T=A^T+B^T\);
\((\lambda A)^T=\lambda A^T\);
\((AB)^T=B^TA^T\)。

前面几个法则都是显然的，直接利用转置的定义就可以证明。我们只证明最后一个法则。

证明：我们记 \(C=(c_{ij})\)，由矩阵的乘法定义， \(c_{ij}=\sum_{k=1}^n a_{ik}b_{kj}\)。

我们记 \(D=B^TA^T=d_{ij}\)。\(B^T\) 的第 \(i\) 行为 \(B\) 的第 \(i\) 列，为 \((b_{1i}, b_{2i}, \cdots, b_{ni})\)。

而 \(A^T\) 的第 \(j\) 列为 \(A\) 的第 \(j\) 行，为 \((a_{j1},a_{j2}, \cdots,a_{jn} )^T\)。所以 \[d_{ij}=\sum_k^{n}b_{ki}a_{jk}=\sum_{k=1}^na_{jk}b_{ki}=c_{ji}\]

所以 \(D=C^T\)，也就是 \(B^TA^T=(AB)^T\)。