基变换与坐标变换

上一个视频里的例4,我们看到若 \(\vec{a}=\begin{pmatrix}7\\3\\1\end{pmatrix}, \vec{a}_1=\begin{pmatrix}1\\3\\5\end{pmatrix}, \vec{a}_2=\begin{pmatrix}6\\3\\2\end{pmatrix},\vec{a}_3=\begin{pmatrix}3\\1\\0\end{pmatrix}\),那么 \(\vec{a}=\vec{a}_1-2\vec{a}_2+6\vec{a}_3\}\) 。同时,\(\vec{a}=7\vec{e}_1+3\vec{e}_2+\vec{e_3}\)。

我们也证明了,\(\{\vec{a}_1,\vec{a}_2,\vec{a}_3\}\) 也是 \(\mathbb{R}^3\) 的一组基。所以我们看到了,同一个向量,在不同的基下有不同的坐标。这一节,我们要给出不同的基之间的变换公式以及坐标变换公式。

1,基变换:设线性空间 \(\mathcal{V}\) 有两组基 \(\{\vec{a}_1,\vec{a}_2,\cdots,\vec{a}_n\}\) 和 \(\{\vec{b}_1,\vec{b}_2,\cdots,\vec{b}_n\}\),那么它们之间可以相互表示 ,设

\[\begin{cases}\vec{b}_1&=k_{11}\vec{a}_1+k_{21}\vec{a}_2+\cdots+k_{n1}\vec{a}_n=(\vec{a}_1 \quad \vec{a}_2 \quad \cdots \quad \vec{a}_n)\begin{pmatrix}k_{11}\\ k_{21}\\ \vdots\\ k_{n1}\end{pmatrix} \\ \vec{b}_2&=k_{12}\vec{a}_1+k_{22}\vec{a}_2+\cdots+k_{n2}\vec{a}_n=(\vec{a}_1 \quad \vec{a}_2 \quad \cdots \quad \vec{a}_n)\begin{pmatrix}k_{12}\\ k_{22}\\ \vdots\\ k_{n2}\end{pmatrix}\\ \vdots &\qquad\qquad\vdots\\ \vec{b}_n&=k_{1n}\vec{a}_1+k_{2n}\vec{a}_2+\cdots+k_{nn}\vec{a}_n=(\vec{a}_1 \quad \vec{a}_2 \quad \cdots \quad \vec{a}_n)\begin{pmatrix}k_{1n}\\ k_{2n}\\ \vdots\\ k_{nn}\end{pmatrix}\end{cases}\]

我们可以把上面的结果写成矩阵的形式:

\[(\vec{b}_1\quad \vec{b}_2\quad\cdots\quad\vec{b}_n)=(\vec{a}_1\quad \vec{a}_2\quad\cdots\quad\vec{a}_n)\begin{pmatrix}k_{11}&\cdots&k_{1n}\\ \vdots&&\vdots\\ k_{n1}&\cdots&k_{nn}\end{pmatrix}=(\vec{a}_1\quad \vec{a}_2\quad\cdots\quad\vec{a}_n)P\]

这里 \(P=\begin{pmatrix}k_{11}&\cdots&k_{1n}\\ \vdots&&\vdots\\ k_{n1}&\cdots&k_{nn}\end{pmatrix}\),称为从基 \(\{\vec{a}_1,\vec{a}_2,\cdots,\vec{a}_n\}\) 到基 \(\{\vec{b}_1,\vec{b}_2,\cdots,\vec{b}_n\}\) 的过渡矩阵。反之,我们有\[(\vec{a}_1\quad \vec{a}_2\quad\cdots\quad\vec{a}_n)=(\vec{b}_1\quad \vec{b}_2\quad\cdots\quad\vec{b}_n)P^{-1}\]

2,坐标变换:我们导出坐标变换的公式。设 \(\vec{x}\) 在基 \(\{\vec{a}_1,\vec{a}_2,\cdots,\vec{a}_n\}\) 下的坐标为 \((x_1,x_2,\cdots,x_n)\),在基 \(\{\vec{b}_1,\vec{b}_2,\cdots,\vec{b}_n\}\) 下的坐标为 \((y_1,y_2,\cdots,y_n)\),即

\[\begin{align*}\vec{x}&=x_1\vec{a}_1+x_2\vec{a}_2+\cdots+x_n\vec{a}_n\\&=y_1\vec{b}_1+y_2\vec{b}_2+\cdots+y_n\vec{b}_n\end{align*}\]

则 \[\vec{x}=x_1\vec{a}_1+x_2\vec{a}_2+\cdots+x_n\vec{a}_n=(\vec{a}_1\quad \vec{a}_2\quad\cdots\quad\vec{a}_n)\begin{pmatrix}x_1\\x_2\\ \vdots\\ x_n\end{pmatrix}=(\vec{b}_1\quad \vec{b}_2\quad\cdots\quad\vec{b}_n)P^{-1}\begin{pmatrix}x_1\\x_2\\ \vdots\\ x_n\end{pmatrix}\]

\[\vec{x}=b_1\vec{b}_1+y_2\vec{b}_2+\cdots+y_n\vec{b}_n=(\vec{b}_1\quad \vec{b}_2\quad\cdots\quad\vec{b}_n)\begin{pmatrix}y_1\\y_2\\ \vdots\\ y_n\end{pmatrix}=(\vec{a}_1\quad \vec{a}_2\quad\cdots\quad\vec{a}_n)P\begin{pmatrix}y_1\\y_2\\ \vdots\\ y_n\end{pmatrix}\]

比较这两式,我们得到

\[\begin{pmatrix}x_1\\x_2\\ \vdots\\ x_n\end{pmatrix}=P\begin{pmatrix}y_1\\y_2\\ \vdots\\ y_n\end{pmatrix},\qquad \begin{pmatrix}y_1\\y_2\\ \vdots\\ y_n\end{pmatrix}=P^{-1}\begin{pmatrix}x_1\\x_2\\ \vdots\\ x_n\end{pmatrix}\]

注意基变换公式与坐标变换公式是相反的。

我们来看一个基变换和坐标变换的例子。

例1,在 \(P_3(x)\) 中取两组基

\[\{\vec{a}_1=x^3+2x^2-x,\vec{a}_2=x^3-x^2+x+1,\vec{a}_3=-x^3+2x^2+x+1,\vec{a}_4=-x^3-x^2+1\}\]

\[\{\vec{b}_1=2x^3+x^2+1,\vec{b}_2=x^2+2x+2,\vec{b}_3=-2x^3+x^2+x+2,\vec{b}_4=x^3+3x^2+x+2\}\]

求两组基下的坐标变换公式。

解:直接求这两组基的过渡矩阵太过于复杂,我们利用标准基来求过渡矩阵。

因为 \[(\vec{a}_1\quad\vec{a}_2\quad\vec{a}_3\quad\vec{a}_4)=(x^3\quad x^2\quad x\quad 1)\begin{pmatrix}1&1&-1&-1\\ 2&-1&2&-1\\-1&1&1&0\\0&1&-1&1\end{pmatrix}=(x^3\quad x^2\quad x\quad 1)A\]

\[(\vec{b}_1\quad\vec{b}_2\quad\vec{b}_3\quad\vec{b}_4)=(x^3\quad x^2\quad x\quad 1)\begin{pmatrix}2&0&-2&1\\1&1&1&3\\0&2&1&1\\1&2&2&2\end{pmatrix}=(x^3\quad x^2\quad x\quad 1)B\]

从第一式可以得到 \((x^3\quad x^2\quad x\quad 1)=(\vec{a}_1\quad\vec{a}_2\quad\vec{a}_3\quad\vec{a}_4)A^{-1}\)。代入第二式,得到

\[(\vec{b}_1\quad\vec{b}_2\quad\vec{b}_3\quad\vec{b}_4)=(\vec{a}_1\quad\vec{a}_2\quad\vec{a}_3\quad\vec{a}_4)A^{-1}B\]

所以从基 \(\{\vec{a}_1,\vec{a}_2,\vec{a}_3,\vec{a}_4\}\) 到基 \(\{\vec{b}_1,\vec{b}_2,\vec{b}_3,\vec{b}_4\}\) 的过渡矩阵为 \(P=A^{-1}B\)。从而

\[\begin{pmatrix}x_1\\x_2\\ \vdots\\ x_n\end{pmatrix}=A^{-1}B\begin{pmatrix}y_1\\y_2\\ \vdots\\ y_n\end{pmatrix},\qquad \begin{pmatrix}y_1\\y_2\\ \vdots\\ y_n\end{pmatrix}=B^{-1}A\begin{pmatrix}x_1\\x_2\\ \vdots\\ x_n\end{pmatrix}\]