线性代数笔记32——线性变换及对应矩阵

  原文:https://mp.weixin.qq.com/s/qCmstZdzCy1WCfBAkEZEoA微信

  线性变换这个词在线性代数中常常被说起,每一个线性变换的背后都有一个矩阵。矩阵的概念比较直观,相比之下,线性变换就显得抽象了。函数

线性变换

  抛开矩阵,咱们从变换的角度讨论投影。经过T变换,使平面内的一个向量投影到一条直线上:学习

  T就像一个函数:给定一个输入向量,通过T的变换,输出成直线上的投影,过去咱们一直用更专业的“映射”称呼这种变换关系。下图中vw是R2空间内的向量,经过T变换变成了直线上的投影,即T(v)和T(w):spa

  

  变换的关系有不少,而线性代数只讨论线性变换。若是T表示一个线性变换关系,对于任意向量vw以及标量c,线性变换应该保证下面两个运算的不变性,加法不变性和数乘不变性,这一点和线性组合相似:3d

  把两者结合:blog

  顺便说一下,投影变换是一种线性变换。get

判断线性变换

  判断一个变换是不是线性变换其实并不困难,只要判断这个变换是否知足加法不变性和数乘不变性便可。基础

反例1:平移整个平面

  假设某个变换关系T是平面沿着某个方向平移v0,也就是说对于平面内的任意向量v,都有T(v) = v + v0,T变换是不是线性变换?二维码

  这个看起来很简单的变换并非线性变换,它违背了线性变换的两个不变性,以数乘不变性为例:方法

  线性变换的不变性要求对输入空间内的任意向量都成立,固然也包括零向量,所以一个更简单的判断方法就是使用零向量。数乘不变性对于零向量来讲将有T(0) = 0,但本例中T(0) = v0,因此说“平移”变换不是线性变换。

反例2:求向量的长度

  变换关系T(v) = ||v||是不是线性变换?

  T变换将产生维度的变化。假设v是一个三维向量,通过T的变换将变成一个大于等于0的实数,也就是一维向量:

  虽然本例知足T(0) = 0,可是对于数乘不变性来讲,若是c是负数,那么T(cv) ≠ cT(v),所以本例不是线性变换。

正例1:旋转变换

  变换关系T:R2→R2是将一个二维空间的向量旋转45°,这个变换是不是线性变换?

  答案是确定的,它符合线性变换的两个不变性。

  即便去掉坐标轴,依然可以清晰地描述这个变换,下图是对二维平面内的图形进行旋转:

正例2:线性变换与矩阵

  到目前为止,线性变换尚未和矩阵产生任何关系。如今有一个变换关系是矩阵乘以一个向量,T(v) = Av,其中A是一个矩阵。根据矩阵乘法的性质:

  这符合线性变换的两个判据,所以矩阵乘以向量是一个线性变换。这意味着选中一个矩阵,用它乘以平面上的全部向量,将获得一系列线性变换后的结果,即整个平面经过矩阵乘法发生了变换,这也是一个值得研究的结果。

  如今有一个矩阵:

  若是用A乘以一个R2空间的向量v——固然,A是2×2矩阵,它也只能乘以一个R2空间的向量——将把v线性变换成另外一个向量,变换后的向量的x份量不变,y份量与v的y份量相反:

  

描述线性变换

  咱们的目的是理解线性变换,而理解线性变换的本质是肯定线性变换背后的矩阵,虽然能够在脱离坐标和具体数值的状况下讨论线性变换,可是为了更好地描述,咱们仍然有必要引入坐标系。

  假设有一个三维向量,可以经过某种线性变换变成二维向量,这将是一个怎样的变换?

  用矩阵描述这个关系,T(v) = Avv是三维向量,经过Av变成了二维向量,那么A必定是一个2×3矩阵。任何一个2×3的矩阵均可以将一个三维向量线性变换成二维向量,每个变换都对应一个具体的矩阵。

输入空间的基

  对于平面内特定的向量v1,只要看看T(v1)就能够了解线性变换对它产生的做用。咱们对空间内其它向量的线性变换一样感兴趣,换句话说,咱们想知道线性变换对于整个输入空间的影响。既然向量空间是由线性无关的向量张成的,那么只要知道平面内两个线性无关的向量,就能够了解平面内全部向量线性变换的结果。也就是说,只要知道输入空间的基,就能掌握线性变换对整个输入空间的影响。

  v1,v2……vn是输入空间的一组基向量,把它称之为输入基。只要知道全部输入基的线性变换,就能够知道输入空间内任意向量的线性变换:

坐标

  先来看看什么是坐标。

  Rn空间的坐标是一组数字,这些数字表示Rn空间的给定向量v由多少个基向量组成(基向量线性组合的系数),可是基向量不止一组,若是基向量改变了,坐标也随之改变,所以通常来讲,坐标系创建在标准基的基础之上。例如一个三维空间的向量的坐标是(2,3,4):

  上式能够清晰地看到v是三个标准基向量的线性组合,尽管大多数时候咱们都意识不到这种组合。

  对于线性组合来讲,一旦选定了一组基,坐标也随之肯定。好比对于输入空间的任意一个向量v来讲,均可以用基向量的惟一线性组合表示:

  一旦向量肯定,其线性组合也随之肯定,此时c1, c2 ,…,cn就是该向量的一组肯定的坐标值。

线性变换与矩阵

  咱们的目的是肯定线性变换背后的矩阵,矩阵是与坐标有关的(矩阵中的元素是肯定的值),而线性变换与坐标无关。如今的问题是,如何把一个与坐标无关的线性变换变成一个与坐标有关的矩阵?

  假设有T可以完成一个向量从n维空间到m维空间的线性变换:

  如今咱们打算构造一个矩阵A来描述这个线性变换。在描述时须要两组基:输入空间的一组基来描述输入向量,以及输出空间的一组基来肯定输出向量的坐标。这两组基一旦肯定,对应的矩阵也就肯定了。

  v1,v2……vn是输入空间的一组基向量,来自Rn空间;w1,w2……wm是输出空间的一组基向量,来自Rm空间。对于每一个输入向量来讲,都有具体的坐标值,该坐标由基向量的线性组合肯定,而后把这些坐标值乘以某个矩阵A,将获得相应的输出向量,输出向量的坐标一样能够由输出空间的基肯定。用矩阵A来表示线性变换,就是将矩阵乘以输入向量的坐标,获得它在输出空间的坐标。

  值得注意的是,线性变换背后的矩阵A乘以的是输入向量的坐标,不是输入向量自己,获得的也是输出向量的坐标,不是输出向量自己。定义一个线性变换T(v),对v = c1v1 + c2v2 + …… + cnvn进行变换,若是用A描述这个变换,则A须要知足:

  

  以后用输出向量的坐标对输出空间的基向量进行线性组合,获得最终的输出向量w

  因为咱们以前一直使用的是标准基,所以感受不到坐标的存在。

  

  咱们以前说过,投影属于线性变换,这里正好用投影的例子对上面的描述加以说明。为了简单起见,将这个投影定义在二维空间,n = m = 2。参与变换的向量都在平面上,让平面上的全部向量都投影在一条直线上。选择输入空间的两个基向量v1v2代替R2空间的标准基向量,其中v1沿着投影方向趴在直线上,v2垂直于投影方向:

  上图特地去掉了坐标系,以强调线性变换与坐标无关。同时,因为输出空间也是R2空间,咱们也一样用v1v2做为输出空间的基,即w1 = v1, w2 = v2

  以前说过,输入空间和输出空间的基一旦肯定,对应的矩阵也就肯定了。如今的问题是,根据v1v2w1w2如何描述这个用于线性变换的变换规则?也就是说,做用于线性变换的矩阵是什么?

  对于出入空间的任意向量v,均可以表示成两个基向量的线性组合:

  咱们事先已经知道投影变换是一种线性变换,它线性变换的两个不变性:

  T表示投影变换,T(v1)是v1的投影,沿着直线方向的向量的投影就是这个向量自己,因此T(v1) = v1v2垂直于直线,它的投影是零向量,因此T(v2) = 0。由此获得了投影变换和这组基向量的关系:

  A用一组特殊的输入基和输出基(垂直于直线和沿着直线方向的一组基)描述了线性变换,将矩阵A乘以输入向量的坐标,获得它在输出空间的坐标:

  若是改用标准坐标基,即:

  投影的直线也须要给出具体的位置,假设T(v)变换是将向量投影到45°的直线上:

  如今尝试找出这个符合要求的矩阵,也就是投影矩阵。根据投影矩阵的公式,能够用向量a = (t, t)表示直线,从而求得投影矩阵:

  

  在使用标准坐标基的时候,坐标值等于向量自己:

  能够看到,若是选择的基向量不一样,即便对于一样的线性变换,背后的矩阵也不一样。在使用标准坐标基的时候,感受不到坐标的存在,此时矩阵乘以输入向量等于输出向量。实际上第一次是以投影矩阵的特征向量为基,获得的矩阵A是投影矩阵P的特征值矩阵。

如何肯定矩阵

  肯定矩阵A的前提是须要知道输入空间和输出空间的基,咱们依然用v1,v2……vnw1,w2……wm表示这两组基。T(v1)表示对输入空间的第一个基向量v1作线性变换,此时矩阵A乘以的坐标是(1,0,…,0),获得的输出坐标是:

  

  当知道线性变换的结果时,就能够经过它的坐标肯定A的第一列。上式实际上描述了这样线性变换:

求导也是一种线性变换

  这里有一个特殊的线性变换——求导,T = d/dx。咱们之因此可以对函数求导,正是由于求导自己是一种线性变换,所以只须要掌握少许的求导法则,就能求出函数线性组合的导数。

  假设输入空间的基是1, x, x2,线性组合是c1 + c2x + c3x2;输出是导数:

  输出空间的基是1, x。这是一个从三维空间到二维空间的线性变换:

  描述这个线性变换的矩阵A知足:


  出处:微信公众号 "我是8位的"

  本文以学习、研究和分享为主,如需转载,请联系本人,标明做者和出处,非商业用途! 

  扫描二维码关注做者公众号“我是8位的”

相关文章
相关标签/搜索