线性代数应该这样学4:线性映射,单射与满射,零空间与像空间,线性映射基本定理

在本系列中,个人我的看法将使用斜体标注。每篇文章的最后,我将选择摘录一些例题。因为文章是我独自整理的,缺少审阅,不免出现错误,若有发现欢迎在评论区中指正。数组

Part 1:线性映射

线性映射让线性代数再也不是静态的一门学科,有了线性映射,线性空间中的向量就能够动起来。这一章同时也在告诉读者,向量不仅是狭义的数组ide

线性映射(linear map)\(V\)\(W\)的线性映射是具备下列性质的函数\(T:V\to W\)函数

  1. 加性(additivity):\(\forall u,v\in V\),有\(T(u+v)=Tu+Tv\)
  2. 齐性(homogeneity):\(\forall \lambda \in\mathbb{F}\)\(v\in V\),有\(T(\lambda v)=\lambda (Tv)\)

注意线性映射的加性和齐性是缺一不可的,它们并没有相互包含的关系学习

线性映射的集合 \(\mathcal L(V,W)\)表明从\(V\)\(W\)的全部线性映射。spa

\(\mathcal L(V,W)\)中,每个线性映射\(T\)是一个集合内的元素,要搞清楚集合的基本元素是什么对象

因为\(V,W\)都是线性空间,因此不可避免地要讨论线性空间的维数和基。能够直观地想象一下,若是一个线性映射\(T\)肯定了集合中每个基向量\(v_1,\cdots,v_n\)的取值,那么\(V\)中的任何向量\(v\)\(W\)中的像\(Tv\)也随之肯定,由于\(v\)只能由\(v_1,\cdots,v_n\)惟一表示。这个性质直接引出了下面的定理。ci

线性映射与基\(v_1,\cdots,v_n\)\(V\)的基,\(w_1,\cdots,w_n\in W\),则存在惟一一个线性映射\(T:V\to W\)使得对任意\(j=1,\cdots,n\),都有it

\[Tv_j=w_j. \]

这里须要先说明两个线性映射相等指的是什么,若是两个线性映射把任意\(V\)中的\(v\)都映射到同一个像上,就称它们是同一个线性映射。从咱们刚才的分析来看,只要两个线性映射对全部基的成像都相同,它们就是同一个线性映射class

首先证实这样的线性映射存在。定义\(T\)基础

\[T(c_1v_1+\cdots+c_nv_n)=c_1w_1+\cdots+c_nw_n, \]

显然只要取\(c_i=1\),当\(j\ne i\)\(c_j=0\),就有\(Tv_j=w_j\)。下验证\(T\in\mathcal L(V,W)\),即知足加性和齐性。首先\(\forall \lambda \in\mathbb{F}\)\(v=c_1v_1+\cdots+c_nv_n\),有

\[T(\lambda v)=T(\lambda c_1v_1+\cdots+\lambda c_nv_n)=\lambda T(c_1v_1+\cdots+c_nv_n)=\lambda Tv, \]

另外对于\(u=a_1v_1+\cdots+a_nv_n\),有

\[T(u+v)=(a_1+c_1)Tv_1+\cdots+(a_n+c_n)Tv_n=Tu+Tv. \]

这里写得很简略,展开之后能够当即得出,就不详叙了。接下来要证实这样的线性映射是惟一的,即任何\(S\in \mathcal L(V,W)\),若是它知足\(Sv_j=w_j\),则\(\forall v=c_1v_1+\cdots+c_nv_n\),有

\[Sv=c_1Sv_1+\cdots+c_nSv_n=c_1w_1+\cdots+c_nw_n=Tv, \]

\(S=T\)

刚才咱们所构建的\(\mathcal L(V,W)\)只是一个集合,一个集合若是不具备运算,那么集合内部就没有结构,只是一个元素的集合体。如今,咱们能够给\(\mathcal L(V,W)\)内定义运算,从而使它具备更多的性质。

\(\mathcal L(V,W)\)上的加法和标量乘法

  1. 定义\(S+T\)\(V\)\(W\)的线性映射,知足对一切\(v\)都有

    \[(S+T)v=Sv+Tv. \]

  2. 定义\(\lambda T\)\(V\)\(W\)的线性映射,知足对一切\(v\)都有

    \[(\lambda T)v=\lambda (Tv). \]

这里须要思考,这样定义出来的\(S+T\)\(\lambda T\)是不是线性映射(实际上确定是,可是须要验证)。同时,要将\(\mathcal L(V,W)\)上的加法、标量乘法与线性映射的加性、齐性区分开,这两个是彻底不一样的东西

加上了定义以后,咱们能够验证\(\mathcal L(V,W)\)是一个线性空间。回顾线性空间的定义条件,加法、乘法、交换性、结合性、分配性质都是容易验证的,乘法单位元也是显然的,而加法单位元应该是\(0\)映射:\(\forall v,0v=0\)。要注意,这里第一个\(0\)既不是\(0\)向量,也不是标量\(0\),而是一个线性映射:\(0\in\mathcal L(V,W)\),它将\(v\)上的全部向量映射到\(W\)空间的加法单位元\(0\)

线性映射的乘积(product of linear maps)\(L\in\mathcal L(U,V)\)\(S\in\mathcal L(V,W)\),则定义线性映射的乘积\(ST\)为:

\[\forall u\in U,\quad ST(u)=S(Tu)\in W. \]

注意到,若是咱们把每个线性映射当作线性空间里的一个向量,通常的向量乘积是没有定义的,但线性映射却能够定义乘积,这是它与通常向量的不一样之处。实际上,线性映射也属于特殊的一种函数,因此线性映射的乘积等价于函数的复合

\(ST\)是线性映射:线性映射的乘积仍然是一个线性映射。

\(\forall u_1,u_2\in U\)\(\lambda \in\mathbb{F}\)

\[ST(u_1+u_2)=S[T(u_1+u_2)]=S(Tu_1+Tu_2)=STu_1+STu_2,\\ ST(\lambda u)=S[T(\lambda u)]=S[\lambda (Tu)]=\lambda S(Tu)=\lambda STu. \]

\(ST\)做为映射知足加性和齐性,是线性映射。

咱们把线性映射当作一个向量,可是相乘的两个向量并不属于同一个向量空间,乘出的结果也并不属于原来两个向量空间之一(广义来讲,即不考虑\(\mathcal L(V,V)\)的特例),因此它与线性空间中定义的加法又不属于同一种运算类型。

线性映射乘积的代数性质 如下性质有助于对线性映射进行复合。

  1. 结合性(associativity):若是如下乘积都是有意义的,则

    \[(T_1T_2)T_3=T_1(T_2T_3). \]

    这里\(T_1,T_2\)\(T_3\)都是线性映射。

  2. 单位元(identity):存在恒等映射\(I_V,I_W\),使得\(\forall T\in\mathcal L(V,W)\)

    \[I_WT=TI_V=T. \]

    在学习的初级阶段,写出映射乘积的存在条件仍是颇有必要的

  3. 分配性质(distributive properties):对\(T,T_1,T_2\in\mathcal L(U,V)\)\(S,S_1,S_2\in\mathcal L(V,W)\),成立

    \[(S_1+S_2)T=S_1T+S_2T,\\ S(T_1+T_2)=ST_1+ST_2. \]

通常要注意,线性映射的乘法不可交换,即对于通常函数也有\(f[g(x)]\ne g[f(x)]\)同样。对于那些特别可交换的线性映射对,称它们为可交换的

结合性:\(\forall v\),这里\(v\)落在\(L_3\)的定义域内,则

\[(T_1T_2)T_3v=(T_1T_2T_3)v=T_1(T_2T_3)v, \]

故结合性成立。这里的每一个等号都是基于线性映射乘法的定义的,不妨回顾一下。

单位元:\(\forall v\in V\)

\[I_WTv=I_W(Tv)=Tv,\\ TI_V v=T(I_Vv)=Tv, \]

\(I_WT=TI_V=T\)

分配性质:\(\forall v\in V\)

\[(S_1+S_2)Tv=(S_1+S_2)(Tv)=S_1Tv+S_2Tv=(S_1T+S_2T)v,\\ S(T_1+T_2)v=S(T_1v+T_2v)=ST_1v+ST_2v=(ST_1+ST_2)v. \]

对于第一行,第一个等号是线性映射乘法定义,第二个等号是线性映射加法定义,第三个等号是映射的线性性。对于第二行,第一个等号是线性映射加法定义,第二个等号是映射的线性性,第三个等号也是线性映射加法定义。

最后书上给出一个实用的定理,这个定理经常能够直接证实映射不是线性的。

线性映射对加法单位元\(T\in\mathcal L(V,W)\),则\(T(0)=0\)

\[T(0)=T(0+0)=T(0)+T(0), \]

\(T(0)=0\)

Part 2:零空间与值域

能够说,本节中提到的零空间、值域、单射满射都是彼此相连的一个总体,它们之间具备许多联系,共同构成线性映射的结构基础。

零空间(null space) 对于\(T\in\mathcal L(V,W)\)\(T\)的零空间指的是\(V\)中那些被\(T\)映射为\(0\)的向量构成的集合:

\[\mathrm{null}{T}=\{v\in V:Tv=0\}. \]

零空间也被称为核空间(kernel)

零空间之因此能被称为空间,是由于零空间也是一个向量空间,知足加法与标量的封闭性。显然,若是零空间不是线性空间,也没有研究它的价值。

零空间是子空间\(T\in\mathcal L(V,W)\),则\(\mathrm{null}T\)\(V\)的子空间。

\(u,v\in\mathrm{null}T\),则

\[T(u+v)=Tu+Tv=0,\quad u+v\in\mathrm{null}T. \]

对于\(\lambda \in\mathbb{F}\),有

\[T(\lambda v)=\lambda Tv=0,\quad \lambda v\in\mathrm{null}T. \]

最后,因为\(T(0)=0\),因此\(0\in\mathrm{null}T\)。向量空间的三大条件得以验证。

单射(injective) 若是\(Tu=Tv\Leftrightarrow u=v\),则称\(T\in\mathcal L(V,W)\)是单射。

单射的概念很重要,联想可以一一肯定自变量和因变量的函数——可逆函数,它与单射就很相似

单射的等价条件\(T\in\mathcal L(V,W)\),则\(T\)是单射等价于\(\mathrm{null}T=\{0\}\)

这是一个十分重要的定理

已有\(\{0\}\subset\mathrm{null}T\)。当\(T\)是单射时,\(\forall v\in \mathrm{null}T\),有

\[Tv=0=T0, \]

结合单射性就获得\(v=0\),即\(\mathrm{null}T= \{0\}\)

反之,若\(\mathrm{null}T=0\),则\(\forall u,v\in V\),若是\(Tu=Tv\),则

\[Tu-Tv=T(u-v)=0, \]

\(u-v=0\),获得\(u=v\),从而证实\(T\)是单射。

值域(range) 对于\(T\in\mathcal L(V,W)\),称\(V\)的值域为全部形如\(Tv(v\in V)\)的向量构成的集合,即

\[\mathrm{range}T=\{Tv:v\in V\}. \]

天然地,值域也应该是一个子空间,但注意对象不一样。显然每个\(Tv\in W\),因此值域是\(W\)的子空间而不是\(V\)的,这点与零空间不一样。

值域是子空间\(T\in\mathcal L(V,W)\),则\(\mathrm{range}T\)\(W\)的子空间。

这个证实虽然简单,但又和零空间的有一些不一样

\(w_1,w_2\in\mathrm{range}T\),则\(\exists v_1,v_2\in V\)\(Tv_1=w_1,Tv_2=w_2\),则

\[w_1+w_2=Tv_1+Tv_2=T(v_1+v_2), \]

因为\(v_1+v_2\in V\),因此\(w_1+w_2\in \mathrm{range}T\)。同理

\[\lambda w_1=\lambda Tv_1=T(\lambda v_1)\in\mathrm{range}T, \]

又由于\(T(0)=0\),因此\(0\in\mathrm{range}T\)。向量空间的三个条件得以验证。

满射(surjective)\(T\in\mathcal L(V,W)\),若是\(\mathrm{range}T=W\),则称\(T\)是满射。

单射能够类比一一映射,满射则至关于将映射的值域扩充满了,两者一结合,就能获得全空间上的一一映射

须要注意的是,若是\(W'\)\(W\)的非平凡子空间,\(T\in\mathcal L(V,W')\)是满的极可能不意味着\(T\in\mathcal L(V,W)\)上也是满的,即便对\(T\)做解析延拓也不必定,这是由于\(\mathrm{range}T\)受到\(V\)维数限制,咱们能够很容易地证实这一点。

事实上,咱们前面得出了单射与零空间的关系,这里得出了满射与像空间(值域)的关系,这两组关系在形式上对偶,不妨将\(Tu=Tv\Leftrightarrow u=v\)看做单射的衍生性质,而从零空间的角度定义它,这样显得更统一,不过这让“单射”的名字没有那么写实了

线性映射基本定理\(V\)是有限维的,\(T\in\mathcal L(V,W)\),则\(\mathrm{range}T\)是有限维的,且

\[\dim V=\dim\mathrm{null}T+\dim\mathrm{range}T. \]

这个定理揭示了线性映射结构的本质关系——它只会形成信息的丢失,而不会形成信息的增长,由于\(T(0)=0\),而零空间的维数就是信息丢失多少的量度。

\(u_1,\cdots,u_m\)\(\mathrm{null}T\)的基,则\(\dim \mathrm{null}T=m\)。这组基能够扩充成\(V\)的基:

\[u_1,\cdots,u_m,v_1,\cdots,v_n,\quad \dim{V}=m+n. \]

若是等式成立,则\(\dim\mathrm{range}T=n\),天然会猜测\(Tv_1,\cdots,Tv_n\)\(\mathrm{range}T\)的基,这包括张成性与线性无关性两方面。

先证张成性,\(\forall v\in V\),有

\[v=a_1u_1+\cdots+a_m u_m+b_1v_1+\cdots+b_nv_n, \]

\[Tv=T\left(\sum_{j=1}^m a_ju_j+\sum_{j=1}^n b_jv_j \right)=\sum_{j=1}^nb_j Tv_j, \]

所以\(Tv_1,\cdots,Tv_n\)张成\(\mathrm{range}T\)

再证线性无关,令

\[a_1Tv_1+\cdots +a_nTv_n=0, \]

\[T\left(\sum_{j=1}^n a_jv_j\right)=0,\quad \sum_{j=1}^n a_j v_j\in\mathrm{null}T, \]

因此

\[\sum_{j=1}^n a_jv_j=\sum_{j=1}^m b_ju_m, \]

移项后获得\(a_1=\cdots=a_n=b_1=\cdots=b_m=0\),线性无关性得证。

对比线性映射基本定理与和空间维数公式的证实过程,读者应该能捕捉到两者之间的共同点

由线性映射基本定理,直接获得两个推论:

  1. 到更小维数向量空间的线性映射不是单射。
  2. 到更大维数向量空间的线性映射不是满射。

由此结论创建线性方程组求解的关系,是一个直接的推论。事实上,线性方程组的本质就是咱们在例题1中提到的\(T\in\mathcal L(\mathbb{F}^n,\mathbb{F}^m)\)\(n\)是变量个数,\(m\)是约束条件个数,在这里就不展开了。

例题

3.A部分的例题比较简单,毕竟仍是围绕着有限维向量空间的线性映射,只要别忘了有限维向量空间的基就好。3.B部分的例题则主要围绕着线性映射基本定理,还有一些维数的基本关系,只要会利用\(V\)\(W\)的基构造知足条件的线性映射(构造的存在性由“线性映射与基”结论保证),问题基本能够迎刃而解。

第一题(3.A 3)\(T\in\mathcal L(\mathbb{F}^n,\mathbb{F}^m)\),证实存在标量\(A_{j,k}\in\mathbb{F}\),其中\(j=1,\cdots,m\)\(k=1,\cdots,n\),使得对任意\((x_1,\cdots,x_n)\in\mathbb{F}^n\)都有

\[T(x_1,\cdots,x_n)=(A_{1,1}x_1+\cdots+A_{1,n}x_n,\cdots,A_{m,1}x_1+\cdots+A_{m,n}x_n). \]

这题看起来无从入手,可是线性代数嘛,既然是有限维向量空间,那就有穷举的机会,莽就完事了

\(V\)的一组天然基\(e_1,\cdots,e_n\),它在\(T\)下必然拥有一个像,故设

\[T(e_i)=(A_{1,i},A_{2,i},\cdots,A_{m,i}), \]

因为\(V\)中的每个向量均可以被这组基线性表示,不妨设

\[v=x_1e_1+\cdots+x_ne_n, \]

则由\(T\)的线性性,

\[\begin{aligned} T(v)&=T(x_1e_1+\cdots+x_ne_n)\\ &=T(x_1,\cdots,x_n)\\ &=x_1T(e_1)+\cdots+x_nT(e_n)\\ &=(A_{1,1}x_1+\cdots+A_{1,n}x_n,\cdots,A_{m,1}x_1+\cdots+A_{m,n}x_n). \end{aligned} \]

\(v\)的任意性,结论得证。

第二题(3.A 14)\(V\)是有限维的且\(\dim{V}\ge2\),证实存在\(S,T\in\mathcal L(V,V)\),使得\(ST\ne TS\)

这题的关键信息在于\(\dim{V}\ge 2\),于是能够找到两个线性无关向量,围绕他们进行一波构造就能够推出找到这样的\(S,T\)

\(v_1,v_2\)\(V\)中两个线性无关的向量,由于\(\dim V\ge 2\),因此这样的两个向量是能够找到的。

\[Tv_1=v_2,\quad Sv_1=v_1+v_2,\\ Tv_2=0,\quad Sv_2=v_1. \]

\[STv_1=Sv_2=v_1,\\ TSv_1=T(v_1+v_2)=v_2, \]

\(v_1,v_2\)的线性无关性,获得\(STv_1\ne TSv_1\),即\(ST\ne TS\)

第三题(3.B 22)\(U,V\)都是有限维向量空间,并设\(S\in \mathcal L(V,W)\)\(T\in\mathcal L(U,V)\),证实:

\[\dim\mathrm{null}(ST)\le \dim\mathrm{null}S+\dim\mathrm{null}T. \]

万变不离其宗,基扩充在证实维数不等式上依然是永远的神

首先要注意到\(\mathrm{null}T\subset\mathrm{null}(ST)\)。设\(u_1,\cdots,u_m\)\(\mathrm{null}T\)的基,若是\(\mathrm{null}T=\mathrm{null}(ST)\),则不等式已经成立。假设两者不等,则能够扩充为\(\mathrm{null}(ST)\)的基:

\[u_1,\cdots,u_m,u_{m+1},\cdots,u_{n}. \]

知足

\[Tu_{m+1}\ne 0,\cdots,Tu_n\ne 0. \]

现证实\(Tu_{m+1},\cdots,Tu_n\)是线性无关的,即

\[a_{m+1}Tu_{m+1}+\cdots+a_nTu_n=T\left(\sum_{j={m+1}}^{n} a_ju_{j} \right), \]

因此\(\sum_{j=m+1}^{n}a_ju_j\in\mathrm{null}T\),即

\[\sum_{j=m+1}^n a_ju_j=\sum_{k=1}^m b_ku_k, \]

移项获得\(a_{m+1}=\cdots=a_n=0\)(因为\(u_1,\cdots,u_n\)\(\mathrm{null}(ST)\)的基),因此线性无关性得证。又由于\(\mathrm{null}S\)中线性无关组的长度中小于张成组的长度,因此

\[\dim S\ge n-m,\\ \dim\mathrm{null}(ST)=n=n-m+m\le \dim\mathrm{null}S+\dim\mathrm{null}T. \]

第四题(3.B 2六、27)

一、设\(D\in\mathcal L(\mathcal P(\mathbb{R}),\mathcal P(\mathbb{R}))\)使得对每一个很是数多项式\(p\in\mathcal P(\mathbb{R})\)均有\(\mathrm{deg}(Dp)=(\mathrm{deg}p)-1\),这里\(\mathrm{deg}\)指的是多项式的次数,证实\(D\)是满射。

二、设\(p\in\mathcal P(\mathbb{R})\),证实存在多项式\(q\in\mathcal P(\mathbb{R})\)使得

\[5q''+3q'=p. \]

这题本质上和线性方程组是同样的,但因为笔记中对线性方程组的介绍不多,所以将这个例题摘录于此。第二问中的微分算子其实就是第一问中\(D\)的一种显式,能够看做1中结论的直接应用。另外,看到多项式时,应当考虑多项式空间的天然基,本题的主要问题是无限维向量空间的处理

一、由题意,\(\forall n\)

\[\mathrm{deg}Dx^{n+1}=n, \]

显然因为\(Dx,Dx^2,\cdots\)的次数不一样,它们是线性无关的,对任何一个给定的\(j\)

\[\mathrm{span}(Dx,Dx^2,\cdots,Dx^{j+1})=\mathrm{span}(1,x,\cdots,x^j), \]

所以令\(j\to \infty\),有

\[\mathrm{span}(Dx,Dx^2,Dx^3,\cdots)=\mathrm{span}(1,x,x^2,\cdots)=\mathcal P(\mathbb{R}),\\ \mathcal P(\mathbb{R})\subset \mathrm{range}D. \]

又由于对任何多项式\(p\)\(Dp\)还是一个多项式,因此

\[\mathrm{range}D\subset \mathcal P(\mathbb{R}), \]

\(\mathrm{range}D=\mathcal P(\mathbb{R})\),也就是\(D\)是满射。

二、定义降次算子为\(Dp=3p'+5p''\),则由1,\(D\)是满的,因此\(\forall q\in\mathcal P(\mathbb{R})\),一定存在一个\(p\),使得

\[Dp=5p''+3p'=q. \]
相关文章
相关标签/搜索