在本系列中,个人我的看法将使用斜体标注。每篇文章的最后,我将选择摘录一些例题。因为文章是我独自整理的,缺少审阅,不免出现错误,若有发现欢迎在评论区中指正。spa
本节终于进入到熟悉的矩阵,矩阵是线性映射的一种特殊表示,上一章的例题1已经说明了任何\(\mathbb{F}^n\to \mathbb{F}^m\)的线性映射都可以被\(m\times n\)个实数所肯定。但事实上,用矩阵表示线性映射的方式并非这么狭隘的。scala
矩阵(matrix) 设\(m\)和\(n\)都是正整数,\(m\times n\)的矩阵\(A\)是由\(\mathbb{F}\)的元素构成的\(m\)行\(n\)列数表。ip
记号\(A_{j,k}\)表示位于\(A\)的第\(j\)行第\(k\)列的元素,第一个下标表明行,第二个下标表明列。it
线性映射的矩阵(matrix of a linear map) 设\(T\in\mathcal L(V,W)\),并设\(v_1,\cdots,v_n\)是\(V\)的基,\(w_1,\cdots,w_m\)是\(W\)的基。规定\(T\)关于这些基的矩阵为\(m\times n\)矩阵\(\mathcal M(T)\),其中\(A_{j,k}\)知足io
若是这些基不是上下文自明的,则记做\(\mathcal M(T,(v_1,\cdots,v_n),(w_1,\cdots,w_m))\)。class
矩阵只是一个数表,若是不与线性映射关联则矩阵没有任何意义。线性映射的矩阵是依赖于基的,而\(V,W\)中有无限组基,理论上任何一组基都能定义一个线性映射的矩阵,它们是互不相同的。所以,线性映射的矩阵必需要包含关于基的描述,不然将默认为天然基。基础
为了方便记忆,最好将矩阵视为一堆列向量构成的表:可视化
其中每一个\(Tv_k\)是\(Tv_k\)在\((w_1,\cdots,w_m)\)下的坐标,固然,这样的表述是不太严谨的。lambda
\(\mathcal M(T)\)既能够当作是一个矩阵的代号,也能够把\(\mathcal M\)拆分出来,这时候\(\mathcal M\)应当被视为一个将线性映射映射到矩阵空间上的线性映射,即把线性映射\(T\)和矩阵\(\mathcal M(T)\)都视为各自线性空间的向量。map
矩阵加法(matrix addition)与矩阵标量乘法(scalar multiplication of a matrix) 两个矩阵相加只适用于同型矩阵,将其对应元素相加;矩阵的标量乘法将其每一个元素都乘以这个标量倍。
矩阵的线性运算是为了线性映射服务的,这样在一样的基表示下,线性映射的运算就有很简单的可视化表达。
假设\(S,T\in\mathcal L(V,W)\)。若是取\((v_1,\cdots,v_n)\)和\((w_1,\cdots,w_m)\)分别做为\(V,W\)的基,则
\[(S+T)v_k=Sv_k+Tv_k, \]至关于\(\mathcal M(S+T)\)的第\(k\)列是\(Sv_k+Tv_k\),由线性映射的加性,结论容易证实。数乘由齐性同理。
\(\mathbb{F}^{m,n}\) \(\mathbb{F}^{m,n}\)表明全部\(m\times n\)矩阵构成的集合,结合矩阵加法和矩阵标量乘法的定义,它是一个线性空间,且\(\dim \mathbb{F}^{m,n}=mn\)。
\(\mathbb{F}^{m,n}\)是线性空间的证实,只需定义加法单位元\(0\),它指的是全部元素都为\(0\)的\(m\times n\)矩阵,而后加法和数乘在这个空间上的封闭性,是由数域\(\mathbb{F}\)的封闭性保证的。
为证\(\dim \mathbb{F}^{m,n}=mn\),只需找出其一组基,若是令\(e_{i,j}\)为第\(i\)行第\(j\)列为\(1\),其余元素为\(0\)的矩阵,则\(mn\)个这样的矩阵共同构成了\(\dim\mathbb{F}^{m,n}\)的基,它的张成性和线性无关性都很容易证实。
矩阵运算的本质全是线性映射的运算,因此矩阵乘法也应当如此定义。与映射的乘法同样,它依赖于三个空间,故依赖于三组基,接下来的定义使得在一样的基下,线性映射的矩阵乘法等价于映射的乘法。
矩阵乘法(matrix multiplication) 设\(A\)是\(m\times n\)矩阵,\(C\)是\(n\times p\)矩阵,则\(AC\)定义为\(m\times p\)矩阵,其第\(j\)行第\(k\)列元素是
在这样的定义下,对于相同的基,\(\mathcal M(S)\mathcal M(T)=\mathcal M(ST)\)。
设\(\mathcal M(S)=A,\mathcal M(T)=C\),且\(T\in\mathcal L(U,V),S\in\mathcal L(V,W)\),其基分别是\(u_1,\cdots,u_p\),\(v_1,\cdots,v_n\)和\(w_1,\cdots,w_m\),则
\[\begin{aligned} (ST)u_k&=S(Tu_k)\\ &=S\left(\sum_{r=1}^{n}C_{r,k}v_r \right)\\ &=\sum_{r=1}^n C_{r,k}Sv_r\\ &=\sum_{r=1}^n C_{r,k}\sum_{j=1}^m A_{j,r}w_j\\ &=\sum_{j=1}^m\left(\sum_{r=1}^n A_{j,r}C_{r,k} \right)w_j. \end{aligned} \]结论得证。
因为\(ST\ne TS\),因此\(\mathcal M(ST)\ne \mathcal M(TS)\),也就是\(\mathcal M(S)\mathcal M(T)\ne \mathcal M(T)\mathcal M(S)\)。
行矩阵和列矩阵 若\(A\)是\(m\times n\)矩阵,对于\(1\le j\le m\),\(A_{j,\cdot}\)表示\(A\)的第\(j\)行组成的\(1\times n\)矩阵;\(A_{\cdot ,k}\)表示\(A\)的第\(k\)列组成的\(m\times 1\)矩阵。
行矩阵和列矩阵是矩阵分块的基础,它们能为矩阵的乘法运算提供很大的便利。为了应用行矩阵和列矩阵提供的便利,至少要知道行矩阵乘列矩阵等于一个数。
矩阵乘积的元素等于行乘以列,即
矩阵乘积的列等于矩阵乘以列,即
设\(A\)是\(m\times n\)矩阵,\(C\)是\(n\times 1\)矩阵,则\(Ac\)能够当作\(A\)每一列的线性组合,系数是\(c\)的系数,即
这种表达方式将矩阵当作一堆列矩阵按行排列造成的矩阵,有时咱们也称之为列向量。这样考虑的好处是,咱们在线性映射的矩阵定义中,将每一列定义为\(Tv_k\)在\(W\)的基下的系数,所以当\(W\)取天然基时,矩阵天然就是一堆列向量构成的列向量组。
可逆(invertible)与逆(inverse) 线性映射\(T\in\mathcal L(V,W)\)称为可逆的,若是存在\(S\in\mathcal L(W,V)\)使得\(ST=I_V\)且\(TS=I_W\),此时\(S\)称为\(T\)的逆。
注意\(S\)的原像空间和像空间和\(T\)是正好相反的。
逆是惟一的 可逆的线性映射\(T\)必有惟一的逆,记做\(T^{-1}\)。
设\(T\in\mathcal L(V,W)\),\(S_1,S_2\)是它的逆,则
\[S_1=S_1(TS_2)=(S_1T)S_2=S_2. \]
可逆的等价条件 \(T\in\mathcal L(V,W)\)是可逆的等价于\(T\)既是单射又是满射。
这是一个很是重要的定理,给出了一种\(T\)不可逆的情形。同时,基于线性映射基本定理,对于可逆的\(T\in\mathcal L(V,W)\),必有
因此若是一个线性映射的原像空间和像空间维数都不一样,则必不可逆。
证实必要性。若\(T\)可逆,则
\[Tu=Tv\Rightarrow T^{-1}Tu=T^{-1}Tv\Rightarrow u=v, \]这里证实\(T\)是单射。另外,\(\forall w\in W\),有
\[w=TT^{-1}w=T(T^{-1}w),\quad T^{-1}w\in V. \]因此\(w\in\mathrm{range}T\),这里证实\(T\)是满射。
证实充分性。\(\forall w\in W\),存在\(v\in V\)使得\(Tv=w\)。定义一个映射\(S\),知足\(\forall w\in W\),若是\(Tv=w\),就有
\[Sw=v. \]因为\(T\)是单射,因此每一个\(w\)在\(T\)下只有一个原像,所以这样的\(S\)是合理的。
下证实\(S\)是线性的(这一点很容易被遗忘),设\(w_1,w_2\in W\),则由\(S\)的定义方式,有
\[w_1+w_2=Tv_1+Tv_2=T(v_1+v_2),\\ S(w_1+w_2)=v_1+v_2=Sw_1+Sw_2; \]这就验证了\(S\)的加性,齐性能够相似验证。
由\(S\)的定义方式,显然有\(ST=I_V\)。而\(TSw=Tv=w\),说明\(TS=I_W\)。因此\(S=T^{-1}\)。
以上证实的关键就在于构造出\(S\),可是这里写的比较简略,请读者自行扩充。同时,以上的二级补充说明对非线性的状况比较不友好,所以是一个比较粗糙的说明。
如下是书上给出的两个研究无限维线性映射可逆性的例子,由此能够知道
同构(isomorphism) 同构指的是可逆的线性映射。
同构的(isomorphic)向量空间 若两个向量空间之间存在一个同构,则称这两个向量空间是同构的。
上一章中,揭示了对于有限维向量空间,可逆线性映射一定做用在维数相同的向量空间上。下面的定理增强一步,指出了同构存在与维数直接创建关系。
同构向量空间与维数 \(\mathbb{F}\)上两个有限维向量空间同构,当且仅当其维数相同。
必要性已经证实了。
证实充分性只须要构造出这样的同构。设\(v_1,\cdots,v_n\)是\(V\)的基,\(w_1,\cdots,w_n\)是\(W\)的基,定义一个这样的映射:
\[T(c_1v_1+\cdots+v_nv_n)=c_1w_1+\cdots+c_nw_n. \]容易证实\(T\in\mathcal L(V,W)\)。另外构造一个
\[S(c_1w_1+\cdots+c_nw_n)=c_1v_1+\cdots+c_nv_n, \]则也容易证实\(S\in\mathcal L(W,V)\),而且\(ST=I_V\),\(TS=I_W\),这就构造了一个同构。
能够看到,这个证实与可逆的等价条件证实主要差距就在因而否是有限维的。当维数被限定,证实会变得简单。
\(\mathcal L(V,W)\)与\(\mathbb{F}^{m,n}\)同构 若\(\dim V=n,\dim W=m\),则\(\mathcal L(V,W)\)与\(\mathbb{F}^{m,n}\)同构。
这个定理代表,若是给定了矩阵的基,则线性映射与其矩阵之间的关系是可逆的,给定一个矩阵也能够惟一地决定一个线性映射,也就是说:\(\mathcal M\in\mathcal L(\mathcal L(V,W),\mathbb{F}^{m,n})\)做为一个线性映射可逆。(这符号感受套娃起来了)。
即证实\(\mathcal M\)可逆,也就是既单又满。
证实\(\mathcal M\)是单射,等价于证实\(\mathrm{null}\mathcal M=\{0\}\),这里\(\{0\}\)是零映射。设\(T\in\mathcal L(V,W)\),则\(\mathcal M(T)=0\)指\(T\)在给定基下对应的是\(0\)矩阵,即全部\(V\)的基向量都被\(T\)映射到\(W\)中的\(0\)向量,天然\(T\)是一个零映射。(请读者本身理清上面这段话)
证实\(\mathcal M\)是满射,\(\forall A\in \mathbb{F}^{m,n}\),定义这样的一个\(T\in\mathcal L(V,W)\),其中
\[Tv_k=\sum_{j=1}^m A_{j,k}w_j, \]则\(\mathcal M(T)=A\),因此\(\mathcal M\)是满射。
由此结论直接能够获得:
向量的矩阵(matrix of a vector) 设\(v\in V\),并设\(v_1,\cdots,v_n\)是\(V\)的基,则规定\(v\)关于这个基的矩阵是
如今咱们终于把向量与矩阵统一到了一块儿,注意咱们都把向量视为列矩阵。实际上,\(\mathcal M(v)\)的各个元素就是\(v\)在基\((v_1,\cdots,v_n)\)下的坐标。如下结论都是成立的,若是从咱们之前学过的角度来看,这些结论都很显然。
算子(operator) 向量空间到期自身的映射\(T\in\mathcal L(V,V)\)称为算子,将\(\mathcal L(V,V)\)记做\(\mathcal L(V)\)。
对于算子,咱们通常研究有限维向量空间。在有限维的情形,算子的单射与满射是等价的:设\(V\)是有限维的,\(T\in\mathcal L(V)\),则如下陈述等价:
只需由线性映射基本定理:
\[\dim V=\dim \mathrm{null}T+\dim\mathrm{range}T, \]注意到\(\mathrm{null}T\)和\(\mathrm{range}T\)都是\(V\)的子空间便可。
矩阵部分的例题,全都是老掉牙的构造线性映射,只要知道矩阵和线性映射之间的相互转换关系就没什么难的,这里全都不提了。关于3.D的习题,也大可能是思惟存在障碍,难度上可能不是很大,由于基本用书上的结论能够直接解决。
第一题(3.D 2) 设\(V\)是有限维的且\(\dim V>1\)。证实\(V\)上不可逆的算子构成的集合不是\(\mathcal L(V)\)的子空间。
证实某个集合不是向量空间,若是\(0\)元素在子空间内,则通常考虑构造一个不知足加法封闭性的案例。最简单的可逆算子显然是恒等算子。
构造以下的\(T_1\)和\(T_2\):
\[T_1v_1=v_2,\quad T_1v_2=v_2,\\ T_2v_1=v_1-v_2,\quad T_2v_2=0. \]若是\(\dim V>2\),则在其余维度上是恒等的。此时\(T_1\)和\(T_2\)都不是满射(可自行验证),可是
\[T_1+T_2=I_V. \]
第二题(3.D 9) 设\(V\)是有限维的,\(S,T\in\mathcal L(V)\)。证实\(ST\)可逆当且仅当\(S,T\)均可逆。
假设\(T\)不可逆,则\(T\)不是单射,存在\(v_1\)使得\(Tv_1=0\)。则\(STv_1=0\),故\(\mathrm{null}(ST)\ne \{0\}\)。
假设\(S\)不可逆,则\(S\)不是满射,\(\exists w\in V\)使得不存在\(v\),\(Sv=w\),那么\(\forall D\in\mathcal L(V)\)必有\(STDw\ne w\),即任何\(D\)都不是\(ST\)的逆。
第三题(3.D 16) 设\(V\)是有限维的,\(T\in\mathcal L(V)\)。证实:\(T=\lambda I_V\)当且仅当对每一个\(S\in\mathcal L(V)\)都有\(ST=TS\)。
这题比看上去要难,本来我认为应当使用反证法,可是答案却给出了正向证实的方式。其思路就在于,若是\(T=\lambda I_V\),则对任何\(v\),\(v\)与\(Tv\)线性相关。
必要性是显然的。
下证充分性。已知\(ST=TS,\forall S\in\mathcal L(V)\),先证实\(v\)和\(Tv\)必是线性相关的,若是否则,则\(v,Tv\)能够被扩充成一组基:\(v,Tv,u_1,\cdots,u_n\),定义这样的\(S\in\mathcal L(V)\),使得
\[S(av+bTv+c_1u_1+\cdots+c_nu_n)=bv, \]有\(STv=v\)且\(Sv=0\),由\(ST=TS\)获得
\[STv=v=TSv=0, \]这与\(v,Tv\)线性无关矛盾,因此\(v,Tv\)必然是线性相关的,这样就存在一个与\(v\)相关的\(a_v\),使得
\[Tv=a_vv, \]下证\(a_v\)与\(v\)无关,找到另一个\(w\in V\setminus\{0\}\),有\(Tw=a_ww\),下证\(a_v=a_w\)。
当\(v,w\)线性相关时,有\(v=bw\),则
\[a_vv=Tv=bTw=ba_ww=a_wv, \]因此\(a_v=a_w\)。
当\(v,w\)线性无关时,有
\[a_{v+w}(v+w)=T(v+w)=Tv+Tw=a_vv+a_ww, \]移项就获得
\[a_v=a_{v+w}=a_w. \]这说明\(a_v\)与\(v\)无关,故必有\(Tv=av\),即\(T=aI_V\)。
第四题(3.D 17) 设\(V\)是有限维的,且\(\mathcal E\)是\(\mathcal L(V)\)的子空间使得\(\forall S\in \mathcal L(V)\)和\(T\in\mathcal E\),都有\(ST\in\mathcal E\)和\(TS\in\mathcal E\)。证实\(\mathcal E=\{0\}\)或\(\mathcal E=\mathcal L(V)\)。
这题要从\(\mathcal L(V)\)的结构入手,注意到\(\mathcal L(V)\)是一个\(n^2\)维的线性空间。我想,从矩阵角度来作会不会更清晰一些。
必要性是显然的,下证充分性。
设\(e_1,\cdots,e_n\)是\(V\)的一个基,每个线性映射\(T\)对应的矩阵为\(\mathcal M(T)\),\(\mathcal E\)中线性映射对应的矩阵构成的集合是\(\mathcal M(\mathcal E)\)。
取\(T\in\mathcal E,T\ne 0\),则\(T\)对应的矩阵至少含有一个\(0\)元素,不妨设\(\mathcal M(T)_{j,k}\ne 0\)。
记\(\Delta _{a,b}\)指的是第\(a\)行第\(b\)列为\(1\),其它元素为\(0\)的矩阵,则因为\(\Delta_{a,j}\in\mathbb{F}^{n,n}\),
\[\Delta_{a,j}\mathcal M(T)=\Delta_{a,k}, \]因此\(\Delta_{1,k},\cdots,\Delta_{n,k}\in\mathcal M(\mathcal E)\)。对每个\(a\),因为\(\Delta_{k,b}\in\mathbb{F}^{n,n}\),
\[\Delta_{a,k}\Delta_{k,b}=\Delta_{a,b}, \]因此\(\Delta_{a,b}\in\mathbb{F}^{n,n}\)。在证实过程当中,\(a=1,\cdots,n\),\(b=1,\cdots,n\),这就证实了\(\mathcal M(\mathcal E)=\mathbb{F}^{n,n}\)。
因为\(\mathcal L(V)\)与\(\mathbb{F}^{n,n}\)同构,因此将每个矩阵当作线性映射,就能有相同的结论,即\(\mathcal E=\mathcal L(V)\)。