说明:Matrix Methods in Data Mining and Pattern Recognition 读书笔记ide
在前一章的最小二乘的问题中,咱们知道不恰当的基向量会出现条件数过大,系统防干扰能力差的现象,这实际上和基向量的正交性有关。this
两个向量的内积若是是零, 那么就说这两个向量是正交的,在三维空间中,正交的两个向量相互垂直。若是相互正交的向量长度均为 1, 那么他们又叫作标准正交基。idea
正交矩阵则是指列向量相互正交的方阵。标准正交矩阵有具备以下性质:spa
若 P 和 Q 是标准正交矩阵,那么 X = PQ 也是标准正交矩阵。orm
正交矩阵最重要的性质之一是它的变换能够保证一个向量的长度不变,包括 Euclidean lenght , matrix norm 和 Frobenius norm.blog
在以前 coding the matrix 系列博客的第一篇咱们知道,在复平面内,将一个向量逆时针旋转 度角度,只须要在该复数前面乘以
便可,如今咱们要顺时针旋转,利用欧拉公式:博客
假设如今有一个复数: a + i bit
左乘上面公式获得:io
上述运算写成矩阵相乘的形式即为:table
其中,左边的平面旋转矩阵就是一个标准的正交方阵,能够保证旋转后的向量与原来的向量长度相同。
有了 Givens 旋转方法,只要肯定两个坐标之间的夹角,咱们能够将任意向量旋转到单位向量 e1 上,过程以下:
用公式能够表示为:
有性质2推导出这个变换矩阵也是一个标准正交矩阵。
因此,向量长度不变:
如今手头有某一个向量 x, 想经过一个标准正交矩阵 P 将 x 转换为 y,有什么方法能够求出矩阵 P?一种方法是经过上面的旋转一步一步完成,P = G1G2G3。这里,咱们有一个更加快捷的公式,即为 Householder Transformations.
拿上一小节的例子,求转换矩阵 P 的运算过程以下:
运算很简单,能够用笔验证上述过程是否正确。
用维基百科里面的一个图能够将上述运算过程表示成:
The goal is to find a linear transformation that changes the vector into a vector of same length which is collinear to
. We could use an orthogonal projection (Gram-Schmidt) but this will be numerically unstable if the vectors
and
are close to orthogonal. Instead, the Householder reflection reflects through the dotted line (chosen to bisect the angle between
and
). The maximum angle with this transform is at most 45 degrees.