统计与分布

统计与分布

概念理解

标准差(Standard Deviation):

公式:标准差
表示一个数据集的离散程度


加权平均值(weight mean ):

当不同数据具有不同的权重,当进行运算的时候需要考虑其权重;
例如:在股东大会上投票的时候,股权越大的股东决定权越大


欧式距离(Eudclidean Distance):

求标准差的过程其实就是在求欧式距离的过程.欧式距离实在古希腊数学家欧几里得的《几何原本》中提到的非常重要的概念.其本意是在一个N维度的空间中求两点的距离,这个距离需要用两个点各自维度的坐标相减然后相加开平方.


曼哈顿距离(Manhattan Distance):

曼哈顿距离是只有加减运算和绝对值运算的计算公式,是另一种描述距离的方法
公式: d(i,j)=|X1-X2|+|Y1-Y2|


高斯分布:

高斯分布又叫做“正态分布”
公式:正态分布


泊松分布:

泊松分布的通俗意思就是在一个标准的时间里,发生这件事的概率是那么发生k次的概率是多少。
公式:泊松分布


伯努利分布:

一种离散分布,只有两种结果:1代表成功,出现的概率为p;0代表失败,出现的概率为q = 1 - p;
伯努利分布的分布律:伯努利分布_1

着重强调

曼哈顿距离:

在早期的计算机图形学中,屏幕是由像素构成,是整数,点的坐标也一般是整数,原因是浮点运算很昂贵,很慢而且有误差,如果直接使用AB的距离,则必须要进 行浮点运算,如果使用AC和CB,则只要计算加减法即可,这就大大提高了运算速度,而且不管累计运算多少次,都不会有误差。因此,计算机图形学就借用曼哈 顿来命名这一表示方法。在我们常用的平面CAD中,都会有格点,他是基本单位,定义了格点大小后,就可以使用整数来表示和运算,不会引入计算误差,又快又精确。
曼哈顿距离
曼哈顿与欧几里得距离: 红、蓝与黄线分别表示所有曼哈顿距离都拥有一样长度(12),而绿线表示欧几里得距离有6×√2 ≈ 8.48的长度。
两个n维向量a(x11,x12,…,x1n)与 b(x21,x22,…,x2n)间的曼哈顿距离:n维向量的曼哈顿距离公式

泊松分布:

泊松分布的参数λ是单位时间(或单位面积)内随机事件的平均发生率。 泊松分布适合于描述单位时间内随机事件发生的次数。
有一篇博客讲的很好:泊松分布与美国枪击案
泊松分布的由来