机器学习基础1--

赔率

浔阳江张顺400自由泳赛, 宋江开赌场做庄,规定张横赔率3张顺赢 赔率为2。假定不存平局李逵下注 10两。比赛结束后,若最张横赢,则付赌徒李逵30两(10×3),赌资10两归庄家宋江所有,即李逵20两。若张顺赢,赌资10两归庄家宋江所有,即李逵10两。

假定所有赌徒中,共a元买张横b元买张 顺,则开赛前宋江收入为a+b开赛后的赔付期望为:

从上述结论知:使用y=1/p作为赔率,会使 得庄家在期望上不赔不赚。

这即“公平赔率”:yfair

——没有利润,这显然庄家希望到的

案例

 

计算

拼团人数当时是1026人,尚有两天结束,根据历史先验,假1天参团人数为100人,则最终参团人数为1226左右。考虑到312为星期日,参团人数或许略低,因此大体参 团区间可能是[1180,1230]

 

Pandas

1.Fuzzywuzzy - Levenshtein distance 做数据清洗,尤其是做字符串的替换。

2.模糊查询与替换。

鸢尾数据集

鸢尾花数据集或许是最 名的 式识 测试 据。
早在1936 年,模式识别的先驱 Fisher 就在论文“ The use of  multiple measurements in taxonomic problems” 中使用了它 ( 直至今日该论文仍然被频繁引 )
该数据集包括 3 个鸢 花类 ,每 类别 50 个样 本。其中一个类别是与 外两 线性 分的 而另 外两类不能线性可分。
由于Fisher 的最原始数据集存在两个错 (35 号和 38 号样本) ,实验中我们使用的是修正过 数据。

 

 

ggg