【读书笔记】数学之美（下）

时间 2021-02-19

标签算法 segmentfault 网络分布式函数大数据优化云计算设计事件栏目应用数学繁體版

原文原文链接

做者：LogM算法

本文原载于 https://segmentfault.com/u/logm/articles，不容许转载~segmentfault

文章中的数学公式若没法正确显示，请参见：正确显示数学公式的小技巧网络

本文为《数学之美》的读书笔记。分布式

第19章谈谈数学模型的重要性

数学很重要

第20章谈谈最大熵模型

思想：对一个随机事件的几率分布进行预测时，咱们的预测应当知足所有已知条件，而对未知的状况不要作任何主观假设。
$$P(d|x_1,x_2,...,x_{20}) = \frac{1}{Z(x_1,x_2,...,x_{20})} e^{\lambda_1 (x_1,d)+ \lambda_2(x_2,d)+ ... + \lambda_{20}(x_{20},d)}$$
归一化因子：
$$Z(x_1,x_2,...,x_{20}) = \sum{e^{\lambda_1 (x_1,d)+ \lambda_2(x_2,d)+ ... + \lambda_{20}(x_{20},d)}}$$

第21章拼音输入法的数学原理

语言模型

第22章天然语言处理的教父马库斯和他的优秀弟子们

人物传记

第23章布隆过滤器

本质和哈希表同样，区别是映射函数精心设计过，在可接受的冲突率前提下，减小了内存的占用。

第24章贝叶斯网络（信念网络）

马尔科夫链假设依赖关系是一维的，因此创建一维的链。但实际问题很复杂，不少依赖关系不能用链上的状态转移描述，须要用图描述。
为了计算方便，依旧保持马尔科夫假设成立，即每个状态只与和它直接相连的状态有关。

第25章条件随机场、文法分析及其它

条件随机场：在隐马尔科夫模型中，$x_1,x_2,...$ 为观测值，$y_1,y_2,...$ 为隐状态，$x_i$ 只与 $y_i$ 有关。而条件随机场中，$x_i$ 与 $y_i$、$y_{i-1}$、$y_{i+1}$ 都有关。
能够认为条件随机场是一种特殊的几率图模型。仍遵照马尔科夫假设。条件随机场是无向图。
条件随机场一般用最大熵模型建模：
$$P(x_1,x_2,..,x_n,y_1,y_2,...,y_m) = \frac{e^{f_1+f_2+...+f_k}}{Z}$$

第26章 Viberti 算法

隐马尔科夫模型能够转换为篱笆网络。Viberti 使用动态规划思想在这个网络中求最短路径。

第27章指望最大化算法

第28章逻辑回归和搜索广告

搜索广告的发展：竞价排名 -> 预测用户点击 -> 全局优化
预测广告点击率通常用逻辑回归作

第29章各个击破算法和 Google 云计算的基础

MapReduce

第30章 Google 大脑和人工神经网络

人工神经网络
人工神经网络与贝叶斯网络的关系：函数
- 有向图，且听从马尔科夫假设
- 训练方法类似
- 对于不少模式分类问题，两种方法效果相近
Google 大脑：分布式的人工神经网络

第31章大数据的威力

数据很重要

相关文章

相关标签/搜索

FSFA 读书笔记

MySQL 读书笔记

Nginx读书笔记

读书笔记与思考

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

最新文章

本站公众号

欢迎关注本站公众号,获取更多信息

相关文章

>>更多相关文章<<