论坛中阿里电面题目

1.LDA算法思想及工做流程,包括讲讲其中细节,如何抽取主题模型算法

(Linear Discriminant Analysis,LDA)线性判别分析,是模式识别经典算法,是在1996年由Belhumeur引入模式识别和人工智能领域的。基本思想是将高维的模式样本投影到最佳鉴别矢量空间,以达到抽取分类信息和压缩特征空间维数的效果,投影后保证模式样本在新的子空间有最大的类间距离和最小的类内距离,即模式在该空间中有最佳的可分离性。所以,它是一种有效的特征抽取方法。网络

模式识别是指表征事物或现象的各类形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。 模式识别分监督的分类和无监督的分诶。差异在于,各实验样本所属的类别是否预先已知。框架

概念分布式

特征,特征矢量函数

模式类:具备某些共同特性的模式合集。oop

模式识别例子学习

计算机自动诊断疾病:1.获取状况(信息采集)测量体温、血压、心率、血液化验、X光透射、B超大数据

模式识别基本方法:搜索引擎

(1)统计模式识别:主要方法:线性、非线性分类、贝叶斯决策、聚类分析;理论基础:几率论、数理统计人工智能

(2)句法模式识别:符号串、树、图;主要方法:自动机技术、CYK剖析算法、Early算法、转移图法;理论基础:形式语言、自动机 (3)模糊模式识别:模式描述模式断定,主要方法:模糊统计、二元对比排序法、推理法、模糊集运算规则、模糊矩阵;理论基础:模糊数学 (4)人工神经网络法:模式描述方法:模式断定:BP模型、HOP模型、高阶网;理论基础:神经生理学、心理学 (5)逻辑推理法(人工智能法)主要方法:产生式推理、语义网推理、框架理论;;理论基础:逻辑演绎、布尔代数;

1929:发明阅读机,能阅读0-9的数字; 30年代:Fisher提出统计分类理论,奠基了统计模式识别的基础; 50年代:Noam提出形式语言理论——傅京孙提出句法/结构模式识别; 60年代:L.A提出模糊集理论,模糊识别方法得以发展; 80年代:以Hopfiled网络、BP网为表明的神经网络模型致使人工神经元网络复活,并在模式识别获得较普遍的应用。 90年代:小样本学习理论,支持向量机受到重视

2.PLSA算法思想

3.贝叶斯分类器如何工做

4.为何贝叶斯计算要定义特征之间是相互独立的

5.K-means算法的原理和时间复杂度,这个算法通常要运行多少次才收敛

6.基于用户的协同过滤算法如何计算用户类似度,基于item的协同过滤算法如何计算item的类似度

7.如何处理大数据量的类似度计算

8.给出两个查询词,如何经过搜索引擎获得两个词的类似度,若是搜索引擎的搜索结果不可靠该用什么方法计算,不考虑语义。

9.在微博博文里如何计算两篇博文的相关度

10.C++中虚函数的实现机制,编译器都作了什么

11.C++中inline和define的区别

12.C++中static的做用

13.给定一个文档,找出在100w条文档中与其类似度最大的50个文档

14.Hadoop分布式处理大数据时候,是否知道索引怎么用?知道XXX索引么?其中的原理是什么?(根本听不清XXX是啥,更谈不上原理了)

15.给定1-100个数,从中挖出其中的两个,如何找到这两个值?

16.青蛙跳楼梯,一跳能够一级也能够两级,问跳N级楼梯能够有多少种跳法?

17.请问3个圆圈能在平面上获得多少个空间?(不准画,只许想,尼玛LZ停顿了10s左右他就说不能画出),后面问若是是4个呢?

相关文章
相关标签/搜索