《Programming Collective Intelligence》review

  最近javaeye上“书托”应该算比较流行的词汇了,我也赶把时髦当把“书托”,推荐一本浅显易懂的机器学习方面的入门书籍,最近读了OReilly出版社的<<Programming Collective Intelligence>>,开始看了电子版的,后来徐师兄送我一本,这本书很是浅显易懂,而且结合真实可运行代码,介绍了机器学习最经常使用的算法,并结合实例使用python代码,使用许多OPen API来构建可用的系统。书中的算法相对简单,但对于理解机器学习方面的算法应该说是很好的入门级别的书了。若是可以以此扩展开来,读一些相关的文献书籍,会有很大收获。

补充一些机器学习和web 挖掘的书籍,从网上看到推荐的:1. 《Programming Collective Intelligence》,近年出的入门好书,培养兴趣是最重要的一环,一上来看大部头很容易被吓走的:P2. Peter Norvig 的《AI, Modern Approach 2nd》(无争议的领域经典)。 3. 《The Elements of Statistical Learning》,数学性比较强,能够作参考了。 4. 《Foundations of Statistical Natural Language Processing》,天然语言处理领域公认经典。 5. 《Data Mining, Concepts and Techniques》,华裔科学家写的书,至关深刻浅出。 6. 《Managing Gigabytes》,信息检索好书。 7. 《Information Theory:Inference and Learning Algorithms》,参考书吧,比较深。 八、《Machine Learning, Tom Michell》, 1997. 老书,牛人。如今看来内容并不算深,不少章节有点到为止的感受,可是很适合新手(固然,不能"新"到连算法和几率都不知道)入门。好比决策树部分就很精彩,而且这几年没有特别大的进展,因此并不过期。另外,这本书算是对97年前数十年机器学习工做的大综述,参考文献列表极有价值。国内有翻译和影印版,不知道绝版否。 九、《Modern Information Retrieval, Ricardo Baeza-Yates et al》. 1999 老书,牛人。貌似第一本完整讲述IR的书。惋惜IR这些年进展迅猛,这本书略有些过期了。翻翻作参考仍是不错的。另外,Ricardo同窗如今是Yahoo Research for Europe and Latin Ameria的头头。 十、《Pattern Classification (2ed)》, Richard O. Duda, Peter E. Hart, David G. Stork 大约也是01年左右的大块头,有影印版,彩色。没读完,但若是想深刻学习ML和IR,前三章(介绍,贝叶斯学习,线性分类器)必修。 还有些经典与我只有一面之缘,没有资格评价。另外还有两本小册子,论文集性质的,却是讲到了了很多前沿和细节,诸如索引如何压缩之类。惋惜忘了名字,又被我压在箱底,下次搬家前怕是难见天日了。 十一、《Mining the Web - Discovering Knowledge from Hypertext Data》 十二、说一本名气很大的书:《Data Mining: Practical Machine Learning Tools and Techniques》。Weka 的做者写的。惋惜内容通常。理论部分太单薄,而实践部分也很脱离实际。DM的入门书已经很多,这一本应该能够不看了。若是要学习了解 Weka ,看文档就好。第二版已经出了,没读过,不清楚。 1三、《Introduction to Information Retrieval》,这书刚刚正式出版,内容固然up to date。另外信息检索第一大牛Croft老爷也正在写教科书,应该很快就要面世了。听说是很是pratical的一本书1四、《Pattern Recognition and Machine Learning》. 没有影印的,可是网上能下到。经典中的经典。Pattern Classification 和这本书是两本必读之书。《Pattern Recognition and Machine Learning》是很新(07年),深刻浅出,手不释卷。