7.一、阅读推荐html
先来看一段文字(摘自36kr):web
”北京十分科技也很是看好阅读推荐类的应用,他们花了很是大的精力(一年60人团队),才在今天推出了iPhone 版“酷云阅读”。算法
为何要投入这么多人去作这个阅读应用?CEO 李鹏告诉我,这个团队超过一半的人都在作后台相关的东西,包括语义分析、机器学习等算法。他们的目的是将互联网“语义化”之后,把人的兴趣明确,最后把每一个人感兴趣的内容推荐给相关的人。在iPhone 上,酷云的大体作法和Zite iPad 版相似,用户的行为也是有“喜欢”、“不喜欢”,以及点击相应的媒体来源或者相关的标签来告诉酷云你但愿之后看到更多这些内容。数据库
这个目的是大部分阅读推荐应用都有的,可是酷云的作法彷佛更加变态。他们除了天天要抓取来自互联网的超过10万篇文章以外,还对全国200个的电视台播出的视频内容进行了索引,以便用户也能够经过文字搜索出视频、以及对视频内容进行同样的推荐。大体作法是先把这些节目都录制下来,而后把声音转文字,最后创建摘要和索引。“编程
根据所听歌曲的重复相似断定为好友从而基于用户的协同过滤进行推荐,经过某些歌曲是差很少相似的来基于项目的协同过滤进行推荐,但问题出来了,重复的好说,同一首歌曲同一个歌手嘛,可那些类似音乐歌曲又如何定义断定呢?经过系统去分析歌曲的频谱?区别各个歌曲节奏的快慢,音频?此举虽然看起来有效,但实际实行起来不太现实。数据结构