推荐系统的技术栈

存储系统:Habse是基于HDFS的一种数据库,Hbase的文件是存储在HDFS系统之上的。(解决了数据存储问题) 采集组件:sqoop(针对RDMS关系型数据库的数据进行采集,订单,交易,还有浏览,收藏的) flume(实时的,比如用户点击的网页的图片和商品,这种点击流) kaffka(第三方消息队列框架,可靠性好) storm:流处理 Yarn:对资源进行分配,基于管理员配置的策略 HIve,
相关文章
相关标签/搜索