1、MySQL的Hadoop Applier html
实现原理是:把hadoop做为MYSQL 的slave,实时把数据同步到hadoop,支持apache hadoop mysql
经过分析MYSQL的binlog日志,在hdfs产生一个目录(同表名),全部的表记录都存储在一个文件中,用户的操做如插入,更新,删除都会产生一笔记录追加到文件末尾. sql
但如何利用hdfs上的这个数据,须要用户本身定义逻辑,把表中的数据插入到hbase表 apache
详见:http://dev.mysql.com/tech-resources/articles/mysql-hadoop-applier.html oracle
2、GoldenGate的HDFS Adapter app
Oracle GoldGate's 也有相似的工具,经过分析Trails File把数据实时同步到hadoop
ORACLE官方网站提供了Hdfs Adapter,但不提供服务支持
详见:https://blogs.oracle.com/dataintegration/entry/streaming_relational_transactions_to_hadoop 工具