产品 | 公司 | 优点 | 劣势 |
Flume NG | Cloundera |
1.支持故障转移和负载均衡
2.容易水平扩展
3.社区活跃、文档丰富
4.依赖第三方类库少
5.经过事务保证数据一致性
6.支持多种存储
|
1.须要本身实现客户端代码
2.对数据的过滤能力差
|
Scribe |
1.具备很高的容错性
2.支持水平扩展
|
1.依赖zookeeper或Hash等工具
2.须要本身实现客户端代码
3.社区活跃度低、文档少
3.依赖第三方库多
4.部署复杂
5.存储系统类型少
6.数据过滤解析能力差
7.官方已经中止更新和维护
|
|
Chukwa | Apache |
1.高可靠
2.易扩展
3.社区活跃度较高
4.文档资料丰富
|
1.依赖hadoop |
ELK | Elasic.co |
1.提供完整的解决方案
2.支持集群部署和水平扩展
3.社区活跃度高、文档丰富
4.部署简单
|
1.占用资源比较高 |
项目 | 说明 |
典型应用场景 | 内容缓存,主要用于处理大量数据的高访问负载,也用于一些日志系统 |
数据模型 | Key指向Value的键值对,一般用hash table实现 |
强项 | 查找速度快 |
弱项 | 数据无结构,一般被当作字符串或者二进制数据 |
例子 | Redis、Memcached |
项目 | 说明 |
典型应用场景 | 分布式的文件系统 |
数据模型 | 以列簇式存储,将统一列数据存在一块儿 |
强项 | 查找速度快,可扩展性强,更容易进行分布式扩展 |
弱项 | 功能相对局限 |
例子 | Cassandra、HBase |
项目 | 说明 |
典型应用场景 | Web应用,Value是结构化的,容易被解析 |
数据模型 | KeyValue的键值对,Value为结构化数据 |
强项 | 数据结构要求不严格,表结构可变、不须要预先定义表结构 |
弱项 | 查询性能不高,缺少统一的查询语法 |
例子 | CouchDB、MongoDB、Elasticsearch |
项目 | 说明 |
典型应用场景 | 社交网络,推荐系统等。专一于构建关系图谱 |
数据模型 | 图结构 |
强项 | 利用图结构相关算法,好比最短路径寻址,N读关系查找等 |
弱项 | 须要再次计算出所需信息,不容易作分布式集群方案 |
例子 | Neo4j、InfoGrid、Infinite Graph |
InfluxData | Prometheus | Graphite | OpenTSDB | |
数据模型 | labels | labels | dot-separated | label |
按时间分段管理数据 | ✔️ | ✔️ | ✔️ | 手动 |
分布式 | ✔️商业版 | 单机 | 单机 | ✔️ |
聚合分析 | 弱 | 弱 | 弱 | 弱 |
权限管理 | ✔️商业版 | × | × | × |
接口 | 类SQL | REST | REST | REST |
社区生态 | +++ | ++ | ++ | ++ |
时间序列分析 | 无 | 无 | 无 | 无 |
抽取日志指标 | × | × | × | × |
Rollup | ✔️ | × | ✔️ | × |
自动化管理之新人培养sql
《程序员修炼之道》解读1浏览器
关于做者数据结构