当前,整个互联网正在从IT时代向DT时代演进,大数据技术也正在助力企业和公众敲开DT世界大门。当今“大数据”一词的重点其实已经不只在于数据规模的定义,它更表明着信息技术发展进入了一个新的时代,表明着爆炸性的数据信息给传统的计算技术和信息技术带来的技术挑战和困难,表明着大数据处理所需的新的技术和方法,也表明着大数据分析和应用所带来的新发明、新服务和新的发展机遇。 为了帮助你们更好深刻了解大数据,云栖社区组织翻译了GitHub Awesome Big Data资源,供你们参考。本资源类型主要包括:大数据框架、论文等实用资源集合。 资源列表:
- 关系数据库管理系统(RDBMS)
- 框架
- 分布式编程
- 分布式文件系统
- 文件数据模型
- Key -Map 数据模型
- 键-值数据模型
- 图形数据模型
- NewSQL数据库
- 列式数据库
- 时间序列数据库
- 类SQL处理
- 数据摄取
- 服务编程
- 调度
- 机器学习
- 基准测试
- 安全性
- 系统部署
- 应用程序
- 搜索引擎与框架
- MySQL的分支和演化
- PostgreSQL的分支和演化
- Memcached的分支和演化
- 嵌入式数据库
- 商业智能
- 数据可视化
- 物联网和传感器
- 文章
- 论文
- 视频
关系数据库管理系统(RDBMS)
框架
分布式编程
分布式文件系统
文件数据模型
Key Map 数据模型 注意:业内存在一些术语混乱,有两个不一样的东西都叫作“列式数据库”。这里列出的有一些是围绕“key-map”数据模型而建的分布式、持续型数据库,其中全部的数据都有(可能综合了)键,并与映射中的键-值对相关联。在一些系统中,多个这样的值映射能够与键相关联,而且这些映射被称为“列族”(具备映射值的键被称为“列”)。php 另外一组也可称为“列式数据库”的技术因其存储数据的方式而有别于前一组,它在磁盘上或在存储器中——而不是以传统方式,即全部既定键的键值都相邻着、逐行存储。这些系统也彼此相邻来存储全部列值,可是要获得给定列的全部值却不须要之前那么繁复的工做。html 前一组在这里被称为“key map数据模型”,这二者和Key-value 数据模型之间的界限是至关模糊的。后者对数据模型有更多的存储格式,可在列式数据库中列出。若想了解更多关于这两种模型的区分,可阅读Daniel Abadi的博客:Distinguishing two major types of Column Stores。mysql
键-值数据模型
图形数据模型
NewSQL数据库
|