大数据技能图谱

下面是 StuQ 发布的大数据技能图谱,比较实用,供参考算法

 

大数据处理框架数据库


Spark
- RDD
- Spark SQL
- Spark Streaming
- MLLib

Hadoop
- HDFS (分布式文件系统)
- Mapreduce(计算框架)
- Yarn(资源管理平台)
- Pig(piglatin 语句到 mapreduce 的映射)
- Hive(数据仓库,提供 SQL)
- Mahout(机器学习算法的 mapreduce 实现库)

Kafka
Storm
ELK
- ElasticSearch
- Logstash
- Kibana

数据库
编程


- SQL
- MySQL
- MongoDB
- Cassandra
- Redis
- SQLite
- bsddb
- HBase

编程语言
数组


- Python
- R
- Ruby

数据分析挖掘
网络


- MATLAB
- SPSS
- SAS

数据可视化
数据结构


- R
- D3.js
- ECharts
- Excle

人工智能
框架


- 聚类
- 时间序列
- 推荐系统
- 回归分析
- 文本挖掘
- 决策树
- 支持向量机
- 贝叶斯分类
- 神经网络

算法
机器学习


一致性
- paxos
- raft
- gossip

数据结构
- 栈,队列,链表
- 散列表
- 二叉树,红黑树,B树
- 图

经常使用算法
- 排序(插入排序、桶排序、堆排序、快速排序)
- 最大子数组
- 最长公共子序列
- 最小生成树
- 最短路径
- 矩阵的存储和运算

云计算
编程语言


- 云服务(SaaS、PaaS、IaaS)
- Openstack
- Docker

分布式

相关文章
相关标签/搜索