全链路监控是广义的概念,不单单指APM(Appliation Perfance Manager&Monitor),包含三大部分:数据库
Loggong:日志覆盖系统日志,业务日志,框架日志. 常规方案ELK elastic, logstash,kibana服务器
Mertic(指标或者度量):覆盖系统指标,业务指标,中间件指标。框架
Metrics监控主要依赖于时间序列数据库(TSDB),目前比较成熟的有OpenTSDB,具备分布式的能力能够横向扩展,可是相对较重,适用于大中规模企业。也是一个选择。近年也出现一些轻量级的TSDB,好比InfluxDB和Prometheus,这些产品函数报表丰富,自带告警模块,可是分布式能力不足。Grafana是Metrics报表展现的社区标配。机器学习
Trancing(追踪):覆盖微服务,存储,中间件。经常使用的APM框架,好比Skywalking,CAT,ZipKin等这些。分布式
这三者结合起来构成完整的全链路监控体系。是梳理业务,排查问题的基石。函数
测试环境部署硬件最低要求(全部组件都是单台机器便可):微服务
组件学习 |
做用测试 |
CPU代理 |
内存 |
磁盘类型 |
磁盘大小 |
---|---|---|---|---|---|
ElasticSearch集群1 | 统一存储日志 | 4核 | 32GB | SSD最好 | 500GB |
Kibana | 查看日志的平台 | 2核 | 4GB | 普通磁盘 | 500GB |
Logstash | 日志处理中间件 | 4核 | 16GB | 普通磁盘 | 500GB |
ElasticSearch集群2 | Skywalking Trace数据收集 | 4核 | 32GB | SSD最好 | 500GB |
Skywalking | Skywalking服务端 & 管理台 | 4核 | 16GB | 普通磁盘 | 500GB |
InfluxDb | 存储指标的时间序列数据库 | 4核 | 16GB | SSD最好 | 500GB |
Grafana | 查看指标的平台 | 2核 | 4GB | 普通磁盘 | 500GB |
监控详情讨论,监控覆盖的几个方面。