1. 在线日志分析
1.1 日志分析经常使用命令
1.2 日志分析脚本
2.集群监控
1.1 监控指标
1.1.1 Load
1.1.2 CPU利用率
在Linux操做系统中,CPU的时间消耗主要在如下几个方面:用户进程、内核进程、中断处理、I/O等待、Nice时间、丢失时间、空闲等。而CPU的利用率则为这些时间所占总的百分比。经过CPU的利用率,可以客观的反映出CPU的使用和消耗状况。性能优化
能够经过top命令来查看Linux的CPU消耗状况:网络
top | grep Cpu并发

其中,CPU后面的各个列即是各类状态下CPU所消耗的时间占比高并发
- 用户时间(us): 表示CPU执行用户进程所占用的时间,一般状况下但愿us的占比越高越好。
- 系统时间(sy): 表示CPU内核所花费的时间,sy的占比较高,一般意味着系统在某些方面设计不合理,好比果频繁的系统调用致使用户态与内核态的频繁切换。
- 调整时间(ni): 表示系统在调整进程优先级的时候所花费的时间。
- 空闲时间(id): 表示系统处于空闲期,等待进程运行这个过程所占用的时间,id占比越低越好。
- 等待时间(wa): 表示CPU在等待I/O操做所花费的时间,系统不该花费大量的时间来进行等待,不然便表示可能某些地方设计不合理。
- 硬件中断处理时间(hi): 表示系统处理硬件中断所占用的时间。
- 软件中断处理时间(si): 表示系统处理硬件中断所占用的时间。
- 丢失时间(st): 是在硬件虚拟化技术开始流行后操做系统新增的一列,表示强制等待虚拟CPU时间,此时正在为另外一个虚拟处理器服务。若是st占比较高,则表示当前虚拟机与该宿主上的其它虚拟机间的CPU竞争较为频繁。
1.1.3 磁盘剩余空间
1.1.4 网络traffic(流量)
1.1.5 磁盘I/O
1.1.6 内存使用
1.1.7 QPS
1.1.8 RT
1.1.9 Slect/PS
1.1.10 Update/ps,Delete/ps
1.1.11 GC
1.2 心跳检测
1.3 容量评估及应用
3.流程控制
1.1 流量控制实施
1.2 服务稳定性
1.3 高并发系统设计
4.性能优化
1.1 如何寻找性能瓶颈
1.2 性能测试工具
1.3 性能优化措施
5.Java应用故障排查
1.1 经常使用的工具
1.2 典型案例分析