系统稳定性

1. 在线日志分析

    1.1 日志分析经常使用命令

    1.2 日志分析脚本

2.集群监控

    1.1 监控指标

        1.1.1 Load

        1.1.2 CPU利用率

            在Linux操做系统中,CPU的时间消耗主要在如下几个方面:用户进程、内核进程、中断处理、I/O等待、Nice时间、丢失时间、空闲等。而CPU的利用率则为这些时间所占总的百分比。经过CPU的利用率,可以客观的反映出CPU的使用和消耗状况。性能优化

            能够经过top命令来查看Linux的CPU消耗状况:网络

            top | grep Cpu并发

            

            其中,CPU后面的各个列即是各类状态下CPU所消耗的时间占比高并发

  • 用户时间(us): 表示CPU执行用户进程所占用的时间,一般状况下但愿us的占比越高越好。
  • 系统时间(sy): 表示CPU内核所花费的时间,sy的占比较高,一般意味着系统在某些方面设计不合理,好比果频繁的系统调用致使用户态与内核态的频繁切换。
  • 调整时间(ni): 表示系统在调整进程优先级的时候所花费的时间。
  • 空闲时间(id): 表示系统处于空闲期,等待进程运行这个过程所占用的时间,id占比越低越好。
  • 等待时间(wa): 表示CPU在等待I/O操做所花费的时间,系统不该花费大量的时间来进行等待,不然便表示可能某些地方设计不合理。
  • 硬件中断处理时间(hi): 表示系统处理硬件中断所占用的时间。
  • 软件中断处理时间(si): 表示系统处理硬件中断所占用的时间。         
  • 丢失时间(st): 是在硬件虚拟化技术开始流行后操做系统新增的一列,表示强制等待虚拟CPU时间,此时正在为另外一个虚拟处理器服务。若是st占比较高,则表示当前虚拟机与该宿主上的其它虚拟机间的CPU竞争较为频繁。

        1.1.3 磁盘剩余空间

        1.1.4 网络traffic(流量)

        1.1.5 磁盘I/O

        1.1.6 内存使用

        1.1.7 QPS

        1.1.8 RT

        1.1.9 Slect/PS

        1.1.10 Update/ps,Delete/ps

        1.1.11 GC

    1.2 心跳检测

    1.3 容量评估及应用

3.流程控制

    1.1 流量控制实施

    1.2 服务稳定性    

    1.3 高并发系统设计

4.性能优化

    1.1 如何寻找性能瓶颈

    1.2 性能测试工具

    1.3 性能优化措施    

5.Java应用故障排查

    1.1 经常使用的工具

    1.2 典型案例分析

相关文章
相关标签/搜索