#转#影响系统性能的20个瓶颈

时间 2019-12-13

原文原文链接

英文原文：Big List Of 20 Common Bottlenecks html

在 Zen And The Art Of Scaling - A Koan And Epigram Approach 一文中 , Russell Sullivan 提出一个颇有趣的设想：一共有20种经典的瓶颈。这听起来就像只有20种基本的故事情节（20 basic story plots）那样让人怀疑。不过基于每一个人不一样的分类方式，这个说法或许是对的，可是在现实中，众所周知，瓶颈是无穷无尽的并且涉及方方面面。 linux

一天，来自 Terracotta 的 Aurelien Broszniowski 给我电邮了一份他心中的瓶颈列表，咱们同时把咱们的邮件抄送给了Russell, 他也给出了他的列表。而我也有我本身的想法。因此，下面就是这几碗水煮成的一锅石头汤（ http://en.wikipedia.org/wiki/Stone_soup， stone soup典故）算法

Russell 说要是年轻的时候就知道这些该多好啊，而对我来讲则能够提供更多的思路。你的经验越多，处理过不一样类型的项目，你就能够给这个列表增长更多的内容。所以当你在阅读这个列表时，或者是在整理本身的列表时，多年的丰富经验的积累以及遇到的一些小挫折，每个故事都值得进行总结。数据库

数据库:
- 工做中数据大小超过可用内存 RAM
- 长短查询混合
- 写-写冲突
- 大的联合查询占光内存
虚拟化:
- 共享 HDD 存储，磁盘寻道挂起
- 云平台中的网络 I/O 波动

编程:
- 线程：死锁、相对于事件驱动来讲过于重量级、调试、线程数与性能比非线性
- 事件驱动编程：回调的复杂性、函数调用中如何保存状态（how-to-store-state-in-function-calls）
- 缺乏profile工具、缺乏trace工具、缺乏日志工具
- 单点故障、横向不可扩展
- 有状态的应用
- 搓设计：一台机器上能跑，几个用户也能跑，几个月后，几年后，尼玛，发现扛不住了，整个架构须要重写。
- 算法复杂度
- 依赖于诸如DNS查找等比较搞人的外部组件
- 栈空间

磁盘：

本地磁盘存取
随机磁盘读写 -> 磁盘寻道
磁盘碎片化
写入超过SSD容量的数据致使SSD硬盘性能下降

操做系统：
- 内核缓冲刷入磁盘，填充linux缓冲区缓存
- TCP缓冲区太小
- 文件描述符限制
- 功率分配

缓存:
- 不使用memcached
- HTTP中，header，etags，不压缩（headers, etags, not gzipping）
- 没有充分使用浏览器缓存功能
- 字节码缓存（如PHP）
- L1/L2缓存. 这是个很大的瓶颈. 把频繁使用的数据保持在L1/L2中. 设计到的方面不少：网络数据压缩后再发送，基于列压缩的DB中不解压直接计算等等。有TLB友好的算法。最重要的是牢固掌握如下基础知识：多核CPU、L1/L2，共享L3，NUMA内存，CPU、内存之间的数据传输带宽延迟，磁盘页缓存，脏页，TCP从CPU到DRAM到网卡的流程。

CPU:
- CPU 过载
- 上下文切换 -> 一个内核上跑了太多的线程，linux调度对于应用来讲很不友好, 太多的系统调用, 等等...
- IO 等待 -> 全部的CPU都挂起等待比较慢的IO
- CPU 缓存: 缓存数据是一个为了平衡不一样实例有不一样的值和繁重的同步缓存数据保持一致，而精心设计的一个进程。
- 背板吞吐量

网络:
- 网卡的最大输出带宽，IRQ达到饱和状态，软件中断占用了100%的CPU
- DNS查找
- 丢包
- 网络路由瞎指挥
- 网络磁盘访问
- 共享SAN（Storage Area Network)
- 服务器失败 -> 服务器无响应

过程:
- 测试时间 Testing time
- 开发时间 Development time
- 团队人数 Team size
- 预算 Budget
- 代码缺陷 Code debt

内存:
- 内存溢出 -> 杀进程，进入 swap ，愈来愈慢
- 内存溢出致使磁盘频繁读写（swap相关）
- 内存库开销
- 内存碎片
  - Java 须要垃圾收集致使程序暂停
  - C 语言的 malloc 没法分配

若是你有更多的瓶颈要添加或者建议修复，请加入。感谢 Aurelien 和 Russel。