linux性能优化实战-内存性能指标

时间 2019-11-10

标签 linux 性能优化实战内存指标栏目 Linux 繁體版

原文原文链接

转自：https://blog.csdn.net/san_77227487/article/details/87938546

https://blog.csdn.net/zxcc1314/article/details/86751559ios

内存映射

Linux内核给每一个进程提供了一个独立的连续虚拟地址空间（独立！能够将进程内存隔离）。缓存

每一个进程的虚拟地址分为内核空间和用户空间。但内核空间，其实关联的都是相同的物理内存。进程用户态只能访问用户空间内存；内核态能够访问内核空间内存。ide

内存映射就是将虚拟内存地址映射到物理内存地址，内核为每一个进程都维护了一张页表，记录映射关系。
页表实际存储在CPU的内存管理单元MMU中，页表还有一个缓冲TLB（Translation Lookaside Buffer，转译后备缓冲器）。函数

页的大小为4KB，为了解决页过多，Linux提供了两种机制多级页表和大页（HugePage）。
多级页表就是把内存分红区块来管理，将原来的映射关系改为区块索引和区块内的偏移，这样能够大大减小页表的项数。（其实也能够直接映射正使用的页，但这会致使页不连续，不能使用偏移量查找）
Linux使用四级页表管理内存页。工具

大页就是比普通页更大的内存块。性能

当访问虚拟地址在页表中找不到时，会产生缺页异常，进入内核空间分配物理内存、更新进程页表，最后再返回用户空间，恢复进程的运行。.net

虚拟内存空间分布3d

上图为32位系统虚拟内存空间分布。
除内核空间外，用户空间内存，从低到高分别是五种不一样内存段。对象

只读段，包括代码和常量等。
数据段，包括全局变量等。
堆，包括动态分配的内存，从低地址开始向上增加。
文件映射段，包括动态库、共享内存等，从高地址开始向下增加。
栈，包括局部变量和函数调用的上下文等。栈的大小是固定的，通常是 8 MB。
好比说，使用 C 标准库的 malloc() 或者 mmap() ，就能够分别在堆和文件映射段动态分配内存。blog

内存分配
malloc()两种实现方式：

对小块内存（小于 128K），C 标准库使用 brk() 来分配，经过移动堆顶的位置来分配内存。这些内存释放后并不会马上归还系统，而是被缓存起来，这样就能够重复使用。
大块内存（大于 128K），使用内存映射 mmap()在文件映射段找一块空闲内存分配。释放时直接归还给系统。
在内核空间，Linux 则经过 slab 分配器来管理小内存。能够把 slab 当作构建在伙伴系统上的一个缓存，主要做用就是分配并释放内核中的小对象。

malloc() 申请内存后，内存并不会当即分配，而是在首次访问时，才经过缺页异常陷入内核中分配内存。

理解内存中的Buffer和Cache
man free ，能够看到buffer 和 cache 的说明：

Buffers 是内核缓冲区用到的内存，对应的是 /proc/meminfo 中的 Buffers 值。
Cache 是内核页缓存和 Slab 用到的内存，对应的是 /proc/meminfo 中的 Cached与 SReclaimable 之和。
man proc，关于meminfo 说明：

Buffers 是对原始磁盘块的临时存储，也就是用来缓存磁盘的数据，一般不会特别大（20MB 左右）。
Cached 是从磁盘读取文件的页缓存，也就是用来缓存从文件读取的数据。
SReclaimable 是 Slab 的一部分。Slab 包括两部分，其中的可回收部分，用 SReclaimable 记录；而不可回收部分，用 SUnreclaim 记录。

1、IO性能指标

2、IO性能工具

3、基本思路

1. 先用 iostat 发现磁盘 I/O 性能瓶颈；

2. 再借助 pidstat ，定位出致使瓶颈的进程；

3. 分析进程的 I/O 行为；

4. 结合应用程序的原理，分析这些 I/O 的来源。