linux性能优化实战-内存性能指标

转自:https://blog.csdn.net/san_77227487/article/details/87938546

https://blog.csdn.net/zxcc1314/article/details/86751559ios

内存映射

Linux内核给每一个进程提供了一个独立的连续虚拟地址空间(独立!能够将进程内存隔离)。缓存

每一个进程的虚拟地址分为内核空间和用户空间。但内核空间,其实关联的都是相同的物理内存。进程用户态只能访问用户空间内存;内核态能够访问内核空间内存。ide

内存映射就是将虚拟内存地址映射到物理内存地址,内核为每一个进程都维护了一张页表,记录映射关系。
页表实际存储在CPU的内存管理单元MMU中,页表还有一个缓冲TLB(Translation Lookaside Buffer,转译后备缓冲器)。函数

页的大小为4KB,为了解决页过多,Linux提供了两种机制多级页表和大页(HugePage)。
多级页表就是把内存分红区块来管理,将原来的映射关系改为区块索引和区块内的偏移,这样能够大大减小页表的项数。(其实也能够直接映射正使用的页,但这会致使页不连续,不能使用偏移量查找)
Linux使用四级页表管理内存页。工具

大页就是比普通页更大的内存块。性能

当访问虚拟地址在页表中找不到时,会产生缺页异常,进入内核空间分配物理内存、更新进程页表,最后再返回用户空间,恢复进程的运行。.net

虚拟内存空间分布3d

上图为32位系统虚拟内存空间分布。
除内核空间外,用户空间内存,从低到高分别是五种不一样内存段。对象

只读段,包括代码和常量等。
数据段,包括全局变量等。
堆,包括动态分配的内存,从低地址开始向上增加。
文件映射段,包括动态库、共享内存等,从高地址开始向下增加。
栈,包括局部变量和函数调用的上下文等。栈的大小是固定的,通常是 8 MB。
好比说,使用 C 标准库的 malloc() 或者 mmap() ,就能够分别在堆和文件映射段动态分配内存。blog

内存分配
malloc()两种实现方式:

对小块内存(小于 128K),C 标准库使用 brk() 来分配,经过移动堆顶的位置来分配内存。这些内存释放后并不会马上归还系统,而是被缓存起来,这样就能够重复使用。
大块内存(大于 128K),使用内存映射 mmap()在文件映射段找一块空闲内存分配。释放时直接归还给系统。
在内核空间,Linux 则经过 slab 分配器来管理小内存。能够把 slab 当作构建在伙伴系统上的一个缓存,主要做用就是分配并释放内核中的小对象。

malloc() 申请内存后,内存并不会当即分配,而是在首次访问时,才经过缺页异常陷入内核中分配内存。

理解内存中的Buffer和Cache
man free ,能够看到buffer 和 cache 的说明:

Buffers 是内核缓冲区用到的内存,对应的是 /proc/meminfo 中的 Buffers 值。
Cache 是内核页缓存和 Slab 用到的内存,对应的是 /proc/meminfo 中的 Cached与 SReclaimable 之和。
man proc,关于meminfo 说明:

Buffers 是对原始磁盘块的临时存储,也就是用来缓存磁盘的数据,一般不会特别大(20MB 左右)。
Cached 是从磁盘读取文件的页缓存,也就是用来缓存从文件读取的数据。
SReclaimable 是 Slab 的一部分。Slab 包括两部分,其中的可回收部分,用 SReclaimable 记录;而不可回收部分,用 SUnreclaim 记录。

1、IO性能指标

2、IO性能工具

3、基本思路

1. 先用 iostat 发现磁盘 I/O 性能瓶颈;

2. 再借助 pidstat ,定位出致使瓶颈的进程;

3. 分析进程的 I/O 行为;

4. 结合应用程序的原理,分析这些 I/O 的来源。

相关文章
相关标签/搜索