NUMA微架构

时间 2019-12-08

标签 numa 架构栏目系统架构繁體版

原文原文链接

written by qingran September 8th, 2011 no comment

如今开始补日志，逐步的扫清之前写了一半的和“欠帐未还的”。半年以前开的头，今天先把NUMA说完。node

PC硬件结构近5年的最大变化是多核CPU在PC上的普及，多核最经常使用的SMP微架构：redis

结构如图所示：api

SMP的问题主要在CPU和内存之间的通讯延迟较大、通讯带宽受限于系统总线带宽，同时总线带宽会成为整个系统的瓶颈。架构

由此应运而生了NUMA架构：并发

NUMA（Non-Uniform Memory Access）是起源于AMD Opteron的微架构，同时被Intel Nehalem采用（英特尔志强E5500以上的CPU和桌面的i三、i五、i7均基于此架构）。这也应该是继AMD64后AMD对CPU架构的又一项重要改进。memcached

在这个架构中，每一个处理器有其能够直接访问其自身的“本地”内存池，使CPU和这块儿内存之间拥有更小的延迟和更大的带宽。并且整个内存仍然可作为一个总体，能够接受来自任何CPU的访问。简言之就是CPU访问本身领地内的内存延迟最小独占带宽，访问其余的内存区域稍慢而且共享带宽。post

GNU/Linux如何管理NUMA：测试

在一台16GB内存，双Xeon E5620 CPU Dell R710用numactl获得如下信息:优化

# numactl --hardwarespa

available: 2 nodes (0-1)

node 0 size: 8080 MB

node 0 free: 5643 MB

node 1 size: 8051 MB

node 1 free: 2294 MB

node distances:

node 0 1

0: 10 20

1: 20 10

由于就近内存访问的快速性，因此默认状况下一个CPU只访问其所属区域的内存空间。此时形成的问题是在大内存占用的一些应用时会有CPU近线内存不够的状况，可使用以下方式把CPU对内存区域的访问变为round robin方式。此时须要经过如下方式修改：

# echo 0 > /proc/sys/vm/zone_reclaim_mode

# numactl --interleave=all

memcached、redis、monodb等应该作以上的优化修改。

另外，若是有时间，下一篇会总结一下本身对于此问题的思考：若是本身实现一个内存池，并发挥NUMA架构的最大效能，如何设计？

参考自：

Ulrich Drepper, Memory part 4: NUMA support Http://Lwn.Net/Articles/254445/