Linux中的线程局部存储（转）

时间 2019-11-18

标签 linux 线程局部存储栏目 Linux 繁體版

原文原文链接

转载请说明出处：http://blog.csdn.net/cywosp/article/details/26469435git

在Linux系统中使用C/C++进行多线程编程时，咱们遇到最多的就是对同一变量的多线程读写问题，大多状况下遇到这类问题都是经过锁机制来处理，但这对程序的性能带来了很大的影响，固然对于那些系统原生支持原子操做的数据类型来讲，咱们可使用原子操做来处理，这能对程序的性能会获得必定的提升。那么对于那些系统不支持原子操做的自定义数据类型，在不使用锁的状况下如何作到线程安全呢？本文将从线程局部存储方面，简单讲解处理这一类线程安全问题的方法。

1、数据类型

在C/C++程序中常存在全局变量、函数内定义的静态变量以及局部变量，对于局部变量来讲，其不存在线程安全问题，所以不在本文讨论的范围以内。全局变量和函数内定义的静态变量，是同一进程中各个线程均可以访问的共享变量，所以它们存在多线程读写问题。在一个线程中修改了变量中的内容，其余线程都能感知而且能读取已更改过的内容，这对数据交换来讲是很是快捷的，可是因为多线程的存在，对于同一个变量可能存在两个或两个以上的线程同时修改变量所在的内存内容，同时又存在多个线程在变量在修改的时去读取该内存值，若是没有使用相应的同步机制来保护该内存的话，那么所读取到的数据将是不可预知的，甚至可能致使程序崩溃。

若是须要在一个线程内部的各个函数调用都能访问、但其它线程不能访问的变量，这就须要新的机制来实现，咱们称之为Static memory local to a thread (线程局部静态变量)，同时也可称之为线程特有数据（TSD: Thread-Specific Data）或者线程局部存储（TLS: Thread-Local Storage）。这一类型的数据，在程序中每一个线程都会分别维护一份变量的副本(copy)，而且长期存在于该线程中，对此类变量的操做不影响其余线程。以下图：

2、一次性初始化

在讲解线程特有数据以前，先让咱们来了解一下一次性初始化。多线程程序有时有这样的需求：无论建立多少个线程，有些数据的初始化只能发生一次。列如：在C++程序中某个类在整个进程的生命周期内只能存在一个实例对象，在多线程的状况下，为了能让该对象可以安全的初始化，一次性初始化机制就显得尤其重要了。——在设计模式中这种实现经常被称之为单例模式（Singleton）。Linux中提供了以下函数来实现一次性初始化：

#include <pthread.h>
 
// Returns 0 on success, or a positive error number on error
int pthread_once (pthread_once_t *once_control, void (*init) (void));
利用参数once_control的状态，函数pthread_once()能够确保不管有多少个线程调用多少次该函数，也只会执行一次由init所指向的由调用者定义的函数。init所指向的函数没有任何参数，形式以下：
void init (void)
{
   // some variables initializtion in here
}

另外，参数once_control必须是pthread_once_t类型变量的指针，指向初始化为PTHRAD_ONCE_INIT的静态变量。在C++0x之后提供了相似功能的函数std::call_once ()，用法与该函数相似。使用实例请参考https://github.com/ApusApp/Swift/blob/master/swift/base/singleton.hpp实现。github

3、线程局部数据API

在Linux中提供了以下函数来对线程局部数据进行操做

#include <pthread.h>
 
// Returns 0 on success, or a positive error number on error
int pthread_key_create (pthread_key_t *key, void (*destructor)(void *));
 
// Returns 0 on success, or a positive error number on error
int pthread_key_delete (pthread_key_t key);
 
// Returns 0 on success, or a positive error number on error
int pthread_setspecific (pthread_key_t key, const void *value);
 
// Returns pointer, or NULL if no thread-specific data is associated with key
void *pthread_getspecific (pthread_key_t key);

函数pthread_key_create()为线程局部数据建立一个新键，并经过key指向新建立的键缓冲区。由于全部线程均可以使用返回的新键，因此参数key能够是一个全局变量（在C++多线程编程中通常不使用全局变量，而是使用单独的类对线程局部数据进行封装，每一个变量使用一个独立的pthread_key_t）。destructor所指向的是一个自定义的函数，其格式以下：

void Dest (void *value)
{
    // Release storage pointed to by 'value'
}

只要线程终止时与key关联的值不为NULL，则destructor所指的函数将会自动被调用。若是一个线程中有多个线程局部存储变量，那么对各个变量所对应的destructor函数的调用顺序是不肯定的，所以，每一个变量的destructor函数的设计应该相互独立。

函数pthread_key_delete()并不检查当前是否有线程正在使用该线程局部数据变量，也不会调用清理函数destructor，而只是将其释放以供下一次调用pthread_key_create()使用。在Linux线程中，它还会将与之相关的线程数据项设置为NULL。

因为系统对每一个进程中pthread_key_t类型的个数是有限制的，因此进程中并不能建立无限个的pthread_key_t变量。Linux中能够经过PTHREAD_KEY_MAX（定义于limits.h文件中）或者系统调用sysconf(_SC_THREAD_KEYS_MAX)来肯定当前系统最多支持多少个键。Linux中默认是1024个键，这对于大多数程序来讲已经足够了。若是一个线程中有多个线程局部存储变量，一般能够将这些变量封装到一个数据结构中，而后使封装后的数据结构与一个线程局部变量相关联，这样就能减小对键值的使用。

函数pthread_setspecific()用于将value的副本存储于一数据结构中，并将其与调用线程以及key相关联。参数value一般指向由调用者分配的一块内存，当线程终止时，会将该指针做为参数传递给与key相关联的destructor函数。当线程被建立时，会将全部的线程局部存储变量初始化为NULL，所以第一次使用此类变量前必须先调用pthread_getspecific()函数来确认是否已经于对应的key相关联，若是没有，那么pthread_getspecific()会分配一块内存并经过pthread_setspecific()函数保存指向该内存块的指针。

参数value的值也能够不是一个指向调用者分配的内存区域，而是任何能够强制转换为void*的变量值，在这种状况下，先前的pthread_key_create()函数应将参数
destructor设置为NULL

函数pthread_getspecific()正好与pthread_setspecific()相反，其是将pthread_setspecific()设置的value取出。在使用取出的值前最好是将void*转换成原始数据类型的指针。

4、深刻理解线程局部存储机制

1. 深刻理解线程局部存储的实现有助于对其API的使用。在典型的实现中包含如下数组：

一个全局（进程级别）的数组，用于存放线程局部存储的键值信息

pthread_key_create()返回的pthread_key_t类型值只是对全局数组的索引，该全局数组标记为pthread_keys，其格式大概以下：

数组的每一个元素都是一个包含两个字段的结构，第一个字段标记该数组元素是否在用，第二个字段用于存放针对此键、线程局部存储变的解构函数的一个副本，即destructor函数。

每一个线程还包含一个数组，存有为每一个线程分配的线程特有数据块的指针（经过调用pthread_setspecific()函数来存储的指针，即参数中的value）

2. 在常见的存储pthread_setspecific()函数参数value的实现中，大多数都相似于下图的实现。图中假设pthread_keys[1]分配给func1()函数，pthread API为每一个函数维护指向线程局部存储数据块的一个指针数组，其中每一个数组元素都与图线程局部数据键的实现(上图)中的全局pthread_keys中元素一一对应。

5、总结

使用全局变量或者静态变量是致使多线程编程中非线程安全的常见缘由。在多线程程序中，保障非线程安全的经常使用手段之一是使用互斥锁来作保护，这种方法带来了并发性能降低，同时也只能有一个线程对数据进行读写。若是程序中能避免使用全局变量或静态变量，那么这些程序就是线程安全的，性能也能够获得很大的提高。若是有些数据只能有一个线程能够访问，那么这一类数据就可使用线程局部存储机制来处理，虽然使用这种机制会给程序执行效率上带来必定的影响，但对于使用锁机制来讲，这些性能影响将能够忽略。Linux C++的线程局部存储简单实现可参考https://github.com/ApusApp/Swift/blob/master/swift/base/threadlocal.h，更详细且高效的实现可参考Facebook的folly库中的ThreadLocal实现。更高性能的线程局部存储机制就是使用__thread，这将在下一节中讨论。

__下一节：

在Linux中还有一种更为高效的线程局部存储方法，就是使用关键字__thread来定义变量。__thread是GCC内置的线程局部存储设施（Thread-Local Storage），它的实现很是高效，与pthread_key_t向比较更为快速，其存储性能能够与全局变量相媲美，并且使用方式也更为简单。建立线程局部变量只需简单的在全局或者静态变量的声明中加入__thread说明便可。列如：

static __thread char t_buf[32] = {'\0'};

extern __thread int t_val = 0;

凡是带有__thread的变量，每一个线程都拥有该变量的一份拷贝，且互不干扰。线程局部存储中的变量将一直存在，直至线程终止，当线程终止时会自动释放这一存储。__thread并非全部数据类型均可以使用的，由于其只支持POD(Plain old data structure)[1]类型，不支持class类型——其不能自动调用构造函数和析构函数。同时__thread能够用于修饰全局变量、函数内的静态变量，可是不能用于修饰函数的局部变量或者class的普通成员变量。另外，__thread变量的初始化只能用编译期常量，例如：

    __thread std::string t_object_1 ("Swift");                   // 错误，由于不能调用对象的构造函数
    __thread std::string* t_object_2 = new std::string (); // 错误，初始化必须用编译期常量
    __thread std::string* t_object_3 = nullptr;                // 正确，可是须要手工初始化并销毁对象

除了以上以外，关于线程局部存储变量的声明和使用还需注意一下几点：

若是变量声明中使用量关键字static或者extern，那么关键字__thread必须紧随其后。
与通常的全局变量或静态变量同样，线程局部变量在声明时能够设置一个初始化值。
可使用C语言取地址符(&)来获取线程局部变量的地址。

__thread的使用例子可参考https://github.com/ApusApp/Swift/blob/master/swift/base/logging.cpp的实现及其单元测试对于那些非POD数据类型，若是想使用线程局部存储机制，可使用对pthread_key_t封装的类来处理，具体方式可参考https://github.com/ApusApp/Swift/blob/master/swift/base/threadlocal.h的实现以及其的单元测试

参考

[1] http://zh.wikipedia.org/wiki/POD_(%E7%A8%8B%E5%BA%8F%E8%AE%BE%E8%AE%A1)

[2] Linux/UNIX系统编程手册（上）

[3] Linux多线程服务端编程使用muduo C++网络库