操做系统思考第十一章 C语言中的信号量

时间 2019-11-12

标签系统思考第十一章 c语言信号栏目兴趣爱好繁體版

原文原文链接

第十一章 C语言中的信号量

做者：Allen B. Downeyphp

原文：Chapter 11 Semaphores in Chtml

译者：飞龙git

协议：CC BY-NC-SA 4.0github

信号量是学习同步的一个好方式，可是它们实际上并无像互斥体和条件变量同样被普遍使用。安全

尽管如此，仍是有一些同步问题能够用信号量简单解决，产生显然更加合适的解决方案。ruby

这一章展现了C语言用于处理信号量的API，以及我用于使它更加容易使用的代码。并且它展现了一个终极挑战：你能不能使用互斥体和条件变量来实现一个信号量？数据结构

这一章的代码在本书仓库的semaphore目录中。函数

11.1 POSIX信号量

信号量是用于使线程协同工做而不互相影响的数据结构。post

POSIX标准规定了信号量的接口，它并非pthread的一部分，可是多数实现pthread的UNIX系统也实现了信号量。学习

POSIX信号量的类型是sem_t。这个类型表现为结构体，因此若是你将它赋值给一个变量，你会获得它的内容副本。复制信号量彻底是一个坏行为，在POSIX中，它的复制行为是未定义的。

幸运的是，包装sem_t使之更安全并易于使用至关容易。个人包装API在sem.h中：

typedef sem_t Semaphore;

Semaphore *make_semaphore(int value);
void semaphore_wait(Semaphore *sem);
void semaphore_signal(Semaphore *sem);

Semaphore是sem_t的同义词，可是我认为它更加可读，并且大写的首字母会提醒我将它当作对象并使用指针传递它。

这些函数的实如今sem.c中：

Semaphore *make_semaphore(int value)
{
  Semaphore *sem = check_malloc(sizeof(Semaphore));
  int n = sem_init(sem, 0, value);
  if (n != 0) perror_exit("sem_init failed");
  return sem;
}

make_semaphore接收信号量的初始值做为参数。它为信号量分配空间，将信号量初始化，以后返回指向Semaphore的指针。

若是执行成功，sem_init返回0；若是有任何错误，它返回-1。使用包装函数的一个好处就是你能够封装错误检查代码，这会使使用这些函数的代码更加易读。

下面是semaphore_wait的实现：

void semaphore_wait(Semaphore *sem) {
  int n = sem_wait(sem);
  if (n != 0) perror_exit("sem_wait failed");
}

下面是semaphore_signal：

void semaphore_signal(Semaphore *sem) {
  int n = sem_post(sem);
  if (n != 0) perror_exit("sem_post failed");
}

我更喜欢把这个这个操做叫作“signal”而不是“post”，虽然它们是一个意思（发射）。

译者注：若是你习惯了互斥体（锁）的操做，也能够改为lock和unlock。互斥体其实就是信号量容量为1时的特殊形态。

下面是一个例子，展现了如何将信号量用做互斥体：

Semaphore *mutex = make_semaphore(1);
semaphore_wait(mutex);
// protected code goes here
semaphore_signal(mutex);

当你将信号量用做互斥体时，一般须要将它初始化为1，来表示互斥体是未锁的。也就是说，只有一个线程能够经过信号量而不被阻塞。

这里我使用了变量名称mutex来代表信号量被用做互斥体。可是要记住信号量的行为和pthread互斥体不彻底相同。

11.2 使用信号量解决生产者-消费者问题

使用这些信号量的包装函数，咱们能够编写出生产者-消费者问题的解决方案。这一节的代码在queue_sem.c。

下面是Queue的一个新定义，使用信号量来代替互斥体和条件变量：

typedef struct {
  int *array;
  int length;
  int next_in;
  int next_out;
  Semaphore *mutex;       //-- new
  Semaphore *items;       //-- new
  Semaphore *spaces;      //-- new
} Queue;

下面是make_queue的新版本：

Queue *make_queue(int length)
{
  Queue *queue = (Queue *) malloc(sizeof(Queue));
  queue->length = length;
  queue->array = (int *) malloc(length * sizeof(int));
  queue->next_in = 0;
  queue->next_out = 0;
  queue->mutex = make_semaphore(1);
  queue->items = make_semaphore(0);
  queue->spaces = make_semaphore(length-1);
  return queue;
}

mutex用于确保队列的互斥访问，初始值为1，说明互斥体最开始是未锁的。

item是队列中物品的数量，它也是可非阻塞执行queue_pop的消费者线程的数量。最开始队列中没有任何物品。

spaces是队列中剩余空间的数量，也是可非阻塞执行queue_push的线程数量。最开始的空间数量就是队列的容量length - 1。

下面是queue_push的新版本，它由生产者线程调用：

void queue_push(Queue *queue, int item) {
  semaphore_wait(queue->spaces);
  semaphore_wait(queue->mutex);

  queue->array[queue->next_in] = item;
  queue->next_in = queue_incr(queue, queue->next_in);

  semaphore_signal(queue->mutex);
  semaphore_signal(queue->items);
}

要注意queue_push并不须要调用queue_full，由于信号量跟踪了有多少空间可用，而且在队列满了的时候阻塞住生产者。

下面是queue_pop的新版本：

int queue_pop(Queue *queue) {
  semaphore_wait(queue->items);
  semaphore_wait(queue->mutex);
  
  int item = queue->array[queue->next_out];
  queue->next_out = queue_incr(queue, queue->next_out);

  semaphore_signal(queue->mutex);
  semaphore_signal(queue->spaces);

  return item;
}

这个解决方案在《The Little Book of Semaphores》中的第四章以伪代码解释。

为了使用本书仓库的代码，你须要编译并运行这个解决方案，你应该执行：

$ make queue_sem
$ ./queue_sem

11.3 编写你本身的信号量

任何可使用信号量解决的问题也可使用条件变量和互斥体来解决。一个证实方法就是可使用条件变量和互斥体来实现信号量。

在你继续以前，你可能想要将其作为一个练习：编写函数，使用条件变量和互斥体实现sem.h中的信号量API。你能够将你的解决方案放到本书仓库的mysem.c和mysem.h中，你会在 mysem_soln.c和mysem_soln.h中找到个人解决方案。

若是你在开始时遇到了麻烦，你可使用下面来源于个人代码的结构体定义，做为提示：

typedef struct {
  int value, wakeups;
  Mutex *mutex;
  Cond *cond;
} Semaphore;

value是信号量的值。wakeups记录了挂起信号的数量，也就是说它是已被唤醒可是尚未恢复执行的线程数量。wakeups的缘由是确保咱们的信号量拥有《The Little Book of Semaphores》中描述的性质3。

mutex提供了value和wakeups的互斥访问，cond是线程在须要等待信号量时所等待的条件变量。

下面是这个结构体的初始化代码：

Semaphore *make_semaphore(int value)
{
  Semaphore *semaphore = check_malloc(sizeof(Semaphore));
  semaphore->value = value;
  semaphore->wakeups = 0;
  semaphore->mutex = make_mutex();
  semaphore->cond = make_cond();
  return semaphore;
}

11.3.1 信号量的实现

下面是我使用POSIX互斥体和条件变量的信号量实现：

void semaphore_wait(Semaphore *semaphore)
{
  mutex_lock(semaphore->mutex);
  semaphore->value--;

  if (semaphore->value < 0) {
    do {
      cond_wait(semaphore->cond, semaphore->mutex);
    } while (semaphore->wakeups < 1);
    semaphore->wakeups--;
  }
  mutex_unlock(semaphore->mutex);
}

当线程等待信号量时，须要在减小value以前对互斥体加锁。若是信号量的值为负，线程会被阻塞直到wakeups可用。要注意当它被阻塞时，互斥体是未锁的，因此其它线程能够向条件变量发送信号。

semaphore_signal的代码以下：

void semaphore_signal(Semaphore *semaphore)
{
  mutex_lock(semaphore->mutex);
  semaphore->value++;

  if (semaphore->value <= 0) {
    semaphore->wakeups++;
    cond_signal(semaphore->cond);
  }
  mutex_unlock(semaphore->mutex);
}

一样，线程在增长value以前须要对互斥体加锁。若是信号量是负的，说明还有等待线程，因此发送线程须要增长wakeups并向条件变量发送信号。

此时等待线程可能会唤醒，可是互斥体仍然会锁住它们，直到发送线程解锁了它。

这个时候，某个等待线程从cond_wait中返回，以后检查是否wakeup仍然有效。若是没有它会循环并再次等待条件变量。若是有效，它会减小wakeup，解锁互斥体并退出。

这个解决方案使用do-while循环的缘由可能并非很明显。你知道为何不使用更广泛的while循环吗？会出现什么问题呢？

问题就是while循环的实现不知足性质3。一个发送线程能够在以后的运行中收到它本身的信号。

使用do-while循环，就确保[1]了当一个线程发送信号时，另外一个等待线程会收到信号，即便发送线程在某个等待线程恢复以前继续运行并对互斥体加锁。

1] 好吧，几乎是这样。实际上一个时机恰当的[虚假唤醒会打破这一保证。

操做系统思考 第十一章 C语言中的信号量