最近看epoll 和 select 都涉及到一个东西叫作设备等待队列,等待队列是如何工做的,内核是怎么管理的?看这篇文章html
- 问题:进程是如何组织起来的?
咱们知道,进程是有不少种状态的:include/linux/sched.h
#define TASK_RUNNING 0
#define TASK_INTERRUPTIBLE 1
#define TASK_UNINTERRUPTIBLE 2
#define __TASK_STOPPED 4
#define __TASK_TRACED 8
/* in tsk->exit_state */
#define EXIT_ZOMBIE 16
#define EXIT_DEAD 32
等等。
那么,对于不一样状态的进程,内核是如何来管理的呢?
- 就绪队列:状态为TASK_RUNNING的进程组成的列表;
- 处于TASK_STOPPED、EXIT_ZOMBIE或者EXIT_DEAD状态的进程是不须要链接进特定链表的。由于对于这些状态的进程而言,父进程只会经过 PID或者子进程链表来进行访问。
- 而处于TASK_INTERRUPTIBLE、TASK_UNINTERRUPTIBLE状态的进程分为不少种类型,其每一个进程对应一 种特定事件。在这种状况下,进程的状态信息是不能提供足够的信息去快速的检索所需进程,所以有必要介绍一些其余的链表组织结构。好比等待队列。
- 等待队列:
在内核里面,等待队列是有不少用处的,尤为是在中断处理、进程同步、定时等场合。咱们主要讨论其在进程同步中的应用。
有时候,一个进程可能要等待一些事件的发生,如磁盘操做结束、一些系统资源的释放等等。我的理理解:等待队列就是暂时存放等待某些事件发生的进程的集合。若是一个进程要等待一个事件发生,那么该进程便将自身放入相应的等待队列中进入睡眠,而放弃控制权,直到等待事件发生后才会被内核唤醒。
- 等待队列的结构:

- 等待队列是以双循环链表的形式实现的,并且队列中的成分(等待队列项)包含了指向进程描述符task的指针。
- 等待队列头:include/linux/wait.h
每个等待队列是有一个等待队列头,等待队列头是一个wait_queue_head_t的数据结构:
struct __wait_queue_head {
spinlock_t lock;
struct list_head task_list;
};
typedef struct __wait_queue_head wait_queue_head_t;
成员说明:
lock:由于等待队列是不容许多个进程同时进行访问的,以防产生不可预料的结果,所以在此结构中定义了"自旋锁"以实现访问间的同步。
task_list:用于实现双向链表形式。
struct list_head {
struct list_head *next, *prev;
};
- 等待队列项:include/linux/wait.h
struct __wait_queue {
unsigned int flags;
struct task_struct *task;(2.6.25.5中是void *private;)
wait_queue_func_t func;
struct list_head task_list;
};
typedef struct __wait_queue wait_queue_t;
等待队列中的每个成分:等待队列项,表明着一个正在等待特定事件发生的睡眠进程。
成员解释:
task:存放着睡眠进程状态描述符的地址;
task_list:用于将进程连接进等待相同事件发生的进程链表中(等待队列)。
flag:
互斥进程(exclusive processes)和非互斥进程:
咱们来考虑一下,若是等待的事件发生了、变为真的了,那么是否是要唤醒等待该事件的全部进程(某个等待队列中)呢?
老是唤醒全部等待该事件的进程并不必定是合适的。好比考虑这样一种状况:若是队列中的多个进程等待的资源是要互斥访问的,必定时间内只容许一个进程去访问的话,这时候,只须要唤醒一个进程就能够了,其余进程继续睡眠。若是唤醒全部的进程,最终也只有一个进程得到该资源,其余进程让需返回睡眠。
所以,等待队列中的睡眠进程可被划分为互斥、非互斥进程。
互斥进程:等待的资源是互斥访问的;互斥进程由内核有选择的唤醒,等待队列项的flag字段为1;
非互斥进程:等待的资源是可多进程同时访问的。非互斥进程在事件发生时,老是被内核唤醒,等待队列元素的flag字段为0。
func:
指定等待队列中的睡眠进程如何被唤醒。
- 等待队列的建立:include/linux/wait.h
DECLARE_WAITQUEUE()
init_waitqueue_head()
能够用DECLARE_WAIT_QUEUE_HEAD(name)宏定义一个新的等待队列,该宏静态地声明和初始化名为name的等待队列头变量。 init_waitqueue_head()函数用于初始化已动态分配的wait queue head变量。
等待队列能够经过 DECLARE_WAITQUEUE()静态建立,也能够用 init_waitqueue_head()动态建立。进程把本身放入等待队列中并设置成不可执行状态。 例:
The init_waitqueue_entry(q, p) function initializes a wait_queue_t structure q as follows:
q->flags = 0;
q->task = p;
q->func = default_wake_function;
非互斥进程p(flags = 0)将被default_wake_function函数唤醒,而default_wake_function唤醒函数是try_to_wake_up( )的包装而已。
DEFINE_WAIT:
能够用宏DEFINE_WAIT声明一个新的wait_queue_t变量(等待队列项),而且对其进行初始化:
#define DEFINE_WAIT(name) \
wait_queue_t name = { \
.private = current, \
.func = autoremove_wake_function, \
.task_list = LIST_HEAD_INIT((name).task_list), \
}
- 等待队列的添加和删除:
- add_wait_queue( ):kernel/wait.c
add_wait_queue_exclusive( )
add_wait_queue()函数把一个非互斥进程插入等待队列链表的第一个位置;
在wait.c中:
void add_wait_queue(wait_queue_head_t *q, wait_queue_t *wait)
{
unsigned long flags;
wait->flags &= ~WQ_FLAG_EXCLUSIVE;
spin_lock_irqsave(&q->lock, flags);
__add_wait_queue(q, wait);
spin_unlock_irqrestore(&q->lock, flags);
}
EXPORT_SYMBOL(add_wait_queue);
内嵌内核函数__add_wait_queue(),而且使用了所机制对该操做进行互斥保护。
add_wait_queue_exclusive( )函数把一个互斥进程插入等待队列链表的最后一个位置;
- remove_wait_queue( ):
remove_wait_queue( )函数从等待队列链表中删除一个进程;
- waitqueue_active( ):
waitqueue_active( )函数检查一个给定的等待队列是否为空。
- 等待队列的使用:睡眠和唤醒:/kernel/sched.c
该组函数使用任务管理中公用形式的等待队列。
但愿等待一个特定事件的进程能调用下列函数中的任一个:
- 睡眠操做:思想是更改当前进程(CURRENT)的任务状态,并要求从新调度,由于这时这个进程的状态已经改变,再也不在调度表的就绪队列中,所以没法再得到执行机会,进入"睡眠"状态,直至被"唤醒"(wake_up()),即其任务状态从新被修改回就绪态。
经常使用的睡眠操做有interruptible_sleep_on和sleep_on,两个函数相似,是把调用进程加入到特定的等待队列中,只不过前者将进程的状态从就绪态 (TASK_RUNNING)设置为TASK_INTERRUPTIBLE,容许经过发送signal唤醒它(便可中断的睡眠状态);然后者将进程的状态 设置为TASK_UNINTERRUPTIBLE,在这种状态下,不接收任何singal。
在当前进程上操做的sleep_on()函数:
void sleep_on(wait_queue_head_t *wq)
{
wait_queue_t wait;
/* 构造当前进程对应的等待队列项 */
init_waitqueue_entry(&wait, current); //wait.h中
/* 将当前进程的状态从TASK_RUNNING改成TASK_UNINTERRUPTIBLE */
current->state = TASK_UNINTERRUPTIBLE;
/* 将等待队列项添加到指定链表中 */
wq_write_lock_irqsave(&q->lock,flags);
__add_wait_queue(q, &wait);
wq_write_unlock(&q->lock);
/* 进程从新调度,放弃执行权 */
schedule( );
/* 本进程被唤醒,从新得到执行权,首要之事是将等待队列项从链表中删除 */
wq_write_lock_irq(&q->lock);
__remove_wait_queue(q, &wait);
wq_write_unlock_irqrestore(&q->lock,flags);
/* 至此,等待过程结束,本进程能够正常执行下面的逻辑 */
}
该函数把当前进程的状态设置为TASK_UNINTERRUPTIBLE,并把它插入到特定的等待队列。而后,它调用调度程序,而调度程序从新开始另外一个进程的执行。当睡眠进程被唤醒时,调度程序从新开始执行sleep_on()函数,把该进程队列中删除。
- interruptible_sleep_on():
interruptible_sleep_on()与sleep_on()函数基本上是同样的,可是interruptible_sleep_on()把 当前进程的状态设置为TASK_INTERRUPTIBLE而不是TASK_UNINTERRUPTIBLE,所以,接受一个信号就能够唤醒当前进程;
- sleep_on_timeout()interruptible_sleep_on_timeout()于上述两个函数相似,只是他们还容许调用者定义一个时间间隔使得进程被内核唤醒;可是,在这两个函数中调用的是schedule_timeout()来代替schedule()。
- prepare_to_wait()、prepare_to_wait_exclusive()、finish_wait():在wait.c中:
是在linux2.6中介绍的,将当前进程放入等待队列的另外一种方式。做用同sleep_on()。
- 对应的唤醒操做包括wake_up_interruptible和wake_up。wake_up函数不只能够唤醒状态为 TASK_UNINTERRUPTIBLE的进程,并且能够唤醒状态为TASK_INTERRUPTIBLE的进程。 wake_up_interruptible只负责唤醒状态为TASK_INTERRUPTIBLE的进程。这两个宏的定义以下:
#define wake_up(x) __wake_up((x),TASK_UNINTERRUPTIBLE | TASK_INTERRUPTIBLE, 1)
#define wake_up_interruptible(x) __wake_up((x),TASK_INTERRUPTIBLE, 1)
__wake_up函数主要是获取队列操做的锁,具体工做是调用__wake_up_common完成的。
void __wake_up(wait_queue_head_t *q, unsigned int mode, int nr)
{
if (q) {
unsigned long flags;
wq_read_lock_irqsave(&q->lock, flags);
__wake_up_common(q, mode, nr, 0);
wq_read_unlock_irqrestore(&q->lock, flags);
}
}
参数q表示要操做的等待队列,mode表示要唤醒任务的状态,如TASK_UNINTERRUPTIBLE或TASK_INTERRUPTIBLE等。nr_exclusive是要唤醒的互斥进程数目,在这以前遇到的非互斥进程将被无条件唤醒。sync表示???
{
struct list_head *tmp;
struct task_struct *p;
CHECK_MAGIC_WQHEAD(q);
WQ_CHECK_LIST_HEAD(&q->task_list);
/* 遍历等待队列 */
list_for_each(tmp,&q->task_list) {
unsigned int state;
/* 得到当前等待队列项 */
wait_queue_t *curr = list_entry(tmp, wait_queue_t, task_list);
CHECK_MAGIC(curr->__magic);
/* 得到对应的进程 */
p = curr->task;
state = p->state;
/* 若是咱们须要处理这种状态的进程 */
if (state & mode) {
WQ_NOTE_WAKER(curr);
if (try_to_wake_up(p, sync) && (curr->flags&WQ_FLAG_EXCLUSIVE) && !--nr_exclusive)
break;
}
}
}
其余的还有wake_up_nr, wake_up_all, wake_up_interruptible_nr, wake_up_interruptible_all, wake_up_interruptible_sync, wake_up_locked.
参考文章:
http://hi.baidu.com/abigbigman/blog/item/a0a1fb54f2faa85cd009065f.html
http://linux.chinaunix.net/techdoc/system/2008/03/08/982296.shtmllinux