Linux内核 | 进程管理

时间 2021-02-22

标签 linux 缓存多线程并发编辑器 ide 函数 spa 操作系统 .net 栏目 Linux 繁體版

原文原文链接

做者:世至其美
博客地址:hqber.com
转载须注明以上信息, 更多文章,请访问我的博客:hqber.comlinux

1. 进程和线程

1.1 定义

进程是处于运行状态的程序和相关资源的总称，是资源分配的最小单位。缓存

线程是进程的内部的一个执行序列，是CPU调度的最小单位。多线程

有一段可执行程序代码。
有一段进程专用的系统堆栈空间和系统空间堆栈。
有进程描述符，用于描述进程的相关信息。
有独立的存储空间，也就是专有的用户空间，相应的又会有用户空间堆栈。

Linux系统对于线程实现很是特殊，他并不区分线程和进程，线程只是一种特殊的进程罢了。从上面四点要素来看，拥有前三点而缺第四点要素的就是线程，若是彻底没有第四点的用户空间，那就是系统线程，若是是共享用户空间，那就是用户线程。并发

1.2 主要区别

进程做为分配资源的基本单位，而把线程做为独立运行和独立调度的基本单位，因为线程比进程更小，基本上不拥有系统资源，故对它的调度所付出的开销就会小得多，能更高效的提升系统多个程序间并发执行的程度。编辑器

进程和线程的主要差异在于它们是不一样的操做系统资源管理方式。进程有独立的地址空间，一个进程崩溃后，在保护模式下不会对其它进程产生影响，而线程只是一个进程中的不一样执行路径。线程有本身的堆栈和局部变量，但线程之间没有单独的地址空间，一个线程死掉就等于整个进程死掉，因此多进程的程序要比多线程的程序健壮，但在进程切换时，耗费资源较大，效率要差一些。但对于一些要求同时进行而且又要共享某些变量的并发操做，只能用线程，不能用进程。ide

总结：linux中，进程和线程惟一区别是有没有独立的地址空间。函数

2. 进程描述符及任务结构

32位机器上，大约有1.7KB，进程描述符完整描述一个正在执行的进程的全部信息。spa

任务队列（双向循环链表）操作系统

进程描述符struct task_struct（源代码 | linnux/sched.h | v5.4）.net

struct task_struct {
    volatile long state;    // -1为不可运行, 0为可运行, >0为已中断
    int lock_depth;     // 锁的深度
    unsigned int policy; // 调度策略：通常有FIFO，RR，CFS
    pid_t pid;   // 进程标识符,用来表明一个进程
    struct task_struct *parent; // 父进程
    struct list_head children;  // 子进程
    struct list_head sibling;   // 兄弟进程
}

2.1 分配进程描述符

2.1.1 slab分配器

linux采用slab分配器分配task_struct结构

目的：对象复用和缓存着色。

slab分配器动态生成task_struct，只需在栈底（相对于向下增加的栈）或栈顶（相对于向上增加的栈）建立一个新结构struct thread_info。

2.1.2 进程描述符存放

PID最大值默认为32768（short int 短整形的最大值<linux/threads.h>）可经过修改/proc/sys/kernel/pid_max提升上限。

current宏查找当前正在运行进程的进程描述符。

x86系统中，current把栈指针后13个有效位屏蔽掉，用来计算出thread_info的偏移。

current_thread_info函数

movl $-8192,%eax
andl %esp,%eax

2.1.3 进程状态

TASK_RUNNING：1. 正在执行 2. 在运行队列中等待执行
TASK_INTERRUPTIBLE：阻塞（可中断）
TASK_UNINTERRUPTIBLE：阻塞（不可中断）
__TASK_TRACED：被其余进程跟踪的进程
__TASK_STOPPED：进程中止

陷入内核执行

系统调用
异常处理程序

2.1.4 进程家族树

init进程

全部进程都是PID为1的init进程的后代
内核在系统启动的最后阶段启动init进程。

init进程目的：读取系统的初始化脚本，并执行其余的相关程序，最终完成系统启动的整个过程。

task_struct中记录父子进程

parent指针（指向父进程）
children子进程链表

3. 进程建立

其余操做系统提供产生（spawn）进程机制，首先在新地址空间里建立进程，读入可执行文件，最后开始执行。

UNIX将上述机制流程分红两步fork()和exec()

fork()拷贝当前进程建立一个子进程
exec()负责读取可执行文件，并将其入地址空间

3.1 写时拷贝（copy-on-write）

使地址空间上的页的拷贝推迟到实际发生写入的时候才进行。

原理：若是有进程试图修改一个页，就会产生一个缺页中断。内核处理缺页中断的方式就是对该页进行一次透明复制。这时会清除页面的COW属性，表示着它再也不被共享。

3.2 fork()函数

fork()的实际开销就是复制父进程的页表以及给子进程建立惟一的进程描述符。

在如今linux内核中，fork()其实是由clone()系统调用实现的

3.2.1 copy_process()函数

dup_task_struct()为新进程建立一个内核栈，thread_info结构和task_struct与当前进程相同。父子进程描述符是彻底相同的。（分配空间）
检查并确保新建立这个进程后，当前用户所拥有的进程数目没有超出给它分配的资源的限制。（检查边界）
子进程与父进程区别开。进程描述符的许多成员都要被清0或设初始值，那些不是继承来的进程描述符的成员，主要是统计信息。task_struct中的大多数数据都依然未被修改。（子进程初始化）
子进程的状态被设置为TASK_UNINTERRUPTIBLE（不可中断，阻塞状态），以保证它不会投入运行。（设置子进程状态）
copy_process()调用copy_flags()以更新task_struct的flags成员。（设置标志位）
- 代表进程是否拥有超级用户权限的PF_SUPERPRIV标志被清0
- 代表进程尚未调用exec()函数的PF_FORKNOEXEC标志被设置
调用alloc_pid()为新进程分配一个有效的PID。（为子进程分配pid）
根据传递给clone()的参数，copy_process()拷贝或共享打开的文件、文件系统信息、信号处理函数、进程地址空间和命名空间等。通常状况下，这些资源会被给定的进程的全部线程共享；不然，这些资源对每一个进程是不一样的，所以被拷贝到这里。（将资源参数标志赋值给结构体）
copy_process()作扫尾工做并返回一个指向子进程的指针，再回到do_fork()函数，若是copy_process()函数成功返回，新建立的子进程被唤醒并让其投入运行。（返回子进程指针，并唤醒子进程执行）

注：内核有意让子进程先执行，并不是总能如此，由于通常子进程都会立刻调用exec()函数，这样能够避免写时拷贝的额外开销。由于父进程先执行，可能往地址空间写入。

3.3 vfork函数

vfork()和fork()区别：vfork()不拷贝父进程的页表项。

vfork()：子进程做为父进程的一个单独线程在它的地址空间里运行，父进程被阻塞，直到子进程退出或执行exec()，子进程不能向地址空间写入。

4. 线程建立

线程建立和进程建立基本一致，经过调用clone()函数传递的参数标志，指明须要共享的资源。

建立线程

clone(CLONE_VM | CLONE_FS | CLONE_FILES | CLONE_SIGHAND, 0);

// CLONE_VM : 地址空间
// CLONE_FS : 文件系统
// CLONE_FILES : 文件描述符
// CLONE_SIGHAND : 信号处理程序及被阻断的信号

建立进程（等同fork()函数）

clone(SIGCHLD,0);

建立进程（等同vfork()函数）

clone(CLONE_VFORK | CLONE_VM | SIGCHLD, 0)

4.1 内核线程

内核线程只在内核空间执行，从不切换到用户空间。

内核线程和普通进程的区别：内核线程没有独立的地址空间。（task_struct的mm指针被设置为NULL）

内核线程只能由其余内核线程建立，经过kthreadd内核线程衍生出全部新的内核线程。（kthreadd是全部内核线程的祖宗）

4.1.1 kthreadd内核线程

kthreadd内核线程是在内核初始化时被建立，循环执行kthreadd函数，它的做用是管理调度其它的内核线程。

kthreadd函数的做用是运行kthread_create_list全局链表中维护的kthread。能够调用kthread_create函数建立一个kthread，它会被加入到kthread_create_list链表中，同时kthread_create函数会唤醒kthreadd_task。kthreadd在执行kthread会调用老的接口，kthreadd内核线程在运行kthread时，会调用老接口kernel_thread，它会运行一个名为“kthread”的内核线程，去运行建立kthread，被执行的kthread会从kthread_create_list链表中删除，而且kthreadd会不断地调用scheduler让出CPU，这个线程不能关闭。

建立内核线程，不运行

kthread_create函数（源代码 | linux/kthread.h | v5.4）是经过clone()系统调用，建立一个内核线程，但新建立的线程处于不可运行状态。

kthread_create(threadfn, data, namefmt, arg...)

建立内核线程，并运行

kthread_run函数（源代码 | linux/kthread.h | v5.4），经过调用kthread_create函数建立内核线程，而后调用wake_up_process()进行唤醒。

#define kthread_run(threadfn, data, namefmt, ...)              \
({                                     \
    struct task_struct *__k                        \
        = kthread_create(threadfn, data, namefmt, ## __VA_ARGS__); \
    if (!IS_ERR(__k))                          \
        wake_up_process(__k);                      \
    __k;                                   \
})

内核线程中止

int kthread_stop(struct task_struct *k);

5. 进程终结

释放所占用的资源，并告知父进程。

通常来讲，进程的析构是自身引发的，它发生在进程调用exit()系统调用的时候。

既能够显式地调用exit()这个系统调用，也能够隐性地从某个程序的主函数返回。（C语言编辑器会在main()函数的返回点后面放置调用exit代码）

终结的任务大部分都靠do_exit()(<kernel/exit.c>)

5.1 do_exit()函数

将task_struct中标志成员设置成PF_EXITING
调用del_timer_sync()删除任一内核定时器。确保没有定时器在排队，也没有定时器处理程序在运行。
若是BSD的记帐功能是开启的，do_exit()调用acct_update_integrals()来输出记帐信息。
调用exit_mm()函数释放进程占用的mm_struct，若是没有别的进程同时使用它们（也就是说，这个地址空间没有被共享），就完全释放它们。
调用sem__exit()函数，若是进程排队等待IPC信号，它则离开队列。
调用exit_files()和exit_fs()分别递减文件描述符，文件系统数据引用计数，若是其中某个引用计数的数值降为零，那就不用表明没有进程在使用相应的资源，此时能够释放。
把存放在task_struct的exit_code()成员中的任务退出代码置为由exit()提供的退出代码，或者去完成任何其余有内核机制规定的退出动做。退出代码存放在这里供父进程随时检索。
调用exit_notify向父进程发送信号，给子进程从新找养父（其余线程或init进程），并将存放在task_struct结构中的exit_state设置为EXIT_ZOMBIE。
do_exit调用schedule()切换到新的进程，由于处于EXIT_ZOMBIE状态的进程不会被调度，因此这是进程所执行的最后一段代码，do_exit()永不返回。

5.2 wait族函数

wait族函数都是经过惟一但很复杂的一个系统调用wait4()来实现的，挂起调用它的进程，直到其中的一个子进程退出，此时函数会返回子进程的PID。此外，调用此函数时提供的指针会包含子函数的退出代码。

做者:世至其美
博客地址:hqber.com
转载须注明以上信息, 更多文章,请访问我的博客:hqber.com