这是一个关于Posix线程编程的专栏。做者在阐明概念的基础上,将向您详细讲述Posix线程库API。本文是第四篇将向您讲述
线程停止。
1.线程终止方式
通常来讲,Posix的线程终止有两种状况:正常终止和非正常终止。线程主动调用pthread_exit()或者从线程函数中return都将使线程正常退出,这是可预见的退出方式;非正常终止是线程在其余线程的干预下,或者因为自身运行出错(好比访问非法地址)而退出,这种退出方式是不可预见的。
2.线程终止时的清理
不管是可预见的线程终止仍是异常终止,都会存在资源释放的问题,在不考虑因运行出错而退出的前提下,如何保证线程终止时能顺利的释放掉本身所占用的资源,特别是锁资源,就是一个必须考虑解决的问题。
最常常出现的情形是资源独占锁的使用:线程为了访问临界资源而为其加上锁,但在访问过程当中被外界取消,若是线程处于响应取消状态,且采用异步方式响应,或者在打开独占锁之前的运行路径上存在取消点,则该临界资源将永远处于锁定状态得不到释放。外界取消操做是不可预见的,所以的确须要一个机制来简化用于资源释放的编程。
在POSIX线程API中提供了一个pthread_cleanup_push()/pthread_cleanup_pop()函数对用于自动释放资源--从pthread_cleanup_push()的调用点到pthread_cleanup_pop()之间的程序段中的终止动做(包括调用pthread_exit()和取消点终止)都将执行pthread_cleanup_push()所指定的清理函数。API定义以下:
void pthread_cleanup_push(void (*routine) (void *), void *arg)void pthread_cleanup_pop(int execute)
pthread_cleanup_push()/pthread_cleanup_pop()采用先入后出的栈结构管理,void routine(void *arg)函数在调用pthread_cleanup_push()时压入清理函数栈,屡次对pthread_cleanup_push()的调用将在清理函数栈中造成一个函数链,在执行该函数链时按照压栈的相反顺序弹出。execute参数表示执行到pthread_cleanup_pop()时是否在弹出清理函数的同时执行该函数,为0表示不执行,非0为执行;这个参数并不影响异常终止时清理函数的执行。
pthread_cleanup_push()/pthread_cleanup_pop()是以宏方式实现的,这是pthread.h中的宏定义:
#define pthread_cleanup_push(routine,arg)\
{ struct _pthread_cleanup_buffer _buffer; \
_pthread_cleanup_push (&_buffer, (routine), (arg));
#define pthread_cleanup_pop(execute) \
_pthread_cleanup_pop (&_buffer, (execute)); }
可见,pthread_cleanup_push()带有一个"{",而pthread_cleanup_pop()带有一个"}",所以这两个函数必须成对出现,且必须位于程序的同一级别的代码段中才能经过编译。在下面的例子里,当线程在"do some work"中终止时,将主动调用pthread_mutex_unlock(mut),以完成解锁动做。
pthread_cleanup_push(pthread_mutex_unlock, (void *) &mut);
pthread_mutex_lock(&mut);/* do some work */
pthread_mutex_unlock(&mut);
pthread_cleanup_pop(0);
必需要注意的是,若是线程处于PTHREAD_CANCEL_ASYNCHRONOUS状态,上述代码段就有可能出错,由于CANCEL事件有可能在pthread_cleanup_push()和pthread_mutex_lock()之间发生,或者在pthread_mutex_unlock()和pthread_cleanup_pop()之间发生,从而致使清理函数unlock一个并无加锁的mutex变量,形成错误。所以,在使用清理函数的时候,都应该暂时设置成PTHREAD_CANCEL_DEFERRED模式。为此,POSIX的Linux实现中还提供了一对不保证可移植的pthread_cleanup_push_defer_np()/pthread_cleanup_pop_defer_np()扩展函数,功能与如下代码段至关:
{
int oldtype;
pthread_setcanceltype(PTHREAD_CANCEL_DEFERRED, &oldtype);
pthread_cleanup_push(routine, arg);
...
pthread_cleanup_pop(execute);
pthread_setcanceltype(oldtype, NULL);
}
3.线程终止的同步及其返回值
通常状况下,进程中各个线程的运行都是相互独立的,线程的终止并不会通知,也不会影响其余线程,终止的线程所占用的资源也并不会随着线程的终止而获得释放。正如进程之间能够用wait()系统调用来同步终止并释放资源同样,线程之间也有相似机制,那就是pthread_join()函数。
void pthread_exit(void *retval) int pthread_join(pthread_t th, void **thread_return)int pthread_detach(pthread_t th)
pthread_join()的调用者将挂起并等待th线程终止,retval是pthread_exit()调用者线程(线程ID为th)的返回值,若是thread_return不为NULL,则*thread_return=retval。须要注意的是一个线程仅容许惟一的一个线程使用pthread_join()等待它的终止,而且被等待的线程应该处于可join状态,即非DETACHED状态。
若是进程中的某个线程执行了pthread_detach(th),则th线程将处于DETACHED状态,这使得th线程在结束运行时自行释放所占用的内存资源,同时也没法由pthread_join()同步,pthread_detach()执行以后,对th请求pthread_join()将返回错误。
一个可join的线程所占用的内存仅当有线程对其执行了pthread_join()后才会释放,所以为了不内存泄漏,全部线程的终止,要么已设为DETACHED,要么就须要使用pthread_join()来回收。
4.关于pthread_exit()和return
理论上说,pthread_exit()和线程宿体函数退出的功能是相同的,函数结束时会在内部自动调用pthread_exit()来清理线程相关的资源。但实际上两者因为编译器的处理有很大的不一样。
在进程主函数(main())中调用pthread_exit(),只会使主函数所在的线程(能够说是进程的主线程)退出;而若是是return,编译器将使其调用进程退出的代码(如_exit()),从而致使进程及其全部线程结束运行。
其次,在线程宿主函数中主动调用return,若是return语句包含在pthread_cleanup_push()/pthread_cleanup_pop()对中,则不会引发清理函数的执行,反而会致使segment fault。