线程控制
目录
1. 线程与进程
线程的概念
线程是进程内相对独立的一个执行流,是进程内的一个执行单元,是操作系统中一个可调度的实体。
深入理解进程和线程
- 在现代操作系统中,资源分配的基本单位是进程,而cpu调度执行的基本单位是线程
- 进程不是调度单元,线程是进程使用cpu资源的基本单位
- 进程有独立的地址空间,进程中可以存在多个线程共享进程资源
- 线程不能脱离进程单独存在,只能依附于进程运行
- 线程可以在不影响进程的情况下终止,但反之则不然
2. 多线程
什么是多线程
多线程,是指从软件或硬件层面上实现多个线程并发执行的技术。
- 从软件层面看,一个进程中可以有多个线程,该程序也可以称之为多线程程序;
- 从硬件层面看,多核处理器能够支持在同一时间执行多个线程。
实际上,对于单核处理器,即使软件编写为多线程模型,同一时间也只能执行一个线程,但这并不代表此时多线程就没有意义,因为处理器的数量不会影响程序结构,那么多线程编程模型在程序结构上到底有哪些好处呢?
多线程模型的好处
- 通过为每种事件类型分配单独的处理线程,可以简化异步事件处理代码
- 可以直接共享进程的数据资源
- 将复杂问题分解为相互独立的任务,可以交叉进行,提高程序吞吐量
- 通过把处理用户输入输出的部分和其他部分分开,可以改善交互式程序响应时间
3. 线程标识
- 线程id(thread id)是线程的唯一标识
- 线程id只有在它所属的进程上下文中才有意义
- 线程id类型为
pthread_t
,可能实现为unsigned long或结构体,依系统而定 - 线程可以调用
pthread_self
获得自身线程id - 可移植的程序应该调用
pthread_equal
来比较两个线程的id
#include <pthread.h> pthread_t pthread_self(); //返回调用线程的线程id int pthread_equal(pthread_t tid1, pthread_t tid2); //相等返回非0数值,否则返回0
4. 线程创建
函数原型
任意线程可以通过调用pthread_create创建新线程,start_routine为新线程的启动例程,创建成功后,新线程和调用线程谁先运行是不确定的。
//成功返回0,失败返回错误编号 int pthread_create(pthread_t *tid, const pthread_attr_t *attr, void *(*start_routine)(void *), void *arg);
参数说明
- pthread_create成功返回后,tid指向内存即为新线程id
- attr用于定制线程属性,若使用默认属性则传null
- start_routine是线程启动例程
- arg是start_routine的参数,若参数不止一个,就把这些参数放到一个结构中,再把该结构的地址作为arg传入
使用示例-打印线程id
#include <pthread.h> #include <stdio.h> pthread_t tid; void printf_tid(const char *s) { pid_t pid = getpid(); pthread_t tid = pthread_self(); printf("%s pid = %d, tid = %lu(0x%lx)\n", s, pid, tid, tid); } void *pthread_start(void *arg) { printf_tid("new thread: "); //新线程用pthread_self()获取自身id,是因为新线程执行时pthread_create()可能还未返回,tid还未初始化完成 } int main() { pthread_create(&tid, null, pthread_start, null); sleep(1); //调用线程休眠1s,让新线程先执行 printf_tid("main thread: "); return 0; }
注意:使用pthread的代码在编译时需要指定链接-lpthread
5. 线程终止
在不影响整个进程的情况下,单个线程有三种终止方式:
- 在线程启动例程中调用
return
返回 - 在线程启动例程中调用
pthread_exit
退出 - 被进程中的其他线程取消
void pthread_exit(void *value_ptr);
value_ptr是一个无类型指针,进程中的其他线程可以调用pthread_join
访问到这个指针。
6. 线程等待
函数原型
int pthread_join(pthread_t tid, void **value_ptr); //成功返回0,失败返回错误编号
调用线程将一直阻塞,直到等待的线程以上述三种方式终止。
参数说明
- tid表示等待的线程id
- value_ptr用于保存线程的退出状态
- 如果线程以return或pthread_exit方式终止,value_ptr指向内存就被设置为return或pthread_exit的参数
- 如果线程被取消,value_ptr指向内存就被设置为
pthread_canceled
- 如果不关心线程的返回值,就给value_ptr传null
使用示例-获得线程返回值
#include <pthread.h> #include <stdio.h> void *thread1_start(void *arg) { int ret = 0; return ((void *)ret); } void *thread2_start(void *arg) { char *ret = "thread 2 exit"; pthread_exit(ret); } int main() { pthread_t tid1; pthread_t tid2; void *ret; pthread_create(&tid1, null, thread1_start, null); pthread_create(&tid2, null, thread2_start, null); pthread_join(tid1, &ret); printf("thread 1: %d\n", (int)ret); pthread_join(tid2, &ret); printf("thread 2: %s\n", (char *)ret); return 0; }
7. 线程分离
在默认情况下,线程的终止状态会一直保存到对该线程调用pthread_join;但是,如果线程已经被分离,其占用的系统资源会在线程终止时被立即回收。
有两种方式可以使线程分离:
- 调用
pthread_detach
,该函数不会使调用线程阻塞 - 修改线程属性结构
pthread_attr_t
,以分离状态创建线程
在线程被分离后,就不能再用pthread_join等待它的终止状态了,因为对分离状态的线程调用pthread_join会产生未定义行为。
pthread_detach
int pthread_detach(pthread_t tid); //成功返回0,失败返回错误编号
#include <pthread.h> #include <stdio.h> void *thread_start(void *arg) { sleep(2); printf("new thread exit\n"); pthread_exit(null); } int main() { pthread_t tid; pthread_create(&tid, null, thread_start, null); pthread_detach(tid); printf("main thread: pthread_detach() return\n"); sleep(5); return 0; }
以分离状态创建线程
/*4个函数的返回值:成功返回0,失败返回错误编号*/ int pthread_attr_init(pthread_attr_t *attr); int pthread_attr_setdetachstate(pthread_attr_t *attr, int detachstate); int pthread_attr_getdetachstate(const pthread_attr_t *attr, int *detachstate); int pthread_attr_destroy(pthread_attr_t *attr);
可以调用pthread_attr_setdetachstate
来设置线程的可分离状态:
-
detachstate = pthread_create_detached
,以分离状态启动线程 -
detachstate = pthread_create_joinable
,以正常状态启动线程
#include <pthread.h> #include <stdio.h> void *thread_start(void *arg) { sleep(2); printf("new thread exit\n"); pthread_exit(null); } int main() { pthread_t tid; pthread_attr_t attr; pthread_attr_init(&attr); pthread_attr_setdetachstate(&attr, pthread_create_detached); pthread_create(&tid, &attr, thread_start, null); pthread_attr_destroy(&attr); printf("main thread: pthread_attr_destroy() return\n"); sleep(5); return 0; }
8. 线程取消
pthread_cancel
在编写多线程代码时,经常面临线程安全退出问题,一般情况下,最好使用将标志位置位的方式;
在其他线程中将标志位置位,然后调用pthread_join等待线程退出,回收线程占用的资源。
void *thread_start(void *arg) { while (!quit) { //...... } } int main() { quit = 1; pthread_join(tid, null); }
但是在某些应用中,线程可能正阻塞于某个函数(如pthread_cond_wait)无法被唤醒,即使设置了标志位也无法结束。
此时可以在其他线程中调用pthread_cancel请求取消线程,然后立即调用pthread_join等待线程退出。
int pthread_cancel(pthread_t tid); //成功返回0,失败返回错误编号
tid为要取消的线程id,需要注意的是,pthread_cancel并不等待线程终止,它仅仅是发出请求。
#include <pthread.h> #include <stdio.h> void *thread1_start(void *arg) { sleep(10); pthread_exit(null); } void *thread2_start(void *arg) { sleep(10); pthread_exit(null); } int main() { pthread_t tid1; pthread_t tid2; pthread_create(&tid1, null, thread1_start, null); pthread_create(&tid2, null, thread2_start, null); sleep(1); pthread_cancel(tid1); pthread_join(tid1, null); printf("thread 1 exit\n"); sleep(1); pthread_cancel(tid2); pthread_join(tid2, null); printf("thread 2 exit\n"); return 0; }
线程取消属性
线程取消有两个属性,分别是可取消状态和可取消类型,这两个属性不在pthread_attr_t结构中,但它们影响着线程在响应取消请求时的行为。
/* * 可取消状态:pthread_cancel_enable(允许取消,默认属性),pthread_cancel_disable(不允许取消,但取消请求不会丢失,而是一直处于挂起状态) * 可取消类型:pthread_cancel_deferred(延迟取消,到达取消点才取消,默认属性),pthread_cancel_asynchronous(异步取消,可在任意时刻取消) */ int pthread_setcancelstate(int state, int *oldstate); //将线程可取消状态设为state,原有可取消状态通过oldstate返回,这两步是原子操作 int pthread_setcanceltype(int type, int *oldtype); //将线程可取消类型设为type,原有可取消类型通过oldtype返回
取消点
默认情况下,线程的可取消类型为延迟取消,也就是说:被取消的线程在取消请求发出后还是继续运行,直到到达某个取消点。
取消点是线程检查它是否被取消的一个位置,根据《unix环境高级编程 第3版》p362-p363描述,posix.1定义的取消点和可选取消点如下。
自定义取消点
如果线程在很长一段时间内都不会调用前面两张图中的取消点函数,那么可以调用pthread_testcancel
在线程中添加自己的取消点。
调用pthread_testcancel时,如果有某个取消请求处于挂起状态,且可取消状态为enable,那么线程就会被取消。
void pthread_testcancel();
使用线程取消的风险
当线程响应取消请求而终止时,主要面临的两大风险:
- 线程里面的锁可能没有unlock,有可能导致死锁
- 线程申请的资源(如堆内存)没有释放
下面是一段由pthread_cancel引起的死锁范例代码。
#include <pthread.h> #include <stdio.h> static pthread_cond_t cond; static pthread_mutex_t mutex; void *thread0(void *arg) { pthread_mutex_lock(&mutex); printf("thread 0 lock sucess\n"); pthread_cond_wait(&cond, &mutex); //主线程发出取消请求时,thread1阻塞于slepp(2),thread0阻塞于此取消点,导致thread0未解锁mutex就终止 printf("thread 0 pthread_cond_wait return\n"); pthread_mutex_unlock(&mutex); pthread_exit(0); } void *thread1(void *arg) { sleep(2); printf("thread 1 start lock\n"); pthread_mutex_lock(&mutex); //thread0终止约1s后,thread1执行到此,由于mutex已加锁,也没有其他地方能够对其解锁,从而导致死锁 printf("thread 1 lock sucess\n"); pthread_cond_signal(&cond); pthread_mutex_unlock(&mutex); pthread_exit(0); } int main() { pthread_t tid[2]; pthread_cond_init(&cond, null); pthread_mutex_init(&mutex, null); pthread_create(&tid[0], null, thread0, null); pthread_create(&tid[1], null, thread1, null); sleep(1); pthread_cancel(tid[0]); printf("main thread request cancel thread 0\n"); pthread_join(tid[0], null); pthread_join(tid[1], null); pthread_cond_destroy(&cond); pthread_mutex_destroy(&mutex); return 0; }
线程清理程序
可以使用线程清理程序来解决线程取消的风险问题。线程可以安排它退出时需要调用的函数,这样的函数称为线程清理程序。
一个线程可以注册多个清理程序,处理程序记录在栈中,也就是说,它们的执行顺序和注册顺序是相反的。
void pthread_cleanup_push(void (*routine)(void *), void *arg); void pthread_cleanup_pop(int execute);
当线程执行以下动作时,清理程序是由pthread_cleanup_push函数调度的,调用时只有一个参数arg:
- 调用pthread_exit结束线程
- 响应pthread_cancel取消请求
- 用非零execute参数调用pthread_cleanup_pop
注意:如果线程以return方式终止,线程清理程序不会被调用。
不管发生上述哪种情况,pthread_cleanup_pop都将删除上次pthread_cleanup_push登记的线程清理程序。
这两个函数有一个限制,由于它们经常实现为宏,所以必须在与线程启动例程相同的作用域中以配对的方式使用,否则,可能会产生编译错误。
回到线程取消的风险问题上来,我们只需要在线程清理程序中解锁和释放资源,并在线程启动例程的第一步就注册清理程序,
这样,当线程因响应取消请求而终止时,线程清理程序就会得以执行。
#include <pthread.h> #include <stdio.h> static pthread_cond_t cond; static pthread_mutex_t mutex; void cleanup(void *arg) { pthread_mutex_unlock(&mutex); printf("mutex unlock in cleanup\n"); } void *thread0(void *arg) { pthread_cleanup_push(cleanup, null); //注册线程清理程序进行解锁 pthread_mutex_lock(&mutex); printf("thread 0 lock sucess\n"); pthread_cond_wait(&cond, &mutex); //主线程发出取消请求时,thread1阻塞于slepp(2),thread0阻塞于此取消点 printf("thread 0 pthread_cond_wait return\n"); pthread_mutex_unlock(&mutex); pthread_cleanup_pop(0); pthread_exit(0); } void *thread1(void *arg) { sleep(2); printf("thread 1 start lock\n"); pthread_mutex_lock(&mutex); //thread0终止约1s后,thread1执行到此 printf("thread 1 lock sucess\n"); pthread_cond_signal(&cond); pthread_mutex_unlock(&mutex); pthread_exit(0); } int main() { pthread_t tid[2]; pthread_cond_init(&cond, null); pthread_mutex_init(&mutex, null); pthread_create(&tid[0], null, thread0, null); pthread_create(&tid[1], null, thread1, null); sleep(1); pthread_cancel(tid[0]); printf("main thread request cancel thread 0\n"); pthread_join(tid[0], null); pthread_join(tid[1], null); pthread_cond_destroy(&cond); pthread_mutex_destroy(&mutex); return 0; }
最后,引用一篇由pthread_cancel引起死锁的博客,提取核心内容如下:
“通常的说法:某某函数是cancellation points,这种方法是容易令人混淆的。因为函数的执行是一个时间过程,而不是一个时间点。其实真正的cancellation points
只是在这些函数中cancellation type被修改为phread_cancel_asynchronous和修改回pthread_cancel_deferred中间的一段时间。”