XSI IPC通信之信号量
程序员文章站
2022-07-01 09:17:54
...
在XSI IPC通信之消息队列一节中我们介绍了消息队列,对比消息队列,本文将介绍信号量的一些常用操作。
信号量与管道、FIFO以及消息队列等IPC机制不同,它是一个用于为多进程提供对共享数据对象的访问的计数器。为了获得共享资源,进程需要执行下列操作。
(1)测试控制该资源的信号量。
(2)若此信号量的值为正,则进程可以使用该资源,并会将信号量的值减一,表示使用了一个资源单位。
(3)否则,若此信号量的值为0,则进程进入休眠状态,直到信号量值大于0才被唤醒,之后又会返回到步骤(1)。
当进程不再使用由一个信号量控制的共享资源时,该信号量值增 1,同时会唤醒正在等待此信号量的休眠进程。为了正确地实现信号量,信号量值的测试及加减操作都应当是原子操作,为此,信号量通常是在内核中实现的。
常用的信号量形式被称为二元信号量,它控制单个资源,其初始值为 1。但一般而言,信号量的初值可以是任意一个正值,表明有多少个共享资源单位可供共享应用。
不过,XSI 信号量与此相比要复杂得多。以下3种特性造成了这种不必要的复杂性。
(1)信号量并非是单个非负值,而必须定义为含有一个或多个信号量值的集合。当创建信号量时,要指定集合中信号量值的数量。
(2)信号量的创建是独立于它的初始化的。这是一个致命的缺点,因为不能原子地创建一个信号量集合,并且对该集合中的各个信号量值赋初值。
(3)即使没有进程正在使用各种形式的XSI IPC,它们仍然是存在的。有的程序在终止时并没有释放已经分配给它的信号量,后面要介绍的 undo 功能就是处理这种情况的。
下表列出了影响信号量集合的系统限制。
内核为每个信号量集合维护着一个 semid_ds 结构,一般至少包含下面这些字段。
每个信号量由一个无名结构表示,它至少包含下列成员。
在使用 XSI 信号量时,需要先调用 semget 函数来获得或创建一个信号量 ID。semctl 函数包含了多种信号量操作。semop 函数自动执行信号量集合上的操作数组。
使用 semget 函数创建一个新集合时,会对 semid_ds 结构的下列成员赋初值。
* 按XSI IPC 相似特征介绍一节中所述来初始化 ipc_perm 结构,该结构中的 mode 成员被设置为 flag 中的相应权限位。
* sem_otime 设置为 0。
* sem_ctime 设置为当前时间。
* sem_nsems 设置为 nsems。
参数 nsems 是该集合中的信号量数。如果是引用现有集合,可将其指定为 0。
semctl 函数的第 4 个参数是可选的,它的类型是 semun 联合体,是多个命令特定参数的联合,是否使用取决于所请求的命令。
cmd 参数指定下列 10 种命令中的一种,其中有 5 种是针对一个特定的信号量值的,它们用 semnum 指定该信号量集合中的一个成员。semnum 的值在 0 和 semget 函数的参数
nsems-1 之间。
* IPC_STAT:对此集合取 semid_ds 结构,并存储在由 arg.buf 指向的结构中。
* IPC_SET:按 arg.buf 指向的结构中的值,设置与此集合相关的结构中的 sem_perm.uid、sem_perm.gid 和 sem_perm.mode 字段。此命令只能由两种进程执行:一种是其有效用户 ID 等于 sem_perm.cuid 或 sem_perm.uid 的进程;另一种是具有超级用户特权的进程。
* IPC_RMID:从系统中立即删除该信号量集合。删除后其他进程在下次试图对此信号量集合进行操作时,将出错返回 EIDRM。该命令也只能由上面提及的两种进程执行。
* GETVAL:返回成员 semnum 的 semval 值。
* SETVAL:设置成员 semnum 的 semval 值为 arg.val 指定的值。
* GETPID:返回成员 semmum 的 sempid 值。
* GETNCNT:返回成员 semnum 的 semncnt 值。
* GETZCNT:返回成员 semnum 的 semzcnt 值。
* GETALL:取该集合中所有的信号量值,并存储在 arg.array 指向的数组中。
* SETALL:将该集合中所有的信号量值设置成 arg.array 指向的数组中的值。
对于除 GETALL 以外的所有 GET 命令,semctl 函数都返回相应值;对于其他命令,若成功则返回 0,否则返回 -1 并设置 errno。
semop 函数中的 semoparray 参数是一个由 sembuf 结构组成的信号量操作数组。nops 参数规定了该数组中操作的数量。对集合中每个成员的操作由 sembuf 结构中相应的 sem_op 值规定,它可以是负值、0 或正值,对各个情况的处理如下所述。
(1)sem_op 为正值:这对应于进程释放的占用的资源数。sem_op 值会加到信号量的值上。如果指定了 undo 标志(该标志对应于相应的 sem_flg 成员的 SEM_UNDO 位),则也从该进程的此信号量调整值中减去 sem_op。
(2)sem_op 为负值:这表示要获取由该信号量控制的资源。如若该信号量的值大于等于 sem_op 的绝对值(说明具有所需的资源),则从信号量值中减去 sem_op 的绝对值。如果指定了 undo 标志,则 sem_op 的绝对值也加到该进程的此信号量调整值上。如若信号量值小于 sem_op 的绝对值,则适用下列条件。
a)若指定了 IPC_NOWAIT,则 semop 函数出错返回 EAGAIN。
b)若未指定 IPC_NOWAIT,则该信号量的 semncnt 值加 1(因为调用进程将进入休眠),然后调用进程被挂起直至发生下列事件之一。
i. 此信号量值变成大于等于 sem_op 的绝对值(即某个进程已释放了某些资源)。此信号量的 semncnt 值减 1,并从信号量值中减去 sem_op 的绝对值。如果指定了 undo 标志,则 sem_op 的绝对值也加到该进程的此信号量调整值上。
ii. 从系统中删除了此信号量,此时 semop 函数出错返回 EIDRM。
iii. 进程捕捉到一个信号,并从信号处理程序返回。此时此信号量的 semncnt 值减 1(因为调用进程不再等待),并且 semop 函数出错返回 EINTR。
(3)sem_op 为 0:这表示调用进程希望等待到该信号量值变成 0。如果当前信号量值是 0,则 semop 函数立即返回。如果当前信号量值非 0,则适用下列条件。
a)若指定了 IPC_NOWAIT,则出错返回 EAGAIN。
b)若未指定 IPC_NOWAIT,则该信号量的 semzcnt 值加 1(因为调用进程将进入休眠),然后调用进程被挂起直至发生下列事件之一。
i. 此信号量值变成 0,此时会将此信号量的 semzcnt 值减 1。
ii. 从系统中删除了此信号量,此时 semop 函数出错返回 EIDRM。
iii. 进程捕捉到一个信号,并从信号处理程序返回。此时此信号量的 semzcnt 值减 1(因为调用进程不再等待),并且 semop 函数出错返回 EINTR。
semop 函数具有原子性,它或者执行数组中的所有操作,或者一个也不做。
前面说过,如果在进程终止时,它占用了经由信号量分配的资源,那么就会成为一个问题。无论何时只要为信号量操作指定了 SEM_UNDO 标志,然后分配资源(sem_op 值小于 0),那么内核就会记住对于该特定信号量,分配给调用进程多少资源(sem_op 的绝对值)。当该进程终止时,内核就会检验该进程是否还有尚未处理的信号量调整值,如果有,则按调整值对相应信号量进行处理。
如果用带有 SETVAL 或 SETALL 命令的 semctl 设置一个信号量的值,则在所有进程中,该信号量的调整值都将设置为 0。
信号量与管道、FIFO以及消息队列等IPC机制不同,它是一个用于为多进程提供对共享数据对象的访问的计数器。为了获得共享资源,进程需要执行下列操作。
(1)测试控制该资源的信号量。
(2)若此信号量的值为正,则进程可以使用该资源,并会将信号量的值减一,表示使用了一个资源单位。
(3)否则,若此信号量的值为0,则进程进入休眠状态,直到信号量值大于0才被唤醒,之后又会返回到步骤(1)。
当进程不再使用由一个信号量控制的共享资源时,该信号量值增 1,同时会唤醒正在等待此信号量的休眠进程。为了正确地实现信号量,信号量值的测试及加减操作都应当是原子操作,为此,信号量通常是在内核中实现的。
常用的信号量形式被称为二元信号量,它控制单个资源,其初始值为 1。但一般而言,信号量的初值可以是任意一个正值,表明有多少个共享资源单位可供共享应用。
不过,XSI 信号量与此相比要复杂得多。以下3种特性造成了这种不必要的复杂性。
(1)信号量并非是单个非负值,而必须定义为含有一个或多个信号量值的集合。当创建信号量时,要指定集合中信号量值的数量。
(2)信号量的创建是独立于它的初始化的。这是一个致命的缺点,因为不能原子地创建一个信号量集合,并且对该集合中的各个信号量值赋初值。
(3)即使没有进程正在使用各种形式的XSI IPC,它们仍然是存在的。有的程序在终止时并没有释放已经分配给它的信号量,后面要介绍的 undo 功能就是处理这种情况的。
下表列出了影响信号量集合的系统限制。
内核为每个信号量集合维护着一个 semid_ds 结构,一般至少包含下面这些字段。
struct semid_ds{ struct ipc_perm sem_perm; unsigned short sem_nsems; // # of semaphores in set time_t sem_otime; // last-semop() time time_t sem_ctime; // last-change time /* ... */ };
每个信号量由一个无名结构表示,它至少包含下列成员。
struct{ unsigned short semval; // semaphore value, always >= 0 pid_t sempid; // pid for last operation unsigned short semncnt; // # processes awaiting semval > curval unsigned short semzcnt; // # processes awaiting semval == 0 /* ... */ };
在使用 XSI 信号量时,需要先调用 semget 函数来获得或创建一个信号量 ID。semctl 函数包含了多种信号量操作。semop 函数自动执行信号量集合上的操作数组。
#include <sys/sem.h> int semget(key_t key, int nsems, int flag); /* 返回值:若成功,返回信号量ID;否则,返回-1 */ int semctl(int semid, int semnum, int cmd, .../* union semun arg */); /* 返回值:(见下面所述)*/ union semun{ int val; /* for SETVAL */ struct semid_ds *buf; /* for IPC_STAT and IPC_SET */ unsigned short *array; /* for GATALL and SETALL */ }; int semop(int semid, struct sembuf semoparray[], size_t nops); /* 返回值:若成功,返回 0;否则,返回-1 */ struct sembuf{ unsigned short sem_num; // member # in set (0, 1, ..., nsems-1) short sem_op; // operation (negative, 0, or pasitive) short sem_flg; // IPC_NOWAIT, SEM_UNDO };
使用 semget 函数创建一个新集合时,会对 semid_ds 结构的下列成员赋初值。
* 按XSI IPC 相似特征介绍一节中所述来初始化 ipc_perm 结构,该结构中的 mode 成员被设置为 flag 中的相应权限位。
* sem_otime 设置为 0。
* sem_ctime 设置为当前时间。
* sem_nsems 设置为 nsems。
参数 nsems 是该集合中的信号量数。如果是引用现有集合,可将其指定为 0。
semctl 函数的第 4 个参数是可选的,它的类型是 semun 联合体,是多个命令特定参数的联合,是否使用取决于所请求的命令。
cmd 参数指定下列 10 种命令中的一种,其中有 5 种是针对一个特定的信号量值的,它们用 semnum 指定该信号量集合中的一个成员。semnum 的值在 0 和 semget 函数的参数
nsems-1 之间。
* IPC_STAT:对此集合取 semid_ds 结构,并存储在由 arg.buf 指向的结构中。
* IPC_SET:按 arg.buf 指向的结构中的值,设置与此集合相关的结构中的 sem_perm.uid、sem_perm.gid 和 sem_perm.mode 字段。此命令只能由两种进程执行:一种是其有效用户 ID 等于 sem_perm.cuid 或 sem_perm.uid 的进程;另一种是具有超级用户特权的进程。
* IPC_RMID:从系统中立即删除该信号量集合。删除后其他进程在下次试图对此信号量集合进行操作时,将出错返回 EIDRM。该命令也只能由上面提及的两种进程执行。
* GETVAL:返回成员 semnum 的 semval 值。
* SETVAL:设置成员 semnum 的 semval 值为 arg.val 指定的值。
* GETPID:返回成员 semmum 的 sempid 值。
* GETNCNT:返回成员 semnum 的 semncnt 值。
* GETZCNT:返回成员 semnum 的 semzcnt 值。
* GETALL:取该集合中所有的信号量值,并存储在 arg.array 指向的数组中。
* SETALL:将该集合中所有的信号量值设置成 arg.array 指向的数组中的值。
对于除 GETALL 以外的所有 GET 命令,semctl 函数都返回相应值;对于其他命令,若成功则返回 0,否则返回 -1 并设置 errno。
semop 函数中的 semoparray 参数是一个由 sembuf 结构组成的信号量操作数组。nops 参数规定了该数组中操作的数量。对集合中每个成员的操作由 sembuf 结构中相应的 sem_op 值规定,它可以是负值、0 或正值,对各个情况的处理如下所述。
(1)sem_op 为正值:这对应于进程释放的占用的资源数。sem_op 值会加到信号量的值上。如果指定了 undo 标志(该标志对应于相应的 sem_flg 成员的 SEM_UNDO 位),则也从该进程的此信号量调整值中减去 sem_op。
(2)sem_op 为负值:这表示要获取由该信号量控制的资源。如若该信号量的值大于等于 sem_op 的绝对值(说明具有所需的资源),则从信号量值中减去 sem_op 的绝对值。如果指定了 undo 标志,则 sem_op 的绝对值也加到该进程的此信号量调整值上。如若信号量值小于 sem_op 的绝对值,则适用下列条件。
a)若指定了 IPC_NOWAIT,则 semop 函数出错返回 EAGAIN。
b)若未指定 IPC_NOWAIT,则该信号量的 semncnt 值加 1(因为调用进程将进入休眠),然后调用进程被挂起直至发生下列事件之一。
i. 此信号量值变成大于等于 sem_op 的绝对值(即某个进程已释放了某些资源)。此信号量的 semncnt 值减 1,并从信号量值中减去 sem_op 的绝对值。如果指定了 undo 标志,则 sem_op 的绝对值也加到该进程的此信号量调整值上。
ii. 从系统中删除了此信号量,此时 semop 函数出错返回 EIDRM。
iii. 进程捕捉到一个信号,并从信号处理程序返回。此时此信号量的 semncnt 值减 1(因为调用进程不再等待),并且 semop 函数出错返回 EINTR。
(3)sem_op 为 0:这表示调用进程希望等待到该信号量值变成 0。如果当前信号量值是 0,则 semop 函数立即返回。如果当前信号量值非 0,则适用下列条件。
a)若指定了 IPC_NOWAIT,则出错返回 EAGAIN。
b)若未指定 IPC_NOWAIT,则该信号量的 semzcnt 值加 1(因为调用进程将进入休眠),然后调用进程被挂起直至发生下列事件之一。
i. 此信号量值变成 0,此时会将此信号量的 semzcnt 值减 1。
ii. 从系统中删除了此信号量,此时 semop 函数出错返回 EIDRM。
iii. 进程捕捉到一个信号,并从信号处理程序返回。此时此信号量的 semzcnt 值减 1(因为调用进程不再等待),并且 semop 函数出错返回 EINTR。
semop 函数具有原子性,它或者执行数组中的所有操作,或者一个也不做。
前面说过,如果在进程终止时,它占用了经由信号量分配的资源,那么就会成为一个问题。无论何时只要为信号量操作指定了 SEM_UNDO 标志,然后分配资源(sem_op 值小于 0),那么内核就会记住对于该特定信号量,分配给调用进程多少资源(sem_op 的绝对值)。当该进程终止时,内核就会检验该进程是否还有尚未处理的信号量调整值,如果有,则按调整值对相应信号量进行处理。
如果用带有 SETVAL 或 SETALL 命令的 semctl 设置一个信号量的值,则在所有进程中,该信号量的调整值都将设置为 0。
上一篇: 如何搭建 MySQL 高可用高性能集群
下一篇: Python TIPs