8.4  信号量

8.4.1  信号量概述

在多任务操作系统环境下,多个进程会同时运行,并且一些进程之间可能存在一定的关联。多个进程可能为了完成同一个任务会相互协作,这样形成进程之间的同步关系。而且在不同进程之间,为了争夺有限的系统资源(硬件或软件资源)会进入竞争状态,这就是进程之间的互斥关系。

 

进程之间的互斥与同步关系存在的根源在于临界资源。临界资源是在同一个时刻只允许有限个(通常只有一个)进程可以访问(读)或修改(写)的资源,通常包括硬件资源(处理器、内存、存储器以及其他外围设备等)和软件资源(共享代码段,共享结构和变量等)。访问临界资源的代码叫做临界区,临界区本身也会成为临界资源。

 

信号量是用来解决进程之间的同步与互斥问题的一种进程之间通信机制,包括一个称为信号量的变量和在该信号量下等待资源的进程等待队列,以及对信号量进行的两个原子操作(PV操作)。其中信号量对应于某一种资源,取一个非负的整型值。信号量值指的是当前可用的该资源的数量,若它等于0则意味着目前没有可用的资源。PV原子操作的具体定义如下:

 

P操作:如果有可用的资源(信号量值>0),则占用一个资源(给信号量值减去一,进入临界区代码);如果没有可用的资源(信号量值等于0),则被阻塞到,直到系统将资源分配给该进程(进入等待队列,一直等到资源轮到该进程)。

 

V操作:如果在该信号量的等待队列中有进程在等待资源,则唤醒一个阻塞进程。如果没有进程等待它,则释放一个资源(给信号量值加一)。

使用信号量访问临界区的伪代码所下所示:

 

{

    /* 设R为某种资源,S为资源R的信号量*/

    INIT_VAL(S);            /* 对信号量S进行初始化 */

    非临界区;        

    P(S);                    /* 进行P操作 */

    临界区(使用资源R);     /* 只有有限个(通常只有一个)进程被允许进入该区*/

    V(S);                    /* 进行V操作 */

    非临界区;

}

 

最简单的信号量是只能取0和1两种值,这种信号量被叫做二维信号量。在本节中,主要讨论二维信号量。二维信号量的应用比较容易地扩展到使用多维信号量的情况。

 

8.4.2  信号量的应用

1.函数说明

在Linux系统中,使用信号量通常分为以下几个步骤。

(1)创建信号量或获得在系统已存在的信号量,此时需要调用semget()函数。不同进程通过使用同一个信号量键值来获得同一个信号量。

 

(2)初始化信号量,此时使用semctl()函数的SETVAL操作。当使用二维信号量时,通常将信号量初始化为1。

 

(3)进行信号量的PV操作,此时调用semop()函数。这一步是实现进程之间的同步和互斥的核心工作部分。

 

(4)如果不需要信号量,则从系统中删除它,此时使用semclt()函数的IPC_RMID操作。此时需要注意,在程序中不应该出现对已经被删除的信号量的操作。

 

2.函数格式

表8.17列举了semget()函数的语法要点。

表8.17 semget()函数语法要点

所需头文件

#include <sys/types.h>
#include <sys/ipc.h>
#include <sys/sem.h>

函数原型

int semget(key_t key, int nsems, int semflg)

函数传入值

key:信号量的键值,多个进程可以通过它访问同一个信号量,其中有个特殊值IPC_PRIVATE。它用于创建当前进程的私有信号量

nsems:需要创建的信号量数目,通常取值为1

semflg:同open()函数的权限位,也可以用八进制表示法,其中使用IPC_CREAT标志创建新的信号量,即使该信号量已经存在(具有同一个键值的信号量已在系统中存在),也不会出错。如果同时使用IPC_EXCL标志可以创建一个新的唯一的信号量,此时如果该信号量已经存在,该函数会返回出错

函数返回值

成功:信号量标识符,在信号量的其他函数中都会使用该值

出错:-1

 

表8.18列举了semctl()函数的语法要点。

表8.18 semctl()函数语法要点

所需头文件

#include <sys/types.h>
#include <sys/ipc.h>
#include <sys/sem.h>

函数原型

int semctl(int semid, int semnum, int cmd, union semun arg)

函数传入值

semid:semget()函数返回的信号量标识符

semnum:信号量编号,当使用信号量集时才会被用到。通常取值为0,就是使用单个信号量(也是第一个信号量)

cmd:指定对信号量的各种操作,当使用单个信号量(而不是信号量集)时,常用的有以下几种:

IPC_STAT:获得该信号量(或者信号量集合)的semid_ds结构,并存放在由第4个参数arg的buf指向的semid_ds结构中。semid_ds是在系统中描述信号量的数据结构。

IPC_SETVAL:将信号量值设置为arg的val值

IPC_GETVAL:返回信号量的当前值

IPC_RMID:从系统中,删除信号量(或者信号量集)

arg:是union semnn结构,该结构可能在某些系统中并不给出定义,此时必须由程序员自己定义

union semun

{

int val;

struct semid_ds *buf;

unsigned short *array;

}

函数返回值

成功:根据cmd值的不同而返回不同的值

IPC_STAT、IPC_SETVAL、IPC_RMID:返回0

IPC_GETVAL:返回信号量的当前值 

出错:-1

 

表8.19列举了semop()函数的语法要点。

表8.19 semop()函数语法要点

所需头文件

#include <sys/types.h>
#include <sys/ipc.h>
#include <sys/sem.h>

函数原型

int semop(int semid, struct sembuf *sops, size_t nsops)

函数传入值

semid:semget()函数返回的信号量标识符

sops:指向信号量操作数组,一个数组包括以下成员:

struct sembuf

{

short sem_num;  /* 信号量编号,使用单个信号量时,通常取值为0 */ 

short sem_op;   

/* 信号量操作:取值为-1则表示P操作,取值为+1则表示V操作*/

short sem_flg; 

/* 通常设置为SEM_UNDO。这样在进程没释放信号量而退出时,系统自动

释放该进程中未释放的信号量 */

}

nsops:操作数组sops中的操作个数(元素数目),通常取值为1(一个操作)

函数返回值

成功:信号量标识符,在信号量的其他函数中都会使用该值

出错:-1

 

3.使用实例

本实例说明信号量的概念以及基本用法。在实例程序中,首先创建一个子进程,接下来使用信号量来控制两个进程(父子进程)之间的执行顺序。

 

因为信号量相关的函数调用接口比较复杂,我们可以将它们封装成二维单个信号量的几个基本函数。它们分别为信号量初始化函数(或者信号量赋值函数)init_sem()、P操作函数sem_p()、V操作函数sem_v()以及删除信号量的函数del_sem()等,具体实现如下所示:

 

/* sem_com.c */

#include "sem_com.h"

/* 信号量初始化(赋值)函数*/

int init_sem(int sem_id, int init_value) 

{

    union semun sem_union;

    sem_union.val = init_value;     /* init_value为初始值 */

    if (semctl(sem_id, 0, SETVAL, sem_union) == -1)

    {

        perror("Initialize semaphore");        

        return -1;

    }

    return 0;

}

/* 从系统中删除信号量的函数 */

int del_sem(int sem_id) 

{

    union semun sem_union;

    if (semctl(sem_id, 0, IPC_RMID, sem_union) == -1)

    {

        perror("Delete semaphore");

        return -1; 

    }

}

/* P操作函数 */

int sem_p(int sem_id)

{

    struct sembuf sem_b;

    sem_b.sem_num = 0;  /* 单个信号量的编号应该为0 */

    sem_b.sem_op = -1;  /* 表示P操作 */

    sem_b.sem_flg = SEM_UNDO; /* 系统自动释放将会在系统中残留的信号量*/

    if (semop(sem_id, &sem_b, 1) == -1) 

    {

        perror("P operation");

        return -1;

    }

    return 0;

}

/* V操作函数*/

int sem_v(int sem_id)

{

    struct sembuf sem_b;

    sem_b.sem_num = 0; /* 单个信号量的编号应该为0 */

    sem_b.sem_op = 1; /* 表示V操作 */

    sem_b.sem_flg = SEM_UNDO; /* 系统自动释放将会在系统中残留的信号量*/

    if (semop(sem_id, &sem_b, 1) == -1)

    {

        perror("V operation");

        return -1;

    }

    return 0;

}

 

现在我们调用这些简单易用的接口,可以轻松解决控制两个进程之间的执行顺序的同步问题。实现代码如下所示:

 

/* fork.c */

#include <sys/types.h>

#include <unistd.h>

#include <stdio.h>

#include <stdlib.h>

#include <sys/types.h>

#include <sys/ipc.h>

#include <sys/shm.h>

#define DELAY_TIME     3        /* 为了突出演示效果,等待几秒钟,*/

 

int main(void)

{

    pid_t result;

    int sem_id;

 

    sem_id = semget(ftok(".", 'a'),  1, 0666|IPC_CREAT); /* 创建一个信号量*/

    init_sem(sem_id, 0);

 

    /*调用fork()函数*/

    result = fork();    

    if(result ==  -1)

    {

        perror("Fork\n");

    }

    else if (result == 0) /*返回值为0代表子进程*/

    {

        printf("Child process will wait for some seconds...\n");

        sleep(DELAY_TIME);

        printf("The returned value is %d in the child process(PID = %d)\n",

 result, getpid());

        sem_v(sem_id);

    }

    else /*返回值大于0代表父进程*/

    {

        sem_p(sem_id);

        printf("The returned value is %d in the father process(PID = %d)\n",

 result, getpid());

        sem_v(sem_id);

        del_sem(sem_id);

    }    

    exit(0);

}

 

读者可以先从该程序中删除掉信号量相关的代码部分并观察运行结果。

 

$ ./simple_fork

Child process will wait for some seconds… /*子进程在运行中*/

The returned value is 4185 in the father process(PID = 4184)/*父进程先结束*/

[…]$ The returned value is 0 in the child process(PID = 4185) /* 子进程后结束了*/

 

再添加信号量的控制部分并运行结果。

 

$ ./sem_fork

Child process will wait for some seconds…

                                            /*子进程在运行中,父进程在等待子进程结束*/

The returned value is 0 in the child process(PID = 4185) /* 子进程结束了*/

The returned value is 4185 in the father process(PID = 4184) /* 父进程结束*/

 

本实例说明使用信号量怎么解决多进程之间存在的同步问题。我们将在后面讲述的共享内存和消息队列的实例中,看到使用信号量实现多进程之间的互斥。