第 8 章

第 8 章 线程

本章重点 • 线程的基本概念 • 线程相关函数及应用 • 线程同步互斥

8.1 线程概述 • 线程定义为进程内一个执行单元或一个可调度实体。在不拥有线程的进程概念中，进程既是一个拥有资源的独立单位，它可独立分配虚地址空间、主存和其它，又是一个可独立调度和分派的基本单位。在有了线程以后，资源拥有单位称为进程（或任务），调度的单位称为线程、又称轻进程（Light Weight Process，LWP）。 • 多线程的进程在同一地址空间内包括多个不同的控制流，也即属于同一进程下的线程，它们共享进程拥有的资源，如代码、数据、文件等。线程也独占一些资源，如堆栈、程序计数器等。多线程系统的优点包括对用户响应的改进，进程内的资源共享，以及利用多处理器体系结构的便利。

8.1 线程概述 • 从实现的角度看，把线程分为用户级线程和内核级线程。 • 用户级线程对程序员来说是可见的，而对内核来说是未知的，用户空间的线程库通常用以管理用户级线程，线程库提供对线程创建、调度和管理的支持。 • 内核级线程由操作系统支持和管理，在内核空间实现线程创建、调度和管理。 • 用户级线程与内核级线程相比，优点是创建和管理要更快；缺点是得到CPU的时间更少，当一个线程阻塞时，连累其它线程全部阻塞。 • 有三种不同模型将用户级线程和内核级线程关联起来： • 多对一模型将多个用户线程映射到一个内核线程； • 一对一模型将每个用户线程映射到一个相应的内核线程； • 多对多模型将多个用户线程在同样（或更少）数量的内核线程之间切换。

8.1 线程概述 • Linux把线程和进程一视同仁，每个线程拥有属于自己的task_struct结构(任务结构)，不过线程本身拥有的资源少，共享进程的资源，如：共享地址空间、文件系统资源、文件描述符和信号处理程序。 Linux提供了Pthread create()创建线程。 • Pthread 是由POSIX 标准(IEEE 1003.1d 为线程创建和同步定义的API ，这是线程行为的规范，而不是实现。Linux实现了POSIX标准线程 API（pthreads）。 • 在Linux环境下的实际应用中,一般使用Pthread提供的API来编写多线程应用程序。编写Linux下的多线程程序，需要使用头文件pthread.h，在Linux上线程函数位于libpthread共享库中，在编译时要加上-lpthread选项。

8.2 线程创建 • 函数 pthread_create()用于创建线程。原线程在调用pthread_create()后立刻返回，继续执行之后的指令，同时，新线程开始执行线程函数。Linux调度各个线程，它们并发执行，因此程序不能依赖两个线程得到执行的特定先后顺序。 • pthread_create函数说明

8.2 线程创建 • pthread_create成功返回后，新创建的线程的id被填写到thread参数所指向的内存单元。我们知道进程id的类型是pid_t，每个进程的id在整个系统中是唯一的，调用getpid可以获得当前进程的id，是一个正整数值。线程id的类型是thread_t，它只在当前进程中保证是唯一的，Linux中thread_t类型是一个地址值，调用pthread_self得到的线程id。 • 例8.1 设计使用pthread线程库创建一个新线程，在父进程（也可以称为主线程）和新线程中分别显示进程id和线程id，并观察线程id数值。 • 步骤1 编辑源程序代码。 [root@localhost root]#vim 8-1.c

8.2 线程创建 • 步骤2 用gcc编译程序。 [root@localhost root]# gcc –o 8-1 –lpthread 8-1.c • 步骤3 运行程序。 [root@localhost root]# ./8-1 我是父进程: pid =3400 tid =3086882480(0xb7fe16b0) 我是新线程: pid =3400 tid =3086879648(0xb7fe0ba0) • 新线程和父进程的进程id值都是3400，父进程(主线程)和新线程id值很大，其实它们是一个地址，线程结构的地址。思考题1：进程在一个全局变量ntid中保存了新创建的线程的id，如果新创建的线程不调用pthread_self而是直接打印这个ntid，能不能达到同样的效果？思考题2：在例8.1中，如果没有sleep(5)函数，会出现什么结果？

8.2 线程创建 • 线程的退出不能简单使用exit()函数，因为一旦使用了exit()函数，实际上是整个进程的退出，会导致其他线程也随着进程的消亡而消亡。 • 在一般状况下，一个线程有两种主动退出方式。 • 方式1：当线程执行的函数(严格来说应称线程的代码)返回的时，线程也结束，线程函数的返回值也被作为线程的返回值。 • 方式2：则是线程显式调用pthread_exit。这个函数可以直接在线程函数中调用，也可以在其它直接、间接被线程函数调用的函数中调用。void pthread_exit(void *value_ptr)，value_ptr 是一个无类型指针，相当于线程的退出码，它通过pthread_join()访问到。 • pthread_exit函数说明

8.2 线程创建 • 线程创建完毕后，创建线程的线程可以使用pthread_join() 函数等待被创建的线程的结束。pthread_join()函数会挂起自身线程的执行，直到指定的线程thread结束。 • pthread_join() 函数类似wait的函数，但是等待的是线程而不是进程。 • pthread_join()接受两个参数：线程ID和一个指向void*类型变量的指针，用于接收线程的返回值。如果你对线程的返回值不感兴趣，则将NULL作为第二个参数。 • pthread_join函数说明

8.2 线程创建 • 例8.2 编写一个线程退出和等待的程序。 • 步骤1 编辑源程序代码。 [root@localhost root]#vi 8-2.c

8.2 线程创建 • 步骤2 用gcc编译程序。 [root@localhost root]# gcc –o 8-2 –lpthread 8-2.c • 步骤3 运行程序。 [root@localhost root]# ./8-2 thread 1 returning thread 2 exiting thread 1 exit code 1 thread 2 exit code 2 • 一般情况下，一个线程在它正常结束（通过从线程函数返回或者调用pthread_exit退出）的时候终止。但是，一个线程可以请求另外一个线程中止,这被成为取消一个线程。要取消一个线程，以被取消的线程ID作为参数调用pthread_cancel()函数。一个被取消的线程可以稍后被其它线程等待；实际上，你应该对一个被取消的线程执行pthread_wait以释放它占用的资源，除非这个线程是脱离线程。一个取消线程的返回值由特殊值PTHREAD_CANCELED指定。

8.3 线程同步与互斥 • 当并发执行的线程共享数据时，各线程会改写共享的数据，由于CPU调度顺序的不确定性，造成线程运行结果的不确定性。所以，必须为共享数据的一组相互协作的线程提供互斥。一种思想是确保在任何时刻最多只能有一个线程执行这些访问共享数据的代码。这就是临界区互斥问题。 • 线程在并发执行时为了保证结果的可再现性，各线程执行序列必须加以限制以保证互斥地使用临界资源，相互合作完成任务。多个相关线程在执行次序上的协调称为线程同步。用于保证多个线程在执行次序上的协调关系的相应机制称为线程同步机制。

8.3 线程同步与互斥 • Pthread线程库提供了多种方式来处理线程同步互斥机制，最常用的是互斥锁、条件变量和信号量。 • 1）互斥锁（mutex，全称MUTual EXclusion locks，）通过锁机制实现线程间的互斥。同一时刻只有一个线程可以锁定它。当一个锁被某个线程锁定的时候，如果有另外一个线程尝试锁定这个临界区（互斥体），则这第二个线程会被阻塞，或者说被置于等待状态。只有当第一个线程释放了对临界区的锁定，第二个线程才能从阻塞状态恢复运行。。 • 2）条件变量（cond）是利用线程间共享的全局变量进行同步的一种机制。 • 3）信号量，如同进程一样，线程也可以通过信号量来实现通信。用信号量可以实现传统操作系统P、V操作。Linux信号量机制不属于Pthread API，而属于POSIX SEM的扩展。

8.3.1 互斥锁 • 例8.3 下列程序说明在共享内存变量访问中冲突的现象。 #include <stdio.h> #include <stdlib.h> #include <pthread.h> #define nLOOP 10 int counter=0; /* 共享变量*/ void *pthread(void *vptr) { int i, val; for (i = 0; i < nLOOP; i++) { val = counter; sleep(vptr); printf("%x: %d\n", (unsigned int)pthread_self(), counter); counter=val+1; } return NULL; } int main(int argc, char **argv) { pthread_t tid1, tid1; pthread_create(&tid1, NULL, pthread, (void *)1); pthread_create(&tid2, NULL, pthread, (void *)2); pthread_join(tid1, NULL); pthread_join(tid2, NULL); return 0; } 编译并运行程序：结果是10 我们创建两个线程，counter的初值为0，各自把counter增加10次，正常情况下最后counter应该等于20

8.3.1 互斥锁 • 对于多线程的程序，访问冲突的问题是很普遍的，解决的办法是使用互斥锁，获得锁的线程可以完成“读/修改/写”的操作，然后释放锁给其它线程，没有获得锁的线程只能等待而不能访问共享数据，这样“读/修改/写”操作组成一个原子操作，要么都执行，要么都不执行，不会执行到中间被打断，也不会在其它处理器上并行做这个操作。 • 互斥锁用来保证一段时间内只有一个线程在执行一段代码。常用的函数有： int pthread_mutex_init(pthread_mutex_t *mutex, const thread_mutexattr_t *mutexattr); int pthread_mutex_lock(pthread_mutex_t *mutex); int pthread_mutex_trylock(pthread_mutex_t *mutex); int pthread_mutex_unlock(pthread_mutex_t *mutex); int pthread_mutex_destroy(pthread_mutex_t *mutex);

8.3.1 互斥锁 • pthread_mutex_init() 用来初始化mutex，并且使用mutexattr参数来传递初始化mutex需要定义的属性，如果属性指针为NULL，则默认属性将被赋予新建的临界区。 • pthread_mutex_lock() 用来获得mutex，如果当前线程想要获取的mutex已经被其他线程锁定，那么调用pthread_mutex_lock() 将使得当前线程处于等待状态； • pthread_mutex_trylock()函数和pthread_mutex_lock()函数功能基本一致，只不过此函数是“尝试”获得mutex，如果不能获得，其将立刻返回，并继续线程的执行 • pthread_mutex_unlock()函数用来释放mutex锁，以便供其他线程使用。在使用完毕mutex后，应该使用pthread_mutex_destroy() 函数来释放mutex资源。

8.3.1 互斥锁 • 例8.4 互斥锁程序举例。 • 步骤1 编辑源程序代码。 [root@localhost root]#vi 8-4.c

8.3.1 互斥锁 • 步骤2 用gcc编译程序。 [root@localhost root]# gcc –o 8-4 –lpthread 8-4.c • 步骤3 运行程序。编译成功后，运行可执行文件8-4，输入“./8-4”，运行结果如下： pthread1：第0次循环，第1次打印 lock_var=1 pthread1：第0次循环，第2次打印 lock_var=1 pthread2：第0次循环 lock_var=2 pthread1：第1次循环，第1次打印 lock_var=3 pthread1：第1次循环，第2次打印 lock_var=3 pthread2：第1次循环 lock_var=4 pthread2：第2次循环 lock_var=5 pthread2：第3次循环 lock_var=6 pthread2：第4次循环 lock_var=7

8.3.1 互斥锁 • 思考题：在8.4例子中，把所有的pthread_mutex_lock(&mutex)和pthread_mutex_unlock(&mutex)代码改成/*pthread_mutex_lock(&mutex)*/和/*pthread_mutex_unlock(&mutex)*/，也就是不对访问共享变量lock_var进行互斥。编译并运行程序，观察pthread1同一次循环的第1次打印和第2次打印的结果是否相同？如果在应用程序中产生这样的情况，会发生什么后果？

8.3.2 条件变量 • 使用互斥锁来实现线程间访问共享数据，互斥锁只有两种状态：锁定和非锁定。 • 条件变量通过允许线程阻塞和等待另一个线程发送信号的方法弥补了互斥锁的不足，它常和互斥锁一起使用。 • 使用时，条件变量被用来阻塞一个线程，当条件不满足时，线程往往解开相应的互斥锁并等待条件发生变化。一旦其它的某个线程改变了条件变量，它将通知相应的条件变量唤醒一个或多个正被此条件变量阻塞的线程。这些线程将重新锁定互斥锁并重新测试条件是否满足。一般说来，条件变量可以用来进行线程间的同步。

8.3.2 条件变量 • 条件变量的结构为pthread_cond_t • 函数pthread_cond_init（）被用来初始化一个条件变量。它的原型为： int pthread_cond_init (pthread_cond_t *cond, const pthread_condattr_t *cond_attr); • 其中cond是一个指向结构pthread_cond_t的指针，cond_attr是一个指向结构pthread_condattr_t的指针。 • 结构pthread_condattr_t是条件变量的属性结构，和互斥锁一样我们可以用它来设置条件变量是进程内可用还是进程间可用，默认值是 PTHREAD_ PROCESS_PRIVATE，即此条件变量被同一进程内的各个线程使用。 • 注意初始化条件变量只有未被使用时才能重新初始化或被释放。 • 条件变量也可以用宏定义PTHEAD_COND_INITIALIZER初始化，相当于用pthread_cond_init函数初始化并且attr参数为NULL，如：pthread_cond_t cond = PTHREAD_COND_INITIALIZER;

8.3.2 条件变量 • 释放一个条件变量的函数为pthread_cond_destroy（pthread_cond_t *cond）。　 • 函数pthread_cond_wait（）使线程阻塞在一个条件变量上。它的函数原型为： int pthread_cond_wait (pthread_cond_t *cond, pthread_mutex_t *mutex); • 线程解开mutex指向的锁并被条件变量cond阻塞。 • 线程可以被函数pthread_cond_signal和函数 pthread_cond_broadcast唤醒，但是要注意的是，条件变量只是起阻塞和唤醒线程的作用，具体的判断条件还需用户给出，例如一个变量是否为0等等。线程被唤醒后，它将重新检查判断条件是否满足，如果还不满足，一般说来线程应该仍阻塞在这里，被等待被下一次唤醒。这个过程一般用while语句实现。

8.3.2 条件变量 • 另一个用来阻塞线程的函数是pthread_cond_timedwait（），它的原型为： int pthread_cond_timedwait (pthread_cond_t *cond,pthread_mutex_t *mutex, const struct timespec *abstime); • 它比函数pthread_cond_wait（）多了一个时间参数，经历abstime段时间后，即使条件变量不满足，阻塞也被解除。 • 函数pthread_cond_signal（）的原型为： int pthread_cond_signal (pthread_cond_t *cond); • 它用来释放被阻塞在条件变量cond上的一个线程。 • 多个线程阻塞在此条件变量上时，哪一个线程被唤醒是由线程的调度策略所决定的。 • 注意：必须用保护条件变量的互斥锁来保护这个函数，否则条件满足信号又可能在测试条件和调用pthread_cond_wait函数之间被发出，从而造成无限制的等待。

8.3.2 条件变量 • 一个简单的例子 pthread_mutex_t count_lock; /*定义互斥锁*/ pthread_cond_t count_nonzero; /*定义条件变量*/ unsigned count; decrement_count() { pthread_mutex_lock (&count_lock); while(count==0) /*count等于0，阻塞等待*/ pthread_cond_wait( &count_nonzero, &count_lock); count=count -1; pthread_mutex_unlock (&count_lock); } increment_count(){ pthread_mutex_lock(&count_lock); if(count==0) /*count等于0，唤醒等待的线程*/ pthread_cond_signal(&count_nonzero); count=count+1; pthread_mutex_unlock(&count_lock); } • count值为0时， decrement_count函数在pthread_cond_wait处被阻塞，并打开互斥锁count_lock。此时，当调用到函数 increment_count时，pthread_cond_signal（）函数改变条件变量，告知decrement_count（）停止阻塞。读者可以试着让两个线程分别运行这两个函数，看看会出现什么样的结果。

8.3.2 条件变量 • 例8.5下面的程序演示了一个生产者-消费者的例子，生产者生产一个结构体串在链表的表头上，消费者从表头取走结构体。 • 步骤1 编辑源程序代码。 [root@localhost root]#vi 8-5.c

8.3.2 条件变量 • 步骤2 用gcc编译程序。 [root@localhost root]# gcc –o 8-5 –lpthread 8-5.c • 步骤3 运行程序。 [root@localhost root]# ./8-5 Produce 574 Consume 574 Produce 320 Consume 320 Produce 887 Consume 887 ……

8.3.3 信号量 • 信号量是操作系统中解决进程或线程同步与互斥的最重要机制之一。Linux内核提供System V的信号量机制，用于实现进程之间通信，本章只介绍POSIX的信号量机制。 • 信号量有关的一些函数，都在头文件 /usr/include/semaphore.h中定义。 • 信号量的数据类型为结构sem_t，它本质上是一个长整型的数。 • 初始化一个信号量：sem_init（） (在操作系统中,所有的参量和系统都要初始化,例如:OSInit() OS-II初始化,BSP_Init()硬件平台初始化(RCC_Configuration()时钟配置.GPIO_Configuration()串口引脚配置etc) 它的原型为： int sem_init (sem_t *sem, int pshared, unsigned int value);sem为指向信号量结构的一个指针；pshared不为０时此信号量在进程间共享，否则只能为当前进程的所有线程共享；value给出了信号量的初始值。

8.3.3 信号量 • 阻塞线程：sem_wait( sem_t *sem )。被用来阻塞当前线程直到信号量sem的值大于0，解除阻塞后将sem的值减一，表明公共资源经使用后减少。函数sem_trywait ( sem_t *sem )是函数sem_wait（）的非阻塞版本，它直接将信号量sem的值减一。相当于P操作。 • 增加信号量的值：sem_post( sem_t *sem )。当线程阻塞在这个信号量上时，调用这个函数会使其中的一个线程不再阻塞，选择机制同样是由线程的调度策略决定的。相当于V操作。 • 释放信号量资源：sem_destroy(sem_t *sem)，用来释放系统中信号量sem所占有的资源。

8.3.3 信号量 • 例8.6 编写程序实现操作系统中经典的同步问题：生产者-消费者问题。使用linux的Pthread线程库，创建2个生产者线程和2个消费者线程。生产者线程计算当前的时间，把时间和线程ID作为一个消息，把消息放入缓冲区，消费者线程从缓冲区读出一个消息并显示消息。缓冲区大小为5个，每个生产者线程生产10个消息，每个消费者线程消费10个消息，即生产和消费分别为20次。

8.3.3 信号量 • 例8.7另一个使用信号量的例子。这个例子比8-6要简单，在这个例子中，一共有4个线程，其中两个线程负责从文件读取数据到公共的缓冲区，另两个线程从缓冲区读取数据作不同的处理（加和乘运算）。 • 步骤1 编辑源程序代码。 [root@localhost root]#vi 8-7.c

8.3.3 信号量 • 步骤2 用gcc编译程序。 [root@localhost root]# gcc –o 8-7 –lpthread 8-7.c • 步骤3 运行程序。先编辑好数据文件file1.dat和file2.dat，假设它们的内容分别为1 2 3 4 5 6 7 8 9 10和 -1 -2 -3 -4 -5 -6 -7 -8 -9 -10 编译成功后，运行可执行文件8-7，输入“./8-7”，此时系统运行结果如下： [root@localhost root]# ./8-7 Plus:0+0=0 Multiply:0*0=0 Plus:0+0=0 Multiply:0*0=0 Plus:-9+-10=-19 Multiply:-9*-10=90 Plus:-5+-6=-11 Multiply:-5*-6=30 Plus:-1+-2=-3 Multiply:-1*-2=2 Plus:5+6=11 Multiply:3*4=12 调整sleep函数的值，再一次编译并运行8-7程序，你会看到输出的结果不一样。这就是各个线程间的竞争关系，数值并未按我们原先的顺序显示出来，这是由于共享变量size被各个线程任意修改的缘故。这也往往是多线程编程要注意的问题。

思考与实验 • Fibonacci 序列为0 ,1,1,2,3,5 ,8,…，通常，这可表达为: fib0=0 fibl = 1 fibn = fibn-1 +fibn-2 • 编写一个多线程程序来生成Fibonacci 序列。程序应该这样工作:用户运行程序时在命令行输入要产生Fibonacci序列的数，然后程序创建一个新的线程来产生Fibonacci数，把这个序列放到线程共享的数据中(数组可能是一种最方便的数据结构)。当线程执行完成后，父线程将输出由子线程产生的序列。由于在子线程结束前，父线程不能开始输出Fibonacci 序列，因此父线程必须等待子线程的结束。

思考与实验 • 使用多线程编写矩阵乘法程序。给定两个矩阵A和B，其中A是具有m行、k列的矩阵， B为k行、n列的矩阵， A和B的矩阵积为矩阵C，C为m行、n列。矩阵C中第i行、第j列的元素Ci,j就是矩阵A第i行每个元素和矩阵B第j列每个元素乘积的和。 • 例如，如果A是3×2的矩阵， B是2×3的矩阵，则元素C3,1 将是A 3,1× B1,1和A3,2×B2,1 的和。 • 对于该程序，计算每个Ci,j 是一个独立的工作线程，因此它将会涉及生成M×N个工作线程。主线程(或称为父线程)将初始化矩阵A和B，井分配足够的内存给矩阵C，它将容纳矩阵A和B的积。这些矩阵将声明为全局数据，以使每个工作线程都能访问矩阵A、B和C。 • 矩阵A和B可以静态初始化为, 如: #define m 3 #define k 2 #define n 3 int A [m] [k] = { {1 , 4 } , {2 , 5 } , {3 , 6} }; int B [k] [n] = { {8 , 7, 6 }, {5 , 4, 3 } }; int C [m] [n]; 或者，它们也可以从一个文件中读入，建议采用较大矩阵（如矩阵C为100×100）进行测试。

思考与实验 • 兄弟俩共同使用一个帐号，每次限存或取10元，存钱与取钱的线程分别如下所示： int amount:=0; Thread SAVE(){ int m1; m1=amount; m1=m1+10; amount=m1; } Thread TAKE(){ int m2; m2=amount; m2=m2-10; amount=m2; } • 由于兄弟俩可能同时存钱和取钱，因此两个线程是并发的。若哥哥先存了两次钱，但在第三次存钱时，弟弟在取钱。请问最后帐号amount上面可能出现的值？编写程序，用互斥锁或信号量机制实现兄弟俩存钱和取钱操作。

思考与实验 • 现有4个线程R1、R2、W1和W2，它们共享可以存放一个数的缓冲器B。线程R1每次把从键盘上投入的一个数存放到缓冲器B中，供线程W1打印输出；线程R2每次从磁盘上读一个数放到缓冲器B中，供线程W2打印输出。当一个线程把数据存放到缓冲器后，在该数还没有被打印输出之前不准任何线程再向缓冲器中存数。在缓冲器中还没有存入一个新的数之前不允许任何线程加快从缓冲区中取出打印。编写程序，采用互斥锁或信号量机制使这4个线程并发执行协调工作。提示，互斥锁和信号量定义如下： • 互斥锁S：表示能否把数存人缓冲器B，初始值为1。 • 信号量S1：表示R1是否已向缓冲器存入从键盘上读入一个数，初始值为0。 • 信号量S2：表示R2是否已向缓冲器存入从磁盘上读入一个数，初始值为0。

思考与实验 • 有两个线程T1和T2动作描述如下，x、y、z为两个线程共享变量。信号量S1和S2的初值均为0，编写程序完成下面两个线程T1、T2并发执行。不断调整sleep(n)的n值，多次运行程序后，观察x、y、z输出的值，各为多少？线程T1：线程T2： y=1; x=1; y=y+2; x=x+1; sem_post(&S1); sem_wait(&S1); z=y+1; x=x+y; sleep(n) sleep(n) sem_wait(&S2); sem_post(&S2); y=z+y; z=x+z;

第 8 章

第 8 章

Presentation Transcript