# 进程的概念、组成、特征

# 进程概念

  1. 程序:是静态的,就是个存放在磁盘里的可执行文件
  2. 进程:是动态的,是程序的一次执行过程

# 进程组成 ——PCB

  1. 当进程被创建时,操作系统会为该进程分配一个唯一的,不重复的身份证号 ——PID
  2. 操作系统记录 PID,进程所属用户 ID(UID 基本的进程描述信息,用于操作系统区分各个进程)
  3. 记录进程分配了哪些资源(分配了多少内存,哪些正在使用的 IO 设备,正在使用哪些文件)
  4. 记录进程运行情况(CPU 使用时间,磁盘使用情况,网络流量等)

这些信息块都被存在一个数据结构 PCB(Process Control Block)中,进程控制块

# PCB 组成

  1. 进程描述信息
    1. 进程标识符 PID
    2. 用户标识符 UID
  2. 进程控制和管理信息
    1. CPU、磁盘、网络流量使用情况等
    2. 进程当前状态:就绪态 / 阻塞态 / 运行态等
  3. 资源分配清单
    1. 正在使用哪些文件
    2. 正在使用哪些内存区域
    3. 正在使用哪些 IO 设备
  4. 处理机相关信息
    1. 如 PSW,PC 等等各种寄存器的值(用于实现进程切换)

# 进程的组成 —— 程序段、数据段

  1. 程序段:程序代码(指令序列)
  2. 数据段:运行过程中产生的各种数据

PCB 是给操作系统使用的,程序段、数据段是给进程自己使用的

程序段、数据段、PCB 三部分构成了进程实体(进程映像)

# 进程特征

  1. 动态性:进程是程序的一次执行过程,是动态产生,变化和消亡的
  2. 并发性:内存中有多个进程实体,各进程可以并发执行
  3. 独立性:进程是独立运行、独立获取资源、独立接受调度的最基本单位
  4. 异步性:各进程按各自独立,不可预知的速度向前推进,操作系统要提供进程同步机制来解决异步问题
  5. 结构性:每个进程都会配置一个 PCB,结构上看,进程由程序段,数据段,PCB 组成

# 进程的状态 & 转换、进程的组织

# 进程的状态

# 创建态

进程正在被创建时,它的状态是创建态,在这个阶段操作系统会为进程分配资源,初始化 PCB

# 就绪态

当进程创建完成后,便进入就绪态,处于就绪态的进程已经具备运行条件,但由于没有空闲的 CPU,就暂时不能运行

# 运行态

如果一个进程此时在 CPU 上运行,那么整个进程处于运行态,CPU 会执行该进程对应的程序

# 阻塞态

在进程运行过程中,可能会请求等待某个事件的发生,在这个事件发生之前,进程无法向下进行执行,此时操作系统会让这个进程下 CPU 进入阻塞态

# 终止态

一个进程可以执行 exit 系统调用,请求操作系统终止该进程,此时就会进入终止态,操作系统会终止进程下的 CPU,并回收内存空间等资源,最后还要回收该进程的 PCB

# 进程状态的转换

image-20230127103317089

进程 PCB 中,会有一个变量 state 来标识进程当前状态,如 1 表示创建态,2 表示就绪态

# 进程组织 —— 链接方式

image-20230127103526978

image-20230127103554220

# 进程组织 —— 索引方式

image-20230127103620345

# 进程组织方式

  1. 链接方式
    1. 按照进程状态将 PCB 分为多个队列
    2. 操作系统持有指向各个队列的指针
  2. 索引方式
    1. 根据进程状态的不同,建立几张索引表
    2. 操作系统持有指向各个索引表的指针

# 进程控制

# 进程控制概述

进程控制的主要功能是对系统中的所有进程实施有效的管理,它具有创建新进程、撤销已有进程、实现进程状态转换等功能

# 实现进程控制

  1. 用原语实现(原子性,一气呵成)
  2. 如果执行过程中不能一气呵成,就有可能导致操作系统中某些关键数据结构信息不统一的情况,这会影响操作系统进行别的管理工作

# 原语

  1. 原语的执行具有原子性,即执行过程中只能一气呵成,期间不允许中断
  2. 可以用关中断指令和开中断指令这两个特权指令实现原子性
  3. COU 在执行了关中断指令之后,就不再例行检查中断信号,直到执行开中断指令之后才会恢复检查

image-20230420215820797

# 进程控制相关的原语

# 进程的创建

# 创建原语

  1. 申请空白的 PCB
  2. 为新进程分配所需资源
  3. 初始化 PCB
  4. 将 PCB 插入就绪队列

# 引入进程创建的事件

  1. 用户登录:分时系统中,用户登录成功,系统会创建为其建立一个新的进程
  2. 作业调度:多道批处理系统中,有新的作业放入内存时,会为其建立一个新的进程
  3. 提供服务:用户向操作系统提出某些请求时,会创建一个进程处理该请求
  4. 应用请求:由用户进程主动请求创建一个子进程

# 进程的终止

# 撤销原语

  1. 从 PCB 集合中找到终止进程的 PCB
  2. 若进程正在执行,立即剥夺 CPU,将 CPU 分配给其他进程
  3. 终止其所有子进程
  4. 该进程拥有的所有资源归还给父进程或操作系统
  5. 删除 PCB

# 引起进程终止的事件

  1. 正常结束:进程自己请求终止(exit 系统调用)
  2. 异常结束:正数除以 0,非法使用特权指令,然后被操作系统强行杀掉
  3. 外界干预:ctrl + Alt + delete 用户选择杀掉进程

# 进程的阻塞

# 阻塞原语

  1. 找到阻塞的进程对应的 PCB
  2. 保护进程运行现场,将 PCB 状态信息设置为阻塞态,暂时停止进程运行
  3. 将 PCB 插入相应事件的等待队列

# 引起进程阻塞的事件

  1. 需要等待系统分配某种资源
  2. 需要等待相互合作的其他进程完成工作

# 进程的唤醒

# 唤醒原语

  1. 在事件等待队列中找到 PCB
  2. 将 PCB 从等待队列中移除,设备进程为就绪态
  3. 将 PCB 插入就绪队列,等待被调度

# 引起进程唤醒的事件

  1. 等待事件发生唤醒

# 进程的切换

# 切换原语

  1. 将运行环境信息存入 PCB
  2. PCB 移入相应队列
  3. 选择另一个进程执行,并更新 PCB
  4. 根据 PCB 恢复新进程所需要的运行环境

# 切换进程切换的条件

  1. 当前进程时间片到
  2. 有更高优先级的进程到达
  3. 当前进程主动阻塞
  4. 当前进程终止

# 进程通信(IPC)

# 共享存储

  1. 为避免出错,各个进程对共享空间访问时互斥的
  2. 各个进程可使用操作系统内核提供的同步互斥工具

# 图解

image-20230127110712009

# 两种共享方式

# 基于数据结构共享

比如共享空间里只能放一个长度为 10 的数组。这种共享方式速度慢、限制多,是一种低级通信方式

# 基于存储区共享

操作系统在内存中划出一块共享存储区,数据的形式、存放位置都由通信进程控制,而不是操作系统。这种共享方式内存 速度很快,是一种高级通信方式

# 信息传递

# 信息传递概念

进程间的数据交换以格式化的消息(Message)为单位。进程通过操作系统提供的 “发送消息 / 接收消息” 两个原语进行数据交换

# 直接通信方式

# 概念

消息发送进程直接表示进程 ID

# 图解

image-20230127111107958

# 间接通信方式

# 概念

可以多个进程往同一个信箱 send 消息,也可以多个进程从同一个心想 receive 消息

# 图解

image-20230127111233426

# 管道通信

# 管道概念

管道是一个特殊的共享文件,又名 pipe 文件,其实就是在内存中开辟一个固定大小的内存缓冲区

# 管道图解

image-20230127112957999

# 管道介绍

  1. 管道只能采用半双工通信,某一时间段内只能实现单向的传输。如果要实现双向同时通信,则需要设置两个管道
  2. 各进程要互斥地访问管道(由操作系统实现)
  3. 当管道写满时,写进程将阻塞,直到读进程将管道中的数据取走,即可唤醒写进程
  4. 当管道读空时,读进程将阻塞,直到写进程往管道中写入数据,即可唤醒读进程
  5. 管道中的数据一旦被读出,就彻底消失。因此,当多个进程读同一个管道时,可能会错乱。对此,通常有两种解决方案:①一个管道允许多个写进程,一个读进程(2014 年 408 真题高教社官方答案);②允许有多个写进程,多个读进程,但系统会让各个读进程轮流从管道中读数据(Linux 的方案)

# 线程概念多线程模型

# 线程意义

有的进程可能需要同时做很多事,而传统的进程只能串行执行一系列的程序,为此,引入了线程来增加并发度

image-20230127113345174

# 线程概念

  1. 轻量级进程,线程是一个基本的 CPU 执行单元,也是程序执行流的最小单位
  2. 引入线程后,进程内的各线程之间也可以并发,从而进一步提升了系统的并发度,使得一个进程内也可以并发处理各种任务
  3. 引入线程后,进程只作为除 CPU 之外的系统资源的分配单元
  4. 线程作为处理机的分配单元

# 带来的变化

# 资源分配调度

  1. 传统的进程机制中,进程是资源分配,调度的最基本单位
  2. 引入线程后,进程是资源分配的基本单位,线程是调度的基本单位

# 并发性

  1. 传统进程机制中,只能进程之间并发
  2. 引入线程后,各线程间也能并发,提升了并发度

# 系统开销

  1. 传统的进程间并发,需要切换进程间的运行环境,系统开销大
  2. 线程间的并发,如果是同一进程内的线程切换,则不需要切换环境,系统开销小
  3. 引入线程后,并发带来的系统开销很小

# 线程的属性

  1. 线程是处理调度的单位
  2. 多核 CPU 计算机中,各个线程可占用不同 CPU
  3. 每个线程都有一个线程 ID,线程控制块(TCB)
  4. 线程也有就绪,阻塞,运行三种基本状态
  5. 线程几乎不拥有系统资源
  6. 同一进程的不同线程间共享进程的资源
  7. 由于共享内存地址空间,同一进程中线程间通信甚至无需系统干预
  8. 同一进程中的线程切换,不会切换进程
  9. 不同进程间的线程切换,会引起进程切换
  10. 切换同进程内的线程,系统开销很小
  11. 切换过程,系统开销较大

# 线程实现方式多线程模型

# 线程实现方式

# 用户级线程

  1. 用户级线程由应用程序通过线程库实现,所有的线程管理工作都由应用程序负责(包括线程切换)
  2. 用户级线程中,线程切换可以在用户态下即可完成,无需操作系统干预
  3. 在用户看来,是有多个线程。但是在操作系统内核看来,并意识不到线程的存在。“用户级线程” 就是 “从用户视角看能看到的线程”
  4. 优点:用户级线程的切换在用户空间即可完成,不需要切换到核心态,线程管理的系统开销小,效率高
  5. 缺点:当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高。多个线程不可在多核处理机上并行运行

image-20230128105902498

# 内核级线程

  1. 内核级线程的管理工作由操作系统内核完成
  2. 线程调度、切换等工作都由内核负责,因此内核级线程的切换必然需要在核心态下才能完成
  3. 操作系统会为每个内核级线程建立相应的 TCB(Thread Control Block,线程控制块),通过 TCB 对线程进行管理。“内核级线程” 就是 “从操作系统内核视角看能看到的线程”
  4. 优点:当一个线程被阻塞后,别的线程还可以继续执行,并发能力强。多线程可在多核处理机上并行执行
  5. 缺点:一个用户进程会占用多个内核级线程,线程切换由操作系统内核完成,需要切换到核心态,因此线程管理的成本高,开销大

image-20230128110134440

# 多线程模型

# 一对一模型

# 说明

一对一模型:一个用户级线程映射到一个内核级线程。每个用户进程有与用户级线程同数量的内核级线程

# 优缺点

  1. 优点:当一个线程被阻塞后,别的线程还可以继续执行,并发能力强。多线程可在多核处理机上并行执行
  2. 缺点:一个用户进程会占用多个内核级线程,线程切换由操作系统内核完成,需要切换到核心态,因此线程管理的成本高,开销大

# 模型

image-20230128110346440

# 多对一模型

# 说明

多对一模型:多个用户级线程映射到一个内核级线程。且一个进程只被分配一个内核级线程

# 优缺点

  1. 优点:用户级线程的切换在用户空间即可完成,不需要切换到核心态,线程管理的系统开销小,效率高
  2. 缺点:当一个用户级线程被阻塞后,整个进程都会被阻塞,并发度不高。多个线程不可在多核处理机上并行运行

# 模型

image-20230128110534707

# 多对多模型

# 说明

多对多模型:n 用户及线程映射到 m 个内核级线程(n >= m)。每个用户进程对应 m 个内核级线程。克服了多对一模型并发度不高的缺点(一个阻塞全体阻塞),又克服了一对一模型中一个用线程库 户进程占用太多内核级线程,开销太大的缺点

# 模型

image-20230128110701286

# 调度的概念、层次

# 调度的基本概念

当有一堆任务要处理,但由于资源有限,这些事情没法同时处理。这就需要确定某种规则来决定处理这些任务的顺序,这就是 “调度” 研究的问题

# 调度的三个层次

# 高级调度

高级调度(作业调度)。按一定的原则从外存的作业后备队列中挑选一个作业调入内存,并创建进程。每个作业只调入一次,调出一次。作业调入时会建立 PCB,调出时才撤销 PCB

# 低级调度

低级调度(进程调度 / 处理机调度)—— 按照某种策略从就绪队列中选取一个进程,将处理机分配给它

# 中级调度

中级调度(内存调度)—— 按照某种策略决定将哪个处于挂起状态的进程重新调入内存。一个进程可能会被多次调出、调入内存,因此中级调度发生的频率要比高级调度更高

内存不够时,可将某些进程的数据调出外存。等内存空闲或者进程需要运行时再重新调入内存

暂时调到外存等待的进程状态为挂起状态。被挂起的进程 PCB 会被组织成挂起队列

# 进程的挂起态与七状态模型

暂时调到外存等待的进程状态为挂起状态(挂起态,suspend)挂起态又可以进一步细分为就绪挂起、阻塞挂起两种状态

image-20230128111131588

# 三层调度的联系、对比

要做什么 调度发生在? 发生频率 对进程状态的影响
高级调度(作业调度) 按照某种规则,从后备队列中选择合适的作业将其调入内存,并为其创建进程 外存 -> 内存(面向作业) 最低 无 -> 创建态 -> 就绪态
中级调度(内存调度) 按照某种规则,从挂起队列中选择合适的进程将其数据调回内存 外存 -> 内存(面向过程) 中等 挂起态 -> 就绪态(阻塞挂起 -> 阻塞态)
低级调度(进程调度) 按照某种规则,从就绪队列中选择一个进程为其分配处理机 内存 ->CPU 最高 就绪态 -> 运行态

# 远程调度的时机切换与过程调度方式

# 进程调度的时机

  1. 进程在操作系统内核程序临界区中不能进行调度与切换
  2. 进程处于临界区时不能进行处理机调度(错误)
  3. 临界资源:一个时间段内只允许一个进程使用的资源。各进程需要互斥地访问临界资源。临界区:访问临界资源的那段代码
  4. 内核程序临界区一般是用来访问某种内核数据结构的,比如进程的就绪队列(由各就绪进程的 PCB 组成)
  5. 内核程序临界区访问的临界资源如果不尽快释放,极有可能影响操作系统内核的其他管理工作,因此在访问内核程序临界区间不能进行调度与切换
  6. 普通临界区访问的临界资源不会直接影响操作系统内核的管理工作,因此在访问普通临界区时可以进行调度与切换

image-20230128120923175

# 远程调度的方式

# 非剥夺调度方式

又称非抢占方式。即,只允许进程主动放弃处理机。在运行过程中即便有更紧迫的任务到达,当前进程依然会继续使用处理机,直到该进程终止或主动要求进入阻塞态

# 剥夺调度方式

又称抢占方式。当一个进程正在处理机上执行时,如果有一个更重要或更紧迫的进程需要使用处理机,则立即暂停正在执行的进程,将处理机分配给更重要紧迫的那个进程

# 进程的切换与过程

# 狭义的进程调度与进程切换的区别

  1. 狭义的进程调度指的是从就绪队列中选中一个要运行的进程
  2. 进程切换是指一个进程让出处理机,由另一个进程占用处理机的过程
  3. 广义的进程调度包含选择了一个进程和进程切换两个步骤
    1. 对原来运行进程各种数据的保存
    2. 对新的进程各种数据的恢复

# 调度算法的评价指标

# CPU 利用率

利用率=忙碌时间/总时间利用率=忙碌时间/总时间

image-20230420215937883

# 系统吞吐量

系统吞吐量=总共完成了多少道作业/总共花的时间系统吞吐量=总共完成了多少道作业/总共花的时间

image-20230420215949101

# 周转时间

对于计算机的用户来说,他很关心自己的作业从提交到完成花了多少时间。周转时间,是指从作业被提交给系统开始,到作业完成为止的这段时间间隔。它包括四个部分:作业在外存后备队列上等待作业调度(高级调度)的时间、进程在就绪队列上等待进程调度(低级调度)的时间、进程在 CPU 上执行的时间、进程等待 I/O 操作完成的时间。后三项在一个作业的整个处理过程中,可能发生多次

(作业)周转时间=作业完成时间提交作业时间(作业)周转时间=作业完成时间 - 提交作业时间

平均周转时间=各作业周转时间/作业数平均周转时间=各作业周转时间/作业数

带权周转时间=作业周转时间/作业实际运行时间=(作业完成时间作业提交时间)/作业实际运行时间带权周转时间=作业周转时间/作业实际运行时间=(作业完成时间 - 作业提交时间)/作业实际运行时间

平均带权时间=各作业带权周转时间之和/作业数平均带权时间=各作业带权周转时间之和/作业数

# 等待时间

等待时间,指进程 / 作业处于等待处理机状态时间之和,等待时间越长,用户满意度越低

对于进程来说,等待时间就是指进程建立后等待被服务的时间之和,在等待 I/O 完成的期间其实进程也是在被服务的,所以不计入等待时间

对于作业来说,不仅要考虑建立进程后的等待时间,还要加上作业在外存后备队列中等待的时间

# 响应时间

响应时间,指从用户提交请求到首次产生响应所用的时间

# 调度算法

# 先来先服务(FCFS)

  1. 算法思想:主要从 “公平” 的角度考虑(先到先服务)
  2. 算法规则:按照作业 / 进程到达的先后顺序进行服务
  3. 用于作业 / 进程调度:用于作业调度时,考虑的是哪个作业先到达后备队列,用于进程调度时,考虑的是哪个进程先到达就绪队列
  4. 是否可抢占:非抢占算法
  5. 优点:公平、算法实现简单
  6. 缺点:排在长作业(进程)后面的短作业需要等待很长时间,带权周转时间很大,对短作业来说用户体验不好
  7. 是否导致饥饿:不会

image-20230128122801714

# 短作业优先(SJF)

  1. 算法思想:追求最少的平均等待时间,最少的平均周转时间、最少的平均平均带权周转时间
  2. 算法规则:最短的作业 / 进程优先得到服务(所谓 “最短”,是指要求服务时间最短)
  3. 用于作业 / 进程调度:即可用于作业调度,也可用于进程调度。用于进程调度时称为 “短进程优先(SPF, Shortest Process First)算法”
  4. 是否可抢占:SJF 和 SPF 是非抢占式的算法。但是也有抢占式的版本 —— 最短剩余时间优先算法(SRTN, Shortest Remaining Time Next)
  5. 优点:“最短的” 平均等待时间、平均周转时间
  6. 缺点:不公平。对短作业有利,对长作业不利。可能产生饥饿现象。另外,作业 / 进程的运行时间是由用户提供的,并不一定真实,不一定能做到真正的短作业优先
  7. 是否会导致饥饿:会。如果源源不断地有短作业 / 进程到来,可能使长作业 / 进程长时间得不到服务,产生 “饥饿” 现象。如果一直得不到服务,则称为 “饿死”

image-20230128152144487

image-20230128152201799

# 高响应比优先(HRRN)

  1. 算法思想:要综合考虑作业 / 进程的等待时间和要求服务的时间
  2. 算法规则:在每次调度时先计算各个作业 / 进程的响应比,选择响应比最高的作业 / 进程为其服务(响应比=(等待时间+要求服务i时间)/要求服务时间响应比=(等待时间+要求服务i时间)/要求服务时间
  3. 用于作业 / 进程调度:即可用于作业调度,也可用于进程调度
  4. 是否可抢占:非抢占式的算法。因此只有当前运行的作业 / 进程主动放弃处理机时,才需要调度,才需要计算响应比
  5. 优缺点:综合考虑了等待时间和运行时间(要求服务时间)等待时间相同时,要求服务时间短的优先(SJF 的优点)要求服务时间相同时,等待时间长的优先(FCFS 的优点)对于长作业来说,随着等待时间越来越久,其响应比也会越来越大,从而避免了长作业饥饿的问题
  6. 是否会导致饥饿:不会

image-20230128154234375

# 调度算法

# 时间片轮转(RR,Round-Robin)

  1. 算法思想:公平地,轮流地为各个进程服务,让每个进程在一定时间间隔内都可以得到响应
  2. 算法规则:按照各进程到达就绪队列的顺序,轮流让各个进程执行一个时间片(如 100ms)。若进程未在一个时间片内执行完,则剥夺处理机,将进程重新放到就绪队列队尾重新排队
  3. 用于作业 / 进程调度:用于进程调度(只有作业放入内存建立了相应的进程后,才能被分配处理机时间片)
  4. 是否可抢占:若进程未能在时间片内运行完,将被强行剥夺处理机使用权,因此时间片轮转调度算法属于抢占式的算法。由时钟装置发出时钟中断来通知 CPU 时间片已到
  5. 优点:公平;响应快,适用于分时操作系统
  6. 缺点:由于高频率的进程切换,因此有一定开销;不区分任务的紧急程度
  7. 是否导致饥饿:不会

# 时间片大小为 2

image-20230129110029692

image-20230129110047531

image-20230129110103632

# 时间片大小为 5

image-20230129110137870

# 优先级调度算法

  1. 算法思想:随着计算机的发展,特别是实时操作系统的出现,越来越多的应用场景需要根据任务的紧急程度来决定处理顺序
  2. 算法规则:每个作业 / 进程有各自的优先级,调度时选择优先级最高的作业 / 进程
  3. 用于作业 / 进程调度:既可用于作业调度,也可用于进程调度。甚至,还会用于在之后会学习的 I/O 调度中
  4. 是否可抢占:抢占式、非抢占式都有。做题时的区别在于:非抢占式只需在进程主动放弃处理机时进行调度即可,而抢占式还需在就绪队列变化时,检查是否会发生抢占
  5. 优点:用优先级区分紧急程度、重要程度,适用于实时操作系统。可灵活地调整对各种作业 / 进程的偏好程度
  6. 缺点:若源源不断地有高优先级进程到来,则可能导致饥饿
  7. 是否会导致饥饿:会

# 非抢占式

image-20230129110456261

# 抢占式

image-20230129110517429

# 静态优先级和动态优先级

  1. 静态优先级:创建进程时确定,之后一直不变
  2. 动态优先级:创建进程时有一个初始值,之后会根据情况动态地调整优先级

# 多级反馈队列调度算法

  1. 算法思想:对其他调度算法的折中权衡
  2. 算法规则:
    1. 设置多级就绪队列,各级队列优先级从高到低,时间片从小到大
    2. 新进程到达时先进入第 1 级队列,按 FCFS 原则排队等待被分配时间片,若用完时间片进程还未结束,则进程进入下一级队列队尾。如果此时已经是在最下级的队列,则重新放回该队列队尾
    3. 只有第 k 级队列为空时,才会为 k+1 级队头的进程分配时间片
  3. 用于作业 / 进程调度:用于进程调度
  4. 是否可抢占:抢占式的算法。在 k 级队列的进程运行过程中,若更上级的队列(1~k-1 级)中进入了一个新进程,则由于新进程处于优先级更高的队列中,因此新进程会抢占处理机,原来运行的进程放回 k 级队列队尾
  5. 优缺点:对各类型进程相对公平(FCFS 的优点);每个新到达的进程都可以很快就得到响应(RR 的优点);短进程只用较少的时间就可完成(SPF 的优点);不必实现估计进程的运行时间(避免用户作假);可灵活地调整对各类进程的偏好程度,比如 CPU 密集型进程、I/O 密集型进程(拓展:可以将因 I/O 而阻塞的进程重新放回原队列,这样 I/O 型进程就可以保持较高优先级)
  6. 是否会导致饥饿:会

image-20230129111029770

# 进程同步进程互斥

# 进程同步

进程同步机制解决异步问题

# 进程互斥

我们把一个时间段内只允许一个进程使用的资源称为临界资源。许多物理设备(比如摄像头、打印机)都属于临界资源。此外还有许多变量、数据、内存缓冲区等都属于临界资源。对临界资源的访问,必须互斥地进行。互斥,亦称间接制约关系。进程互斥指当一个进程访问某临界资源时,另一个想要访问该临界资源的进程必须等待。当前访问临界资源的进程访问结束,释放该资源之后,另一个进程才能去访问临界资源。

# 进程互斥四个区

  1. 进入区:负责检查是否可进入临界区,若可进入,则应设置正在访问临界资源的标志(可理解为 “上锁”),以阻止其他进程同时进入临界区
  2. 临界区:访问临界资源得那段代码
  3. 退出区:负责解除正在访问临时资源的标志
  4. 剩余区:做其他处理

# 进程互斥四大原则

  1. 空闲让进:临界区空闲时,可以允许一个请求进入临界区的进程立即进入临界区
  2. 忙则等待:当已有进程进入临界区时,其他试图进入临界区的进程必须等待
  3. 有限等待:对请求访问的进程,应保证能在有限时间内进入临界区(保证不会饥饿)
  4. 让权等待:当进程不能进入临界区时,应立即释放处理机,防止进程忙等待

# 进程互斥得软件实现方法

# 单标志法

image-20230129113138445

# 双标志法先检查法

image-20230129113211957

# 双标志后检查法

image-20230129113350499

# Peterson 算法

image-20230129113443060

# 进程互斥的硬件实现方法

# 中断屏蔽方法

利用 “开 / 关中断指令” 实现(与原语的实现思想相同,即在某进程开始访问临界区到结束访问为止都不允许被中断,也就不能发生进程切换,因此也不可能发生两个同时访问临界区的情况)

  1. 优点:简单高效
  2. 缺点:不适用于多处理机;只适用于操作系统内核进程,不适用于用户进程(因为开 / 关中断指令只能运行在内核态,这组指令如果能让用户随意使用会很危险)

# TestAndSet 指令

image-20230129113714331

# Swap 指令

image-20230129113734357

# 信号量机制

# 信号量机制介绍

  1. 用户进程可以通过使用操作系统提供的一对原语来对信号量进行操作,从而很方便的实现了进程互斥、进程同步
  2. 信号量其实就是一个变量 ,可以用一个信号量来表示系统中某种资源的数量,比如:系统中只有一台打印机,就可以设置一个初值为 1 的信号量
  3. 原语是一种特殊的程序段,其执行只能一气呵成,不可被中断。原语是由关中断 / 开中断指令实现的。软件解决方案的主要问题是由 “进入区的各种操作无法一气呵成”,因此如果能把进入区、退出区的操作都用 “原语” 实现,使这些操作能 “一气呵成” 就能避免问题
  4. 一对原语:wait (S) 原语和 signal (S) 原语,可以把原语理解为我们自己写的函数,函数名分别为 wait 和 signal,括号里的信号量 S 其实就是函数调用时传入的一个参数
  5. wait、signal 原语常简称为 P、V 操作(来自荷兰语 proberen 和 verhogen)。因此,做题的时候常把 wait (S)、signal (S) 两个操作分别写为 P (S)、V (S)

# 整型信号量

image-20230129113930801

# 记录型信号量

image-20230129113951381

image-20230129114018364

image-20230129114033062

# 用信号量机制实现进程互斥、同步、前驱关系

# P (S) 和 V (S)

  1. P (S):申请一个资源 S,如果资源不够就阻塞等待
  2. V (S):释放一个资源,如果有进程在等待该资源,则唤醒一个进程

# 信号量机制实现进程互斥

image-20230130144826070

# 信号量机制实现进程同步

image-20230130144907386

# 信号量机制实现前驱关系

image-20230130144934720

# 生产者消费者问题

# 问题描述

image-20230130145020072

# 问题分析

image-20230130145042289

image-20230130145123147

# 回顾

image-20230130145213548

image-20230130145235360

image-20230420220048305

# 多生产者多消费者

# 问题描述

image-20230130145344932

# 问题分析

image-20230130145407372

# 实现

image-20230130145425159

# 吸烟者问题

# 问题描述

image-20230130145529238

# 问题分析

image-20230130145553943

image-20230130145606998

# 实现

image-20230130145629556

# 读者写者问题

# 问题描述

image-20230420220117251

# 问题分析

image-20230130145742979

# 实现

image-20230130145804724

image-20230130145819371

# 哲学家进餐问题

# 问题描述

image-20230130145900847

# 问题分析

image-20230130145933729

# 实现

image-20230130150009320

image-20230130150037830

image-20230130150051961

# 管程

# 引入管程的意义

  1. 信号量机制存在的问题:编写程序困难、易出错
  2. 设计一种机制,让程序员写程序时不需要再关注复杂的 PV 操作,让写代码更轻松
  3. 1973 年,Brinch Hansen 首次在程序设计语言 (Pascal) 中引入了 “管程” 成分 —— 一种高级同步机制

# 管程定义

  1. 局部于管程的共享数据结构说明
  2. 对该数据结构进行操作的一组过程(函数)
  3. 对局部于管程的共享数据设置初始值的语句
  4. 管程有一个名字

# 管程基本特征

  1. 局部于管程的数据只能被局部于管程的过程所访问
  2. 一个进程只有通过调用管程内的过程才能进入管程访问共享数据
  3. 每次仅允许一个进程在管程内执行某个内部过程

# 用管程解决生产者消费者问题

image-20230131100530094

image-20230131100547974

# 死锁概念

# 死锁、饥饿、死循环

  1. 死锁:各进程互相等待对方手里的资源,导致各进程都阻塞,无法向前推进的现象
  2. 饥饿:由于长期得不到想要的资源,某进程无法向前推进的现象。比如:在短进程优先(SPF)算法中,若有源源不断的短进程到来,则长进程将一直得不到处理机,从而发生长进程 “饥饿”
  3. 死循环:某进程执行过程中一直跳不出某个循环的现象。有时是因为程序逻辑 bug 导致的,有时是程序员故意设计的
共同点 区别
死锁 都是进程无法顺利向前推进的现象(故意设计的死循环除外) 死锁一定是 “循环等待对方手里的资源” 导致的,因此如果有死锁现象,那至少有两个或两个以上的进程同时发生死锁。另外,发生死锁的进程一定处于阻塞态
饥饿 都是进程无法顺利向前推进的现象(故意设计的死循环除外) 可能只有一个进程发生饥饿。发生饥饿的进程既可能是阻塞态 (如长期得不到需要的 I/O 设备),也可能是就绪态 (长期得不到处理机)
死循环 都是进程无法顺利向前推进的现象(故意设计的死循环除外) 可能只有一个进程发生死循环。死循环的进程可以上处理机运行(可以是运行态),只不过无法像期待的那样顺利推进。死锁和饥饿问题是由于操作系统分配资源的策略不合理导致的,而死循环是由代码逻辑的错误导致的。死锁和饥饿是管理者(操作系统)的问题,死循环是被管理者的问题

# 死锁产生的必要条件

  1. 互斥条件:只有对必须互斥使用的资源的争抢才会导致死锁(如哲学家的筷子、打印机设备)。像内存、扬声器这样可以同时让多个进程使用的资源是不会导致死锁的(因为进程不用阻塞等待这种资源)
  2. 不剥夺条件:进程所获得的资源在未使用完之前,不能由其他进程强行夺走,只能主动释放
  3. 请求和保持条件:进程已经保持了至少一个资源,但又提出了新的资源请求,而该资源又被其他进程占有,此时请求进程被阻塞,但又对自己已有的资源保持不放
  4. 循环等待条件:存在一种进程资源的循环等待链,链中的每一个进程已获得的资源同时被下一个进程所请求

# 死锁的应对策略

  1. 预防死锁。破坏死锁产生的四个必要条件中的一个或几个
  2. 避免死锁。用某种方法防止系统进入不安全状态,从而避免死锁(银行家算法)
  3. 死锁的检测和解除。允许死锁的发生,不过操作系统会负责检测出死锁的发生,然后采取某种措施解除死锁

# 死锁的处理策略 —— 预防死锁

# 破坏互斥条件

  1. 互斥条件:只有对必须互斥使用的资源的争抢才会导致死锁
  2. 如果把只能互斥使用的资源改造为允许共享使用,则系统不会进入死锁状态。比如: SPOOLing 技术。操作系统可以采用 SPOOLing 技术把独占设备在逻辑上改造成共享设备。比如,用 SPOOLing 技术将打印机改造为共享设备…
  3. 该策略的缺点:并不是所有的资源都可以改造成可共享使用的资源。并且为了系统安全,很多地方还必须保护这种互斥性。因此,很多时候都无法破坏互斥条件

image-20230131101454252

# 破坏不剥夺条件

  1. 不剥夺条件:进程所获得的资源在未使用完之前,不能由其他进程强行夺走,只能主动释放
  2. 破坏剥夺条件:
    1. 方案一:当某个进程请求新的资源得不到满足时,它必须立即释放保持的所有资源,待以后需要时再重新申请。也就是说,即使某些资源尚未使用完,也需要主动释放,从而破坏了不可剥夺条件
    2. 方案二:当某个进程需要的资源被其他进程所占有的时候,可以由操作系统协助,将想要的资源强行剥夺。这种方式一般需要考虑各进程的优先级(比如:剥夺调度方式,就是将处理机资源强行剥夺给优先级更高的进程使用)
  3. 该策略的缺点:
    1. 实现起来比较复杂
    2. 释放已获得的资源可能造成前一阶段工作的失效。因此这种方法一般只适用于易保存和恢复状态的资源,如 CPU
    3. 反复地申请和释放资源会增加系统开销,降低系统吞吐量
    4. 若采用方案一,意味着只要暂时得不到某个资源,之前获得的那些资源就都需要放弃,以后再重新申请。如果一直发生这样的情况,就会导致进程饥饿

# 破坏请求和保持条件

  1. 请求和保持条件:进程已经保持了至少一个资源,但又提出了新的资源请求,而该资源又被其他进程占有,此时请求进程被阻塞,但又对自己已有的资源保持不放
  2. 可以采用静态分配方法,即进程在运行前一次申请完它所需要的全部资源,在它的资源未满足前,不让它投入运行。一旦投入运行后,这些资源就一直归它所有,该进程就不会再请求别的任何资源了
  3. 缺点:有些资源可能只需要用很短的时间,因此如果进程的整个运行期间都一直保持着所有资源,就会造成严重的资源浪费,资源利用率极低。另外,该策略也有可能导致某些进程饥饿

image-20230131101828465

# 破坏死循环等待条件

  1. 循环等待条件:存在一种进程资源的循环等待链,链中的每一个进程已获得的资源同时被下一个进程所请求
  2. 可采用顺序资源分配法。首先给系统中的资源编号,规定每个进程必须按编号递增的顺序请求资源,同类资源(即编号相同的资源)一次申请完
  3. 原理分析:一个进程只有已占有小编号的资源时,才有资格申请更大编号的资源。按此规则,已持有大编号资源的进程不可能逆向地回来申请小编号的资源,从而就不会产生循环等待的现象
  4. 缺点:
    1. 不方便增加新的设备,因为可能需要重新分配所有的编号
    2. 进程实际使用资源的顺序可能和编号递增顺序不一致,会导致资源浪费
    3. 必须按规定次序申请资源,用户编程麻烦

image-20230131102008129

# 死锁的处理策略 —— 避免死锁

# 安全序列、不安全状态、死锁的联系

  1. 所谓安全序列,就是指如果系统按照这种序列分配资源,则每个进程都能顺利完成。只要能找出一个安全序列,系统就是安全状态。当然,安全序列可能有多个
  2. 如果分配了资源之后,系统中找不出任何一个安全序列,系统就进入了不安全状态。这就意味着之后可能所有进程都无法顺利的执行下去。当然,如果有进程提前归还了一些资源,那系统也有可能重新回到安全状态,不过我们在分配资源之前总是要考虑到最坏的情况
  3. 如果系统处于安全状态,就一定不会发生死锁。如果系统进入不安全状态就有,就有安全可能全序列发生列 Tà 死锁 B àA(处于不安全状态未必就是发生了死锁,但发生死锁时一定是在不安全状态)因此可以在资源分配之前预先判断这次分配是否会导致系统进入不安全状态,以此决定是否答应资源分配请求。这也是 “银行家算法” 的核心思想

image-20230131102346581

# 银行家算法

# 定义

银行家算法是荷兰学者 Dijkstra 为银行系统设计的,以确保银行在发放现金贷款时,不会发生不能满足所有客户需要的情况。后来该算法被用在操作系统中,用于避免死锁

# 核心思想

在进程提出资源申请时,先预判此次分配是否会导致系统进入不安全状态。如果会进入不安全状态,就暂时不答应这次请求,让该进程先阻塞等待

# 实例

image-20230131102518334

image-20230131102538477

image-20230420220154089

image-20230131102625546

image-20230131102643038

image-20230131102657219

# 死锁的处理策略 —— 检测和解除

# 死锁的检测

  1. 用某种数据结构来保存资源的请求和分配信息
  2. 提供一种算法,利用上述信息来检测系统是否已进入死锁状态

image-20230131102913032

如果系统中剩余的可用资源数足够满足进程的需求,那么这个进程暂时是不会阻塞的,可以顺利地执行下去。如果这个进程执行结束了把资源归还系统,就可能使某些正在等待资源的进程被激活,并顺利地执行下去。相应的,这些被激活的进程执行完了之后又会归还一些资源,这样可能又会激活另外一些阻塞的进程…

如果按上述过程分析,最终能消除所有边,就称这个图是可完全简化的,此时一定没有发生死锁(相当于能找到一个安全序列)

如果最终不能消除所有边,那么此时就是发生了死锁

# 检测死锁的算法

  1. 在资源分配图中,找出既不阻塞又不是孤点的进程 Pi(即找出一条有向边与它相连,且该有向边对应资源的申请数量小于等于系统中已有空闲资源数量。如下图中,R1 没有空闲资源,R2 有一个空闲资源。若所有的连接该进程的边均满足上述条件,则这个进程能继续运行直至完成,然后释放它所占有的所有资源)。消去它所有的请求边和分配变,使之称为孤立的结点。在下图中,P1 是满足这一条件的进程结点,于是将 P1 的所有边消去
  2. 进程 Pi 所释放的资源,可以唤醒某些因等待这些资源而阻塞的进程,原来的阻塞进程可能变为非阻塞进程。在下图中,P2 就满足这样的条件。根据 1)中的方法进行一系列简化后,若能消去途中所有的边,则称该图是可完全简化的
  3. 死锁定理:如果某时刻系统的资源分配图是不可完全简化的,那么此时系统死锁

image-20230420220212322

# 死锁的解除

  1. 资源剥夺法。挂起(暂时放到外存上)某些死锁进程,并抢占它的资源,将这些资源分配给其他的死锁进程。但是应防止被挂起的进程长时间得不到资源而饥饿
  2. 撤销进程法(或称终止进程法)。强制撤销部分、甚至全部死锁进程,并剥夺这些进程的资源。这种方式的优点是实现简单,但所付出的代价可能会很大。因为有些进程可能已经运行了很长时间,已经接近结束了,一旦被终止可谓功亏一篑,以后还得从头再来
  3. 进程回退法。让一个或多个死锁进程回退到足以避免死锁的地步。这就要求系统要记录进程的历史信息,设置还原点
  4. 按照不同优先级对谁动手:
    1. 进程优先级
    2. 已执行多长时间
    3. 还要多久完成
    4. 进程已经使用了多少资源
    5. 进程是交互式的还有批处理式的