同步/异步,阻塞/非阻塞概念深度解析

444次阅读  |  发布于2年以前

‍‍

网络IO作为网络编程核心基础知识,是所以程序员都需要理解掌握的,最近小伙伴在星球群里对这些基本概念理解比较混乱,大多数人可能都没有认真深入去理解过这些基础概念,之前我直播时候说过:内功深厚其实就是对这些基础概念的理解深度我们学习和工作都是在不断加深对这些基础知识的理解。‍‍‍‍‍‍‍‍‍‍‍‍

四个相关概念:

这四个概念的含义以及相互之间的区别与联系,并不如很多网络博客所写的那么简单, 通过举一些什么商店购物, 买书买报的例子就能讲清楚。

首先强调一点, 网络上的很多博文关于同步/异步, 阻塞非阻塞区别的解释其实都很经不起推敲。例如怎样理解阻塞非阻塞与同步异步的区别这一高赞回答中 , 有如下解释(不准确):

  • 同步/异步关注的是消息通信机制 (synchronous communication/ asynchronous communication) 。

  • 所谓同步,就是在发出一个调用时,在没有得到结果之前, 该调用就不返回。

  • 异步则是相反,调用在发出之后,这个调用就直接返回了,所以没有返回结果

  • 阻塞/非阻塞关注的是程序在等待调用结果(消息,返回值)时的状态.

  • 阻塞调用是指调用结果返回之前,当前线程会被挂起。调用线程只有在得到结果之后才会返回。

  • 非阻塞调用指在不能立刻得到结果之前,该调用不会阻塞当前线程。

粗一看, 好像同步/ 非同步阻塞/非阻塞 是两种维度的概念, 可以分别对待, 但是稍微推敲一下就会发现上述的解释根本难以自圆其说。

所以, 上述的解释是不准确的。让我们看一下《操作系统概念(第九版)》中有关进程间通信的部分是如何解释的:

翻译一下就是:

进程间的通信时通过 send() 和 receive() 两种基本操作完成的。具体如何实现这两种基础操作,存在着不同的设计。 消息的传递有**可能是阻塞的或非阻塞的 -- 也被称为同步或异步的:**

  • 阻塞式发送(blocking send). 发送方进程会被一直阻塞, 直到消息被接受方进程收到。
  • 非阻塞式发送(nonblocking send)。发送方进程调用 send() 后, 立即就可以其他操作。
  • 阻塞式接收(blocking receive) 接收方调用 receive() 后一直阻塞, 直到消息到达可用。
  • 非阻塞式接受(nonblocking receive) 接收方调用 receive() 函数后, 要么得到一个有效的结果, 要么得到一个空值, 即不会被阻塞。

上述不同类型的发送方式和不同类型的接收方式,可以自由组合。

先修知识

用户空间和内核空间

操作系统为了支持多个应用同时运行,需要保证不同进程之间相对独立(一个进程的崩溃不会影响其他的进程 , 恶意进程不能直接读取和修改其他进程运行时的代码和数据)。因此操作系统内核需要拥有高于普通进程的权限, 以此来调度和管理用户的应用程序。

于是内存空间被划分为两部分,一部分为内核空间,一部分为用户空间,内核空间存储的代码和数据具有更高级别的权限。内存访问的相关硬件在程序执行期间会进行访问控制( Access Control),使得用户空间的程序不能直接读写内核空间的内存。

进程切换

上图展示了进程切换中几个最重要的步骤:

  1. 当一个程序正在执行的过程中, 中断(interrupt) 或 系统调用(system call) 发生可以使得 CPU 的控制权会从当前进程转移到操作系统内核。
  2. 操作系统内核负责保存进程 i 在 CPU 中的上下文(程序计数器, 寄存器)到 PCBi (操作系统分配给进程的一个内存块)中。
  3. 从PCBj取出进程 j 的CPU上下文, 将CPU控制权转移给进程 j , 开始执行进程 j 的指令。

几个底层概念的通俗解释:

从上述描述中, 可以看出来, 操作系统在进行进切换时,需要进行一系列的内存读写操作, 这带来了一定的开销:

进程阻塞

上图展示了一个进程的不同状态:

我们所说的 “阻塞”是指进程在发起了一个系统调用(System Call) 后, 由于该系统调用的操作不能立即完成,需要等待一段时间,于是内核将进程挂起为等待 (waiting)状态, 以确保它不会被调度执行, 占用 CPU 资源。

友情提示: 在任意时刻, 一个 CPU 核心上(processor)只可能运行一个进程


这里再重新审视 阻塞/非阻塞 IO 这个概念, 其实阻塞和非阻塞描述的是进程的一个操作是否会使得进程转变为“等待”的状态, 但是为什么我们总是把它和 IO 连在一起讨论呢?

原因是, 阻塞这个词是与系统调用 System Call 紧紧联系在一起的, 因为要让一个进程进入 等待(waiting) 的状态, 要么是它主动调用 wait() 或 sleep() 等挂起自己的操作, 另一种就是它调用 System Call, 而 System Call 因为涉及到了 I/O 操作, 不能立即完成, 于是内核就会先将该进程置为等待状态, 调度其他进程运行, 等到它所请求的 I/O 操作完成了以后, 再将其状态更改回 ready 。

操作系统内核在执行 System Call 时, CPU 需要与 IO 设备完成一系列物理通信上的交互, 其实再一次会涉及到阻塞和非阻塞的问题, 例如, 操作系统发起了一个读硬盘的请求后, 其实是向硬盘设备通过总线发出了一个请求,它即可以阻塞式地等待IO 设备的返回结果,也可以非阻塞式的继续其他的操作。在现代计算机中,这些物理通信操作基本都是异步完成的, 即发出请求后, 等待 I/O 设备的中断信号后, 再来读取相应的设备缓冲区。但是,大部分操作系统默认为用户级应用程序提供的都是阻塞式的系统调用 (blocking systemcall)接口, 因为阻塞式的调用,使得应用级代码的编写更容易(代码的执!行顺序和编写顺序是一的)。

但同样, 现在的大部分操作系统也会提供非阻塞I/O 系统调用接口(Nonblocking I/O system call)。一个非阻塞调用不会挂起调用程序, 而是会立即返回一个值, 表示有多少bytes 的数据被成功读取(或写入)。

非阻塞I/O 系统调用( nonblocking system call )的另一个替代品是异步I/O系统调用 (asychronous system call)。与非阻塞 I/O 系统调用类似,asychronous system call也是会立即返回, 不会等待 I/O 操作的完成, 应用程序可以继续执行其他的操作, 等到 I/O 操作完成了以后,操作系统会通知调用进程(设置一个用户空间特殊的变量值或者触发一个 signal 或者 产生一个软中断 或者 调用应用程序的回调函数)。

此处, 非阻塞I/O 系统调用( nonblocking system call )异步I/O系统调用 (asychronous system call)的区别是:

下图展示了同步I/O 与 异步 I/O 的区别 (非阻塞 IO 在下图中没有绘出).

注意, 上面提到的 非阻塞I/O 系统调用( nonblocking system call )异步I/O系统调用 都是非阻塞式的行为(non-blocking behavior)。他们的差异仅仅是返回结果的方式和内容不同。

当用户进程发出read操作时,如果kernel中的数据还没有准备好,那么它并不会block用户进程,而是立刻返回一个error。从用户进程角度讲 ,它发起一个read操作后,并不需要等待,而是马上就得到了一个结果。用户进程判断结果是一个error时,它就知道数据还没有准备好,于是它可以再次发送read操作。一旦kernel中的数据准备好了,并且又再次收到了用户进程的system call,那么它马上就将数据拷贝到了用户内存,然后返回。

所以,nonblocking IO的特点是用户进程需要不断的主动询问kernel数据好了没有。

非阻塞 I/O 如何帮助服务器提高吞吐量

考虑一个单进程服务器程序, 收到一个 Socket 连接请求后, 读取请求中的文件名,然后读请求的文件名内容,将文件内容返回给客户端。那么一个请求的处理流程会如下图所示。

在这个过程中, 我们可以看到, CPU 和 硬盘IO 的资源大部分时间都是闲置的。此时, 我们会希望在等待 I/O 的过程中继续处理新的请求。

方案一:多进程

方案二:多线程

引申问题:一个进程中的某一个线程发起了 system call 后, 是否造成整个进程的阻塞?如果会, 那么多线程方案与单进程方案相比就没有明显的改善。

在这种方案中, 如果 CPU 是多核的, 不同的线程还可以运行在不同的 CPU processor 上。既实现了IO 并发, 也实现了 CPU 并发。

问题:基于内核线程编写的应用会难以移植

从上面的过程可以看出,用户支持线程的解决方案基于非阻塞IO系统调用( non-blocking system call) , 且是一种基于操作系统内核事件通知(event-driven)的解决方案, 基于这个流程, 可以引申到更为宽泛的 event-driven progreamming 话题上。但是这里就不作赘述了。

为什么容易混淆

因为这个问题是一个多层次的问题.

举个例子, 一个网络包从APP-A发到APP-B需要经历:

  1. 从A的业务代码到A的软件框架;
  2. 从A的软件框架到计算机的操作系统内核;
  3. 从A所在计算机的内核到网卡;
  4. 从网卡经过网线发到交换机等设备,层层转发,到达B所在计算机的网卡;
  5. 从B所在计算机的网卡到B所在计算机的内核;
  6. 从B所在计算机的内核到B的程序的用户空间;
  7. 从B的软件框架到B的业务代码;

这里有一个层级关系, 只有在单独一级的调用上, 可以说同步还是异步的问题. 1和7是取决于框架的设计. 2和6见上面分析. 3和5一般是异步的. 4, 以太网是个同步时序逻辑,随信号传输时钟,必须两边设备同时就绪了才能开始传输数据,这又是同步的。

简单地说分三个层次

操作系统层次

操作系统进行IO和任务调用的层次, 现代操作系统通常使用异步非阻塞方式进行IO.

线程层次

操作系统为了减轻程序员的思考负担,将底层的异步非阻塞的IO方式进行封装,把相关系统调用(如read,write等)以同步的方式展现出来。然而,同步阻塞的IO会使线程挂起,同步非阻塞的IO会消耗CPU资源在轮询上。为了解决这一问题,就有3种思路:

  1. 多线程(同步阻塞);
  2. IO多路复用(select,poll,epoll)(同步非阻塞,严格地来讲,是把阻塞点改变了位置);
  3. 直接暴露出异步的IO接口,如Linux kernel-aio(io_uring)和windows IOCP(异步非阻塞)。

[深入理解Linux异步I/O框架 io_uring]

业务代码感知层次

这就要看具体的语言, 软件框架了. 如Node.js就通过回调函数, 提供了异步非阻塞的API. 因此,我们在讨论同步、异步、阻塞、非阻塞时,必须先明确是在哪个层次进行讨论。比如node.js,我们可以说她在业务代码感知层次提供了异步非阻塞的API,也可以说在Linux下,她在线程层次以同步非阻塞的epoll来实现。

总结

阻塞/非阻塞, 同步/异步的概念要注意讨论的上下文:

Copyright© 2013-2020

All Rights Reserved 京ICP备2023019179号-8