降妖除魔 | 究竟什么是阻塞？ - 哈喽比特

532次阅读 | 发布于3年以前

前言：很多词汇，不论对科班生还是非科班生，如果不知道底层原理，就永远是一个魔法词汇。这些魔法词汇一多，就会导致晕头转向。所以开个新系列，降妖除魔，就是要斩杀这些如妖魔鬼怪般的魔法词汇。

问两个问题

阻塞，是我们程序员口中常常提到的词。

这个词，既熟悉，又陌生，熟悉到一提到它就倍感亲切，但一具体解释，就迷迷糊糊。

这个函数是阻塞的么？

public void function() {
   while(true){}
}

如果你说不出来，那你再看看这个函数是阻塞的么？

public void function() {
   Thread.sleep(2000);
}

为了搞清楚这个问题，我们就来一起追踪一下阻塞的本质，消灭阻塞这个魔法词汇。

从一段 Java 代码开始

写一段很简单的 java 代码

import java.util.Scanner;
public class Zuse {
public static void main(String[] args) {
     Scanner scanner = new Scanner(System.in);
     String line = scanner.nextLine();
     System.out.println(line);
   }
}

运行这段代码发现，程序将会"阻塞"在 scanner.nextLine() 这一行代码，直到用户输入并且按下了回车键，程序才会继续往下走，打印我们输入的内容，并且结束。

我们跟踪一下这一行代码的源码，九曲十八弯之后，终于跟踪到了一个不能再往下跟踪的 native 代码。

private native int readBytes(byte b[], int off, int len) throws IOException;

当然我们可以通过 openJDK 源码继续查下去，但我有点懒，怕翻车，这里用另一个巧妙的办法。

由于我们知道这个代码一定最终会触发一次 linux 的 IO 操作相关的系统调用，所以我们用 strace 命令直接将其找到。

strace -ff -e trace=desc java Zuse

我们看到程序阻塞在了这里。

read(0,

当我们输入一个字符串 "hello" 并按下回车后，这个系统调用函数被补全。

read(0, "hello\n", 8192)

OK大功告成，触发 linux 的系统调用就是 read()

这样，我们成功通过 strace 命令，直接跨越到了 linux 内核里，中间的调用过程，就不用瞎操心了。

来到 linux 内核

linux 的系统调用会注册到系统调用表（sys_call_table）中，通常是在前缀加一个 sys_。

fn_ptr sys_call_table[] = { sys_setup, sys_exit, sys_fork, sys_read,
  sys_write, sys_open, sys_close, sys_waitpid, sys_creat, sys_link,
  sys_unlink, sys_execve, sys_chdir, sys_time, sys_mknod, sys_chmod,
  sys_chown, sys_break, sys_stat, sys_lseek, sys_getpid, sys_mount,
  sys_umount, sys_setuid, sys_getuid, sys_stime, sys_ptrace, sys_alarm,
  sys_fstat, sys_pause, sys_utime, sys_stty, sys_gtty, sys_access,
  sys_nice, sys_ftime, sys_sync, sys_kill, sys_rename, sys_mkdir,
  sys_rmdir, sys_dup, sys_pipe, sys_times, sys_prof, sys_brk, sys_setgid,
  sys_getgid, sys_signal, sys_geteuid, sys_getegid, sys_acct, sys_phys,
  sys_lock, sys_ioctl, sys_fcntl, sys_mpx, sys_setpgid, sys_ulimit,
  sys_uname, sys_umask, sys_chroot, sys_ustat, sys_dup2, sys_getppid,
  sys_getpgrp, sys_setsid, sys_sigaction, sys_sgetmask, sys_ssetmask,
  sys_setreuid, sys_setregid
};

所以我们就定位到 sys_read 函数，这个函数在 linux 内核源码的 read_write.c 文件中。

int sys_read (unsigned int fd, char *buf, int count)
{
   ...
if (S_ISCHR (inode->i_mode))
return rw_char (...);
if (S_ISBLK (inode->i_mode))
return block_read (...);
   ...
}

我们读取的是标准输入，属于字符型文件，走第一个分支。

之后，要经过非常非常多的调用栈，我感觉是 linux 当中最繁琐的历程了，这个过程在我脑子里还是一片浆糊。具体可以看飞哥的[《read一个字节实际发生了什么》]，一行一行源码给你分析清楚，不过是以读取磁盘为例，和这个读取终端设备一样也要经历文件系统的层层折磨。

由于我们只想知道阻塞的本质，所以，忽略中间这一大坨。

跟到最后，发现一句关键代码，让我提起了精神。

if (EMPTY (tty->secondary)) {
 sleep_if_empty (&tty->secondary);
}

再往里跟

static void sleep_if_empty (struct tty_queue *queue) {
 // 关中断
 cli ();
 // 只要队列为空
 while (EMPTY (*queue))
   // 可中断睡眠
   interruptible_sleep_on (&queue->proc_list);
 // 开中断
 sti ();
}

继续往里跟

// 将当前任务置为可中断的等待状态
void interruptible_sleep_on (struct task_struct **p) {
 ...
 current->state = TASK_INTERRUPTIBLE;
 schedule ();
 ...
}

OK，整个流程简单描述就是，只要用户不输入，字符队列就为空，此时将调用一个 interruptible_sleep_on 函数，将线程状态变为可中断的等待状态，同时调用 schedule() 函数，强制进行一次进程调度。

从进程调度看阻塞的本质

关于进程是怎么调度的，可以看[《上帝视角看进程调度》]。

我这里简单挑出重点，说明一下 schedule 也就是进程调度的过程，以 linux-0.11 为例。

很简答，这个函数就做了三件事：

1. 拿到剩余时间片（counter的值）最大且在 runnable 状态（state = 0）的进程号 next。

2. 如果所有 runnable 进程时间片都为 0，则将所有进程（注意不仅仅是 runnable 的进程）的 counter 重新赋值（counter = counter/2 + priority），然后再次执行步骤 1。3. 最后拿到了一个进程号 next，调用了 switch_to(next) 这个方法，就切换到了这个进程去执行了。我们只看第一条就好了，进程调度机制在选择下一个要调度的进程时，会跳过不是 RUNNABLE 状态的进程。

而我们刚刚将当前任务设置为 TASK_INTERRUPTIBLE，就是告诉进程调度算法，下次不要调度我，相当于放弃了 CPU 的执行权，相当于将当前进程挂起。

而底层的这一个操作，直接导致上层看来，像是停在了那一行不走一样，就是这一行。

import java.util.Scanner;
public class Zuse {
public static void main(String[] args) {
     Scanner scanner = new Scanner(System.in);
     String line = scanner.nextLine();
     System.out.println(line);
 }
}

这就是阻塞的本质。

再看唤醒的本质就简单了

有阻塞就有唤醒，当我们按下键盘时，会触发键盘中断，会进入键盘中断处理函数，keyboard_interrupt。

这个函数是提前注册在中断向量表里的。

再次经过九曲十八弯的跟踪后，发现这样一句代码。

wake_up(&tty->secondary.proc_list);

跟进去。

void wake_up(struct task_struct **p)
{
    if (p && *p) {
        (**p).state = TASK_RUNNABLE;
        *p = NULL;
    }
}

一目了然，将进程的状态改为 RUNNABLE，一会进程调度时，就可以参与了。

这就是阻塞后，唤醒的本质。

总结

所以，Java 代码中的一行 readline 会导致阻塞，实际上就是运行到了这段代码。

interruptible_sleep_on (&tty->secondary->proc_list);

而键盘输入后会将其唤醒，实际上就是运行到了这段代码。

wake_up(&tty->secondary.proc_list);

这两段代码里，其实就是通过改写 state 值去玩的，剩下的交给调度算法。

// 阻塞
current->state = TASK_INTERRUPTIBLE;
// 唤醒
(**p).state = TASK_RUNNABLE;

所以开篇两个问题，你可以回答了么？

这个函数是阻塞的么？

public void function() {
 while(true){}
}

这个函数是阻塞的么？

public void function() {
 Thread.sleep(2000);
}

答案都是否定的，因为这两个都没有让出 CPU 资源。（笔误，sleep是让出CPU资源的）

而阻塞的本质，是将进程挂起，不再参与进程调度。

而挂起的本质，其实就是将进程的 state 赋值为非 RUNNABLE，这样调度机制的代码中，就不会把它作为下一个获得 CPU 运行机会的可选项了。

怎么样，阻塞这个妖魔，除了么？

同时，欢迎大家提供更多的魔法词汇，让我来扒开他们的外衣！