Libuv是单线程事件驱动的异步IO库,对于阻塞式或耗时的操作,如果在Libuv的主循环里执行的话,就会阻塞后面的任务执行,所以Libuv里维护了一个线程池,它负责处理Libuv中耗时或者导致阻塞的操作,比如文件IO、DNS、自定义的耗时任务。线程池在Libuv架构中的位置如图4-1所示。
Libuv主线程通过线程池提供的接口把任务提交给线程池,然后立刻返回到事件循环中继续执行,线程池维护了一个任务队列,多个子线程会互斥地从中摘下任务节点执行,当子线程执行任务完毕后会通知主线程,主线程在事件循环的Poll IO阶段就会执行对应的回调。下面我们看一下线程池在Libuv中的实现。
Libuv子线程和主线程的通信是使用uv_async_t结构体实现的。Libuv使用loop->async_handles队列记录所有的uv_async_t结构体,使用loop->async_io_watcher作为所有uv_async_t结构体的IO观察者,即loop-> async_handles队列上所有的handle都是共享async_io_watcher这个IO观察者的。第一次插入一个uv_async_t结构体到async_handle队列时,会初始化IO观察者,如果再次注册一个async_handle,只会在loop->async_handle队列和handle队列插入一个节点,而不会新增一个IO观察者。当uv_async_t结构体对应的任务完成时,子线程会设置IO观察者为可读。Libuv在事件循环的Poll IO阶段就会处理IO观察者。下面我们看一下uv_async_t在Libuv中的使用。
使用uv_async_t之前首先需要执行uv_async_init进行初始化。
int uv_async_init(uv_loop_t* loop, uv_async_t* handle, uv_async_cb async_cb) { int err; // 给Libuv注册一个观察者io err = uv__async_start(loop); if (err) return err; // 设置相关字段,给Libuv插入一个handle uv__handle_init(loop, (uv_handle_t*)handle, UV_ASYNC); // 设置回调 handle->async_cb = async_cb; // 初始化标记字段,0表示没有任务完成 handle->pending = 0; // 把uv_async_t插入async_handle队列 QUEUE_INSERT_TAIL(&loop->async_handles, &handle->queue); uv__handle_start(handle); return 0; }
uv_async_init函数主要初始化结构体uv_async_t的一些字段,然后执行QUEUE_INSERT_TAIL给Libuv的async_handles队列追加一个节点。我们看到还有一个uv__async_start函数。我们看一下uv__async_start的实现。
static int uv__async_start(uv_loop_t* loop) { int pipefd[2]; int err; // uv__async_start只执行一次,有fd则不需要执行了 if (loop->async_io_watcher.fd != -1) return 0; // 获取一个用于进程间通信的fd(Linux的eventfd机制) err = uv__async_eventfd(); /* 成功则保存fd,失败说明不支持eventfd, 则使用管道通信作为进程间通信 */ if (err >= 0) { pipefd[0] = err; pipefd[1] = -1; } else if (err == UV_ENOSYS) { // 不支持eventfd则使用匿名管道 err = uv__make_pipe(pipefd, UV__F_NONBLOCK); #if defined(__Linux__) if (err == 0) { char buf[32]; int fd; snprintf(buf, sizeof(buf), "/proc/self/fd/%d", pipefd[0]); // 通过一个fd就可以实现对管道的读写,高级用法 fd = uv__open_cloexec(buf, O_RDWR); if (fd >= 0) { // 关掉旧的 uv__close(pipefd[0]); uv__close(pipefd[1]); // 赋值新的 pipefd[0] = fd; pipefd[1] = fd; } } #endif } // err大于等于0说明拿到了通信的读写两端 if (err < 0) return err; /* 初始化IO观察者async_io_watcher, 把读端文件描述符保存到IO观察者 */ uv__io_init(&loop->async_io_watcher, uv__async_io, pipefd[0]); // 注册IO观察者到loop里,并注册感兴趣的事件POLLIN,等待可读 uv__io_start(loop, &loop->async_io_watcher, POLLIN); // 保存写端文件描述符 loop->async_wfd = pipefd[1]; return 0; }
uv__async_start只会执行一次,时机在第一次执行uv_async_init的时候。uvasync_start主要的逻辑如下 1 获取通信描述符(通过eventfd生成一个通信的fd(充当读写两端)或者管道生成线程间通信的两个fd表示读端和写端)。 2 封装感兴趣的事件和回调到IO观察者然后追加到watcher_queue队列,在Poll IO阶段,Libuv会注册到epoll里面,如果有任务完成,也会在Poll IO阶段执行回调。 3 保存写端描述符。任务完成时通过写端fd通知主线程。 我们看到uvasync_start函数里有很多获取通信文件描述符的逻辑,总的来说,是为了完成两端通信的功能。初始化async结构体后,Libuv结构如图4-2所示。
初始化async结构体后,如果async结构体对应的任务完成后,就会通知主线程,子线程通过设置这个handle的pending为1标记任务完成,然后再往管道写端写入标记,通知主线程有任务完成了。
int uv_async_send(uv_async_t* handle) { /* Do a cheap read first. */ if (ACCESS_ONCE(int, handle->pending) != 0) return 0; /* 如pending是0,则设置为1,返回0,如果是1则返回1, 所以如果多次调用该函数是会被合并的 */ if (cmpxchgi(&handle->pending, 0, 1) == 0) uv__async_send(handle->loop); return 0; } static void uv__async_send(uv_loop_t* loop) { const void* buf; ssize_t len; int fd; int r; buf = ""; len = 1; fd = loop->async_wfd; #if defined(__Linux__) // 说明用的是eventfd而不是管道,eventfd时读写两端对应同一个fd if (fd == -1) { static const uint64_t val = 1; buf = &val; len = sizeof(val); // 见uv__async_start fd = loop->async_io_watcher.fd; /* eventfd */ } #endif // 通知读端 do r = write(fd, buf, len); while (r == -1 && errno == EINTR); if (r == len) return; if (r == -1) if (errno == EAGAIN || errno == EWOULDBLOCK) return; abort(); }
uv_async_send首先拿到写端对应的fd,然后调用write函数,此时,往管道的写端写入数据,标记有任务完成。有写则必然有读。读的逻辑是在uvio_poll中实现的。uv__io_poll函数即Libuv中Poll IO阶段执行的函数。在uvio_poll中会发现管道可读,然后执行对应的回调uv__async_io。
static void uv__async_io(uv_loop_t* loop, uv__io_t* w, unsigned int events) { char buf[1024]; ssize_t r; QUEUE queue; QUEUE* q; uv_async_t* h; for (;;) { // 消费所有的数据 r = read(w->fd, buf, sizeof(buf)); // 数据大小大于buf长度(1024),则继续消费 if (r == sizeof(buf)) continue; // 成功消费完毕,跳出消费的逻辑 if (r != -1) break; // 读繁忙 if (errno == EAGAIN || errno == EWOULDBLOCK) break; // 读被中断,继续读 if (errno == EINTR) continue; abort(); } // 把async_handles队列里的所有节点都移到queue变量中 QUEUE_MOVE(&loop->async_handles, &queue); while (!QUEUE_EMPTY(&queue)) { // 逐个取出节点 q = QUEUE_HEAD(&queue); // 根据结构体字段获取结构体首地址 h = QUEUE_DATA(q, uv_async_t, queue); // 从队列中移除该节点 QUEUE_REMOVE(q); // 重新插入async_handles队列,等待下次事件 QUEUE_INSERT_TAIL(&loop->async_handles, q); /* 将第一个参数和第二个参数进行比较,如果相等, 则将第三参数写入第一个参数,返回第二个参数的值, 如果不相等,则返回第一个参数的值。 */ /* 判断触发了哪些async。pending在uv_async_send里设置成1, 如果pending等于1,则清0,返回1.如果pending等于0,则返回0 */ if (cmpxchgi(&h->pending, 1, 0) == 0) continue; if (h->async_cb == NULL) continue; // 执行上层回调 h->async_cb(h); } }
uv__async_io会遍历async_handles队列,pending等于1的话说明任务完成,然后执行对应的回调并清除标记位。
了解了Libuv中子线程和主线程的通信机制后,我们来看一下线程池的实现。
线程池是懒初始化的,Node.js启动的时候,并没有创建子线程,而是在提交第一个任务给线程池时,线程池才开始初始化。我们先看线程池的初始化逻辑,然后再看它的使用。
static void init_threads(void) { unsigned int i; const char* val; // 默认线程数4个,static uv_thread_t default_threads[4]; nthreads = ARRAY_SIZE(default_threads); // 判断用户是否在环境变量中设置了线程数,是的话取用户定义的 val = getenv("UV_THREADPOOL_SIZE"); if (val != NULL) nthreads = atoi(val); if (nthreads == 0) nthreads = 1; // #define MAX_THREADPOOL_SIZE 128最多128个线程 if (nthreads > MAX_THREADPOOL_SIZE) nthreads = MAX_THREADPOOL_SIZE; threads = default_threads; // 超过默认大小,重新分配内存 if (nthreads > ARRAY_SIZE(default_threads)) { threads = uv__malloc(nthreads * sizeof(threads[0])); } // 初始化条件变量,用于有任务时唤醒子线程,没有任务时挂起子线程 if (uv_cond_init(&cond)) abort(); // 初始化互斥变量,用于多个子线程互斥访问任务队列 if (uv_mutex_init(&mutex)) abort(); // 初始化三个队列 QUEUE_INIT(&wq); QUEUE_INIT(&slow_io_pending_wq); QUEUE_INIT(&run_slow_work_message); // 创建多个线程,工作函数为worker,sem为worker入参 for (i = 0; i < nthreads; i++) if (uv_thread_create(threads + i, worker, &sem)) abort(); }
线程池初始化时,会根据配置的子线程数创建对应数量的线程。默认是4个,最大128个子线程(不同版本的Libuv可能会不一样),我们也可以通过环境变量设置自定义的大小。线程池的初始化主要是初始化一些数据结构,然后创建多个线程,接着在每个线程里执行worker函数处理任务。后面我们会分析worker的逻辑。
了解线程池的初始化之后,我们看一下如何给线程池提交任务
// 给线程池提交一个任务 void uv__work_submit(uv_loop_t* loop, struct uv__work* w, enum uv__work_kind kind, void (*work)(struct uv__work* w), void (*done)(struct uv__work* w, int status)){ /* 保证已经初始化线程,并只执行一次,所以线程池是在提交第一个 任务的时候才被初始化,init_once -> init_threads */ uv_once(&once, init_once); w->loop = loop; w->work = work; w->done = done; post(&w->wq, kind); }
这里把业务相关的函数和任务完成后的回调函数封装到uvwork结构体中。uvwork结构定义如下。
struct uv__work { void (*work)(struct uv__work *w); void (*done)(struct uv__work *w, int status); struct uv_loop_s* loop; void* wq[2]; };
然后调调用post函数往线程池的队列中加入一个新的任务。Libuv把任务分为三种类型,慢IO(DNS解析)、快IO(文件操作)、CPU密集型等,kind就是说明任务的类型的。我们接着看post函数。
static void post(QUEUE* q, enum uv__work_kind kind) { // 加锁访问任务队列,因为这个队列是线程池共享的 uv_mutex_lock(&mutex); // 类型是慢IO if (kind == UV__WORK_SLOW_IO) { /* 插入慢IO对应的队列,Libuv这个版本把任务分为几种类型, 对于慢IO类型的任务,Libuv是往任务队列里面插入一个特殊的节点 run_slow_work_message,然后用slow_io_pending_wq维护了一个慢IO 任务的队列,当处理到run_slow_work_message这个节点的时候, Libuv会从slow_io_pending_wq队列里逐个取出任务节点来执行。 */ QUEUE_INSERT_TAIL(&slow_io_pending_wq, q); /* 有慢IO任务的时候,需要给主队列wq插入一个消息节点 run_slow_work_message,说明有慢IO任务,所以如果 run_slow_work_message是空,说明还没有插入主队列。需要进行 q = &run_slow_work_message;赋值,然后把 run_slow_work_message插入主队列。如果run_slow_work_message 非空,说明已经插入线程池的任务队列了。解锁然后直接返回。 */ if (!QUEUE_EMPTY(&run_slow_work_message)) { uv_mutex_unlock(&mutex); return; } // 说明run_slow_work_message还没有插入队列,准备插入队列 q = &run_slow_work_message; } // 把节点插入主队列,可能是慢IO消息节点或者一般任务 QUEUE_INSERT_TAIL(&wq, q); /* 有空闲线程则唤醒它,如果大家都在忙, 则等到它忙完后就会重新判断是否还有新任务 */ if (idle_threads > 0) uv_cond_signal(&cond); // 操作完队列,解锁 uv_mutex_unlock(&mutex); }
这就是Libuv中线程池的生产者逻辑。任务队列的架构如图4-3所示。
除了上面提到的,Libuv还提供了另外一种生产任务的方式,即uv_queue_work函数,它只提交CPU密集型的任务(在Node.js的crypto模块中使用)。下面我们看uv_queue_work的实现。
int uv_queue_work(uv_loop_t* loop, uv_work_t* req, uv_work_cb work_cb, uv_after_work_cb after_work_cb) { if (work_cb == NULL) return UV_EINVAL; uv__req_init(loop, req, UV_WORK); req->loop = loop; req->work_cb = work_cb; req->after_work_cb = after_work_cb; uv__work_submit(loop, &req->work_req, UV__WORK_CPU, uv__queue_work, uv__queue_done); return 0; }
uv_queue_work函数其实也没有太多的逻辑,它保存用户的工作函数和回调到request中。然后把uvqueue_work和uv__queue_done封装到uvwork中,接着提交任务到线程池中。所以当这个任务被执行的时候。它会执行工作函数uv__queue_work。
static void uv__queue_work(struct uv__work* w) { // 通过结构体某字段拿到结构体地址 uv_work_t* req = container_of(w, uv_work_t, work_req); req->work_cb(req); }
我们看到uv__queue_work其实就是对用户定义的任务函数进行了封装。这时候我们可以猜到,uv__queue_done也只是对用户回调的简单封装,即它会执行用户的回调。
我们提交了任务后,线程自然要处理,初始化线程池的时候我们分析过,worker函数是负责处理任务。我们看一下worker函数的逻辑。
static void worker(void* arg) { struct uv__work* w; QUEUE* q; int is_slow_work; // 线程启动成功 uv_sem_post((uv_sem_t*) arg); arg = NULL; // 加锁互斥访问任务队列 uv_mutex_lock(&mutex); for (;;) { /* 1 队列为空 2 队列不为空,但是队列中只有慢IO任务且正在执行的慢IO任务 个数达到阈值则空闲线程加一,防止慢IO占用过多线程,导致 其它快的任务无法得到执行 */ while (QUEUE_EMPTY(&wq) || (QUEUE_HEAD(&wq) == &run_slow_work_message && QUEUE_NEXT(&run_slow_work_message) == &wq && slow_io_work_running >= slow_work_thread_threshold())) { idle_threads += 1; // 阻塞,等待唤醒 uv_cond_wait(&cond, &mutex); // 被唤醒,开始干活,空闲线程数减一 idle_threads -= 1; } // 取出头结点,头指点可能是退出消息、慢IO,一般请求 q = QUEUE_HEAD(&wq); // 如果头结点是退出消息,则结束线程 if (q == &exit_message) { /* 唤醒其它因为没有任务正阻塞等待任务的线程, 告诉它们准备退出 */ uv_cond_signal(&cond); uv_mutex_unlock(&mutex); break; } // 移除节点 QUEUE_REMOVE(q); // 重置前后指针 QUEUE_INIT(q); is_slow_work = 0; /* 如果当前节点等于慢IO节点,上面的while只判断了是不是只有慢 IO任务且达到阈值,这里是任务队列里肯定有非慢IO任务,可能有 慢IO,如果有慢IO并且正在执行的个数达到阈值,则先不处理该慢 IO任务,继续判断是否还有非慢IO任务可执行。 */ if (q == &run_slow_work_message) { // 达到阈值,该节点重新入队,因为刚才被删除了 if (slow_io_work_running >= slow_work_thread_threshold()) { QUEUE_INSERT_TAIL(&wq, q); continue; } /* 没有慢IO任务则继续,这时候run_slow_work_message 已经从队列中被删除,下次有慢IO的时候重新入队 */ if (QUEUE_EMPTY(&slow_io_pending_wq)) continue; // 有慢IO,开始处理慢IO任务 is_slow_work = 1; /* 正在处理慢IO任务的个数累加,用于其它线程判断慢IO任务个 数是否达到阈值, slow_io_work_running是多个线程共享的变量 */ slow_io_work_running++; // 摘下一个慢IO任务 q = QUEUE_HEAD(&slow_io_pending_wq); // 从慢IO队列移除 QUEUE_REMOVE(q); QUEUE_INIT(q); /* 取出一个任务后,如果还有慢IO任务则把慢IO标记节点重新入 队,表示还有慢IO任务,因为上面把该标记节点出队了 */ if (!QUEUE_EMPTY(&slow_io_pending_wq)) { QUEUE_INSERT_TAIL(&wq, &run_slow_work_message); // 有空闲线程则唤醒它,因为还有任务处理 if (idle_threads > 0) uv_cond_signal(&cond); } } // 不需要操作队列了,尽快释放锁 uv_mutex_unlock(&mutex); // q是慢IO或者一般任务 w = QUEUE_DATA(q, struct uv__work, wq); // 执行业务的任务函数,该函数一般会阻塞 w->work(w); // 准备操作loop的任务完成队列,加锁 uv_mutex_lock(&w->loop->wq_mutex); // 置空说明执行完了,见cancel逻辑 w->work = NULL; /* 执行完任务,插入到loop的wq队列,在uv__work_done的时候会 执行该队列的节点 */ QUEUE_INSERT_TAIL(&w->loop->wq, &w->wq); // 通知loop的wq_async节点 uv_async_send(&w->loop->wq_async); uv_mutex_unlock(&w->loop->wq_mutex); // 为下一轮操作任务队列加锁 uv_mutex_lock(&mutex); /* 执行完慢IO任务,记录正在执行的慢IO个数变量减1, 上面加锁保证了互斥访问这个变量 */ if (is_slow_work) { slow_io_work_running--; } } }
我们看到消费者的逻辑似乎比较复杂,对于慢IO类型的任务,Libuv限制了处理慢IO任务的线程数,避免耗时比较少的任务得不到处理。其余的逻辑和一般的线程池类似,就是互斥访问任务队列,然后取出节点执行,执行完后通知主线程。结构如图4-4所示。
线程执行完任务后,并不是直接执行用户回调,而是通知主线程,由主线程统一处理,这是Node.js单线程事件循环的要求,也避免了多线程带来的复杂问题,我们看一下这块的逻辑。一切要从Libuv的初始化开始
uv_default_loop();-> uv_loop_init();-> uv_async_init(loop, &loop->wq_async, uv__work_done);
刚才我们已经分析过主线程和子线程的通信机制,wq_async是用于线程池中子线程和主线程通信的async handle,它对应的回调是uv__work_done。所以当一个线程池的线程任务完成时,通过uv_async_send(&w->loop->wq_async)设置loop->wq_async.pending = 1,然后通知IO观察者,Libuv在Poll IO阶段就会执行该handle对应的回调uv__work_done函数。那么我们就看看这个函数的逻辑。
void uv__work_done(uv_async_t* handle) { struct uv__work* w; uv_loop_t* loop; QUEUE* q; QUEUE wq; int err; // 通过结构体字段获得结构体首地址 loop = container_of(handle, uv_loop_t, wq_async); // 准备处理队列,加锁 uv_mutex_lock(&loop->wq_mutex); /* loop->wq是已完成的任务队列。把loop->wq队列的节点全部移到 wp变量中,这样一来可以尽快释放锁 */ QUEUE_MOVE(&loop->wq, &wq); // 不需要使用了,解锁 uv_mutex_unlock(&loop->wq_mutex); // wq队列的节点来自子线程插入 while (!QUEUE_EMPTY(&wq)) { q = QUEUE_HEAD(&wq); QUEUE_REMOVE(q); w = container_of(q, struct uv__work, wq); // 等于uv__canceled说明这个任务被取消了 err = (w->work == uv__cancelled) ? UV_ECANCELED : 0; // 执行回调 w->done(w, err); } }
该函数的逻辑比较简单,逐个处理已完成的任务节点,执行回调,在Node.js中,这里的回调是C++层,然后再到JS层。结构图如图4-5所示。
线程池的设计中,取消任务是一个比较重要的能力,因为在线程里执行的都是一些耗时或者引起阻塞的操作,如果能及时取消一个任务,将会减轻很多没必要的处理。不过Libuv实现中,只有当任务还在等待队列中才能被取消,如果一个任务正在被线程处理,则无法取消了。我们先看一下Libuv中是如何实现取消任务的。Libuv提供了uv__work_cancel函数支持用户取消提交的任务。我们看一下它的逻辑。
static int uv__work_cancel(uv_loop_t* loop, uv_req_t* req, struct uv__work* w) { int cancelled; // 加锁,为了把节点移出队列 uv_mutex_lock(&mutex); // 加锁,为了判断w->wq是否为空 uv_mutex_lock(&w->loop->wq_mutex); /* cancelled为true说明任务还在线程池队列等待处理 1 处理完,w->work == NULL 2 处理中,QUEUE_EMPTY(&w->wq)为true,因 为worker在摘下一个任务的时候,重置prev和next指针 3 未处理,!QUEUE_EMPTY(&w->wq)是true 且w->work != NULL */ cancelled = !QUEUE_EMPTY(&w->wq) && w->work != NULL; // 从线程池任务队列中删除该节点 if (cancelled) QUEUE_REMOVE(&w->wq); uv_mutex_unlock(&w->loop->wq_mutex); uv_mutex_unlock(&mutex); // 正在执行或者已经执行完了,则不能取消 if (!cancelled) return UV_EBUSY; // 打取消标记,Libuv执行回调的时候用到 w->work = uv__cancelled; uv_mutex_lock(&loop->wq_mutex); /* 插入loop的wq队列,对于取消的动作,Libuv认为是任务执行完了。 所以插入已完成的队列,执行回调的时候会通知用户该任务的执行结果 是取消,错误码是UV_ECANCELED */ QUEUE_INSERT_TAIL(&loop->wq, &w->wq); // 通知主线程有任务完成 uv_async_send(&loop->wq_async); uv_mutex_unlock(&loop->wq_mutex); return 0; }
在Libuv中,取消任务的方式就是把节点从线程池待处理队列中删除,然后打上取消的标记(w->work = uvcancelled),接着把该节点插入已完成队列,Libuv在处理已完成队列的节点时,判断如果w->work == uvcancelled则在执行用户回调时,传入错误码UV_ECANCELED,我们看到uv__work_cancel这个函数定义前面加了一个static,说明这个函数是只在本文件内使用的,Libuv对外提供的取消任务的接口是uv_cancel。
Copyright© 2013-2020
All Rights Reserved 京ICP备2023019179号-8