如何在 Node.js 中正确的使用日志对象

235次阅读  |  发布于3年以前

日志,是开发者排查问题的非常重要的手段,有时候甚至是唯一的,所以如何合理并正确的打印日志,成了开发时的重中之重。

Node.js 中打日志的方式,一般有几种:

这两种方式都可以由不同的模块来实现,我们接下去就来看看怎么选择。

常见的主动展示

一般来说,主动一般发生在开发期,不确定状态的时候,我们会打印一些消息,比如常见的。

console.log('hello world');

这就是最简单的主动打印的例子。

但是大多数场景下,我们都不会使用 console 来进行打印,毕竟除了内置之外,在性能和功能方面没有特别的优势。

除了大众都知道的 console 模块,在 Node.js 领域还有一个较为知名的 <span style="font-size: 14px;">debug 模块。

可以根据命名空间打印出不同颜色的输出,但是最最有用的,则是他的环境变量控制能力。

默认情况下(不包含任何环境变量),控制台不会有任何输出,而当 <span style="font-size: 14px;">DEBUG 环境变量被赋值的时候,对应的命名空间的输出才会被打印到 stdout。

$ DEBUG=* node app.js

由于 debug 模块由 TJ 出品,并且在非常早的时候就投入,使用过于广泛,至今仍有非常多的模块使用了它。

Node.js 官方一直希望能够内置一个 debug 模块。从 v0.11.3 开始,终于加上了一个 <span style="font-size: 14px;">util.debuglog 方法。

它的功能和 debug 模块类似,同时是内置的模块,所以逐步也有一些模块开始过渡到它。

const util = require('util');
const debuglog = util.debuglog('foo');

debuglog('hello from foo [%d]', 123);

它的开关也类似,使用的是 <span style="font-size: 14px;">NODE_DEBUG 环境变量,应该是特意和 <span style="font-size: 14px;">debug 模块做了区分。

$ NODE_DEBUG=foo node app.js

被动记录的方式

除了上面提到的类 console 等方式,我们常见的就是各种日志库默认记录的日志,由于这些日志平时只是默默的记录,并不会过多关注,只会在特殊需要的时候(比如差错,定位,计算时)才会查看,所以我们归类为 “被动的方式”。

大多的三方库都有类似的功能,比如 log4j,winston,pino 等等。

这些库的核心功能一般是:

这些库用起来一般就比较简单,获取实例,调用方法输出即可。

logger.info('hello world');

注意,这里我们会观察到输出有一些不一样的地方。

2021-07-22 14:50:59,388 INFO 7739 [xxx] hello world

整个日志是安装上面类似标准的结构来进行输出的,计算是 Error,也是相同的类似格式,那么这个结构包含了哪几部分东西呢?

日志格式

其实整个日志格式追溯,可以到很久以前,不管是 JAVA 默认的 Simple Logger 结构还是类似 nginx 等反向代理服务器的日志,都会包含一些固定的字段,这些固定的字段长久以来形成了一种输出约定,将这些字段组合起来,形成了当今的日志格式。

当前的日志格式一般会包括几个部分。

除此之外,可能还有一些自定义的内容,比如执行消耗的时间,用户 id,文本长度等等内容。

在文本结构的输出中,这些字段将被空格(space)分隔,以换行符作为结尾(\n),这样可以方便外部的日志采集系统采集,比如阿里云的 SLS 等等。

每个公司会有自己的日志采集和输出规范,所以一般常见的库都会支持自定义的日志格式,但是不管如何变化,基础的字段(上述)都还会存在。

随着系统的迭代,先进使用 JSON 格式来记录日志的方式也逐步出现,以 Logstash 为首的一些数据(日志)采集分析一体的工具,也逐步的成熟,对结构化的数据支持的也很好,所以现在常见的库也会同步支持 JSON 格式输出。

正确的打日志

在了解了基本的日志库和体系之后,我们来具体看一看真正打日志的问题。

比如一个简单调用远端服务:


async invokeRemoteAPI() {
  const result = await remoteService.got();
  return {
    result
  };
}

一般,我们会有意识的加上错误处理。

async invokeRemoteAPI() {

  try {
    const result = await remoteService.got();
  } catch(err) {
    logger.error('got a error, err=', err);
    throw err;
  }

  return {
    result
  };
}

按照上面的标准格式,这个 logger 还需要其他的一些额外信息,比如:

async invokeRemoteAPI() {

  const pid = process.pid;
  const startTime = Date.now();

  try {
    const result = await remoteService.got();
  } catch(err) {
    const endTime = Date.now();
    logger.error('pid=%s, rt=%s, got a error, err=', pid, Date.now() - startTime, err);
    throw err;
  }

  return {
    result
  };
}

如果每个代码都这么写,就会变得无比冗余,所以,我们会提前将日志的输出格式定义完毕,这样,在实际输出的时候就可以简化,比如:

const logger = new CustomLogger({
  format: '${timestamp} ${level} ' + process.pid + ${rt}'
});

async invokeRemoteAPI() {
  const startTime = Date.now();

  try {
    const result = await remoteService.got();
  } catch(err) {
    const endTime = Date.now();
    logger.error('got a error, err=', err, {
      rt: Date.now() - startTime
    });
    throw err;
  }

  return {
    result
  };
}

所以在特定场景下,如果有固定的日志字段,在日志库允许自定义的情况下,可以先定义好固定的日志格式。

上下文日志

除了最简单的通用日志输出之外,还有一种相对复杂的日志,我们称之为和上下文(请求)绑定的日志,这类日志会输出上下文相关联的数据,比如之前示例中的响应时间,用户请求的 ip,请求的路由,甚至是链路的唯一 ID 等等。

比如:

2021-07-22 14:50:59,388 INFO 7739 [-/127.0.0.1/-/0ms GET /] hello world

这种情况下,再用普通日志的方式加入参数就不合适了。

当然,有些同学会说,我们直接定义一个新的,比如:

class CustomCtxLogger extends CustomLogger {
  constructor(ctx, format) {
    this.ctx = ctx;
    this.format = format;
  }

  error(...args) {
    //xxx
  }

  info(...args) {
    //xxx
  }
}

这样的做法,每次都会让基类做初始化,会影响部分性能。我们使用另一种方式来减少性能影响,代理传统日志。

我们来看看最简单的实现方式,以 koa 为例。

// 普通日志
const logger = new CustomLogger();

class CtxLogger {
  constructor(ctx, logger) {
    this.ctx = ctx;
    this.logger = logger;
  }

  format() {
    return '${timestamp} ${level} ' + process.pid + '[${ctx.refer} ${ctx.rt}]'
  }
}

app.use(async (ctx, next) => {
  // 代理原始日志
  const ctxLogger = new CtxLogger(ctx, logger);
  ctx.logger = ctxLogger;

  await next();
});

类似这种通过代理原始日志的方式,即减少了每次初始化新日志时的性能问题,又解决了 ctx 上字段透传的问题。

这也是常见的上下文日志的实践。

简单总结一下

我们了解了常用的日志库以及和日志打印的关系,也简单的实现了日志库以及上下文日志的实现,是不是现在对日志打印了有了一个基本的了解?

这样一套下来,相信你对 Node.js 打印日志的方式更加的了解,也在排错时游刃有余了。

Copyright© 2013-2020

All Rights Reserved 京ICP备2023019179号-8