ES6深度解析:Generators

221次阅读  |  发布于3年以前

介绍ES6 Generators

什么是Generators(生成器函数)?让我们先来看看一个例子。

function* quips(name) {
  yield "hello " + name + "!";
  yield "i hope you are enjoying the blog posts";
  if (name.startsWith("X")) {
    yield "it's cool how your name starts with X, " + name;
  }
  yield "see you later!";
}

这是一只会说话的猫的一些代码,可能是当今互联网上最重要的一种应用。它看起来有点像一个函数,对吗?这被称为生成器-函数,它与函数有很多共同之处。但你马上就能看到两个不同之处。

普通函数以function开头,生成器函数以function*开头。

在生成器函数中,yield是一个关键字,语法看起来像return。不同的是,函数(甚至是生成器函数)只能返回一次,而生成器函数可以“yield”任何次数。yield表达式暂停了生成器的执行,同时它可以在以后再次恢复。

Generators可以做什么

当你调用生成器-函数quips()时会发生什么?

> var iter = quips("jorendorff");
  [object Generator]
> iter.next()
  { value: "hello jorendorff!", done: false }
> iter.next()
  { value: "i hope you are enjoying the blog posts", done: false }
> iter.next()
  { value: "see you later!", done: false }
> iter.next()
  { value: undefined, done: true }

你可能已经非常习惯于普通函数和它们的行为方式。当你调用它们时,它们会立即开始运行,并一直运行到返回或抛出异常。

所有这些对任何js程序员来说都是第二天性。

调用一个生成器看起来也是一样的:quips("jorendorff")。但是当你调用一个生成器时,它还没有开始运行。

相反,它返回一个暂停的Generator对象iter(就是在上面的例子中叫做iter的对象)。

你可以把这个Generator对象看作是一个函数调用,在调用前被冻结。

具体来说,它被冻结在生成器函数的顶端,就在运行其第一行代码之前。每次你调用Generator对象的方法.next()时,函数调用都会自我解冻,并运行到下一个yield表达式为止。

这就是为什么我们每次调用上面的iter.next()方法,都会得到一个不同的字符串值。这些都是由函数quips()中的yield表达式产生的值。

在最后一次iter.next()调用中,我们终于到达了生成器-函数的终点,所以结果中.done字段的值是true。到达生成器函数的终点就像普通函数返回undefined一样,这就是为什么结果的value字段值是undefined。

现在可能是一个好时机,回到会说话的猫的演示页面,真正地玩一玩代码。试着把yield放在一个循环里面。会发生什么?从技术上讲,每次Generator执行yield时,它的堆栈--局部变量、参数、临时值以及当前在Generator主体中的执行位置--都会从堆栈中删除。

然而,Generator对象会保留对这个堆栈框架的引用(或副本),以便以后.next()调用可以重新激活它并继续执行。

值得指出的是,Generator不是线程。在有线程的语言中,多段代码可以同时运行,通常会导致竞赛条件、非确定性和甜蜜的性能。Generator则完全不是这样的。

当一个Generator运行时,它与调用者在同一个线程中运行。执行的顺序是顺序的、确定的,而不是并发的。与系统线程不同,Generator只在其函数体中标明的yield点上暂停运行。

好了。我们知道Generator是什么。我们已经看到了一个Generator的运行,暂停自己,然后恢复执行。现在有个大问题。

这种奇怪的能力怎么可能有用?

Generators就是迭代器(Generators are iterators)

ES6迭代器不仅仅是一个单一的内置类。它们是该语言的一个扩展点。你可以通过实现两个方法Symbol.iterator和next()来创建你自己的迭代器。

但是实现一个接口至少要做一点工作。让我们看看迭代器的实现在实践中是什么样的。

作为一个例子,让我们做一个简单的迭代器range,它只是从一个数字到另一个数字进行计数,就像一个老式的C循环for 一样。

// This should "ding" three times
for (var value of range(0, 3)) {
  alert("Ding! at floor #" + value);
}

这里有一个解决方案,使用ES6类class。

class RangeIterator {
  constructor(start, stop) {
    this.value = start;
    this.stop = stop;
  }

  [Symbol.iterator]() { return this; }

  next() {
    var value = this.value;
    if (value < this.stop) {
      this.value++;
      return {done: false, value: value};
    } else {
      return {done: true, value: undefined};
    }
  }
}

// Return a new iterator that counts up from 'start' to 'stop'.
function range(start, stop) {
  return new RangeIterator(start, stop);
}

这就是在Java或Swift中实现迭代器的情况。这并不坏。但也不完全是微不足道的。这段代码里有什么错误吗?这可不好说。

它看起来完全不像我们在这里试图模仿的原始循环:for ,迭代器协议迫使我们拆除了循环。在这一点上,你可能对迭代器感到有点冷淡。

它们可能很好用,但似乎很难实现。

你可能不会想建议我们在js语言中引入一个疯狂的、令人费解的新控制流结构,只是为了使迭代器更容易构建。

但既然我们有生成器Generator,我们能在这里使用它们吗?让我们试试吧。

function* range(start, stop) {
  for (var i = start; i < stop; i++)
    yield i;
}

上面的4行range()代码可以直接替代以前的23行实现,包括整个类RangeIterator。

就是因为Generator是迭代器,所以这一切才是可能的。

所有的生成器都有一个内置的next()和Symbol.iterator的实现。你只需写出循环的行为。

在没有Generator的情况下实现迭代器,就像被迫完全用被动语态来写一封长邮件。

当简单地说出你的意思不是一个选项时,你最终说的东西可能会变得相当复杂。"我的意思是,我的意思是,我必须在不使用循环语法的情况下描述一个循环的功能,所以RangeIterator又长又奇怪。而Generator就是答案。

我们还可以如何利用生成器作为迭代器的能力呢?

让任何对象都可以迭代。只需写一个Generator函数来遍历this,在遍历时产生(yield)每个值。

然后把这个生成器函数设置为this对象的[Symbol.iterator]方法。

简化建数组函数。假设你有一个函数,每次调用都会返回一个数组的结果,就像下面这个函数:

//将一维数组'图标'切分成长度为'rowLength'的数组
function splitIntoRows(icons, rowLength) {
  var rows = [];
  for (var i = 0; i < icons.length; i += rowLength) {
    rows.push(icons.slice(i, i + rowLength));
  }
  return rows;
}

使用Generator会让这种代码更短一些。

function* splitIntoRows(icons, rowLength) {
  for (var i = 0; i < icons.length; i += rowLength) {
    yield icons.slice(i, i + rowLength);
  }
}

执行时唯一区别是,它不是一次性计算所有的结果并返回一个数组,而是返回一个迭代器,然后根据需要逐个计算结果。

异常大小的结果。你不可能建立一个无限的数组。但是你可以返回一个Generator,生成一个无尽的序列,每个调用者可以从其中提取他们需要的任何数量的值。

重构复杂的循环。你有一个巨大的丑陋的函数吗?你想把它分解成两个更简单的部分吗?Generator是添加到你的重构工具箱中的一把新刀。

当你面对一个复杂的循环时,你可以把代码中产生数据的部分分解出来,把它变成一个单独的生成器-函数。

然后将循环改为:for (var data of myNewGenerator(args))

处理可迭代数据的工具。ES6并没有提供一个扩展库,用于过滤、映射,以及一般情况下对任意的可迭代数据集进行任意的处理。

但是Generator对于构建你所需要的工具来说是非常棒的,只需要几行代码。

例如,假设你需要一个新的在DOM NodeLists上遍历的方法,而不仅仅是Arrays。

小菜一碟:创建Array.prototype.filter

function* filter(test, iterable) {
  for (var item of iterable) {
    if (test(item))
      yield item;
  }
}

那么Generator是否有用呢?当然,它们是实现自定义迭代器的一种惊人的简单方法,而且迭代器是整个ES6的数据和循环的新标准。

但这并不是Generator的全部功能。这甚至可能不是它们所做的最重要的事情。

生成器与异步代码(Generators and asynchronous code)

下面是我前段时间写的一些JS代码。

          };
        })
      });
    });
  });
});

也许你已经在自己的代码中看到了这样的东西。异步API通常需要一个回调,这意味着每次你做什么都要写一个额外的匿名函数。

因此,如果你有一点代码做三件事,而不是三行代码,你就会看到三个缩进层次的代码。

下面是我写的一些更多的JS代码。

}).on('close', function () {
  done(undefined, undefined);
}).on('error', function (error) {
  done(error);
});

异步API有错误处理惯例,而不是异常。不同的API有不同的约定。在大多数API中,默认情况下,错误会被默默地放弃。

在一些API中,即使是普通的成功完成也是默认放弃的。

直到现在,这些问题都是我们为异步编程付出的代价。我们已经接受了这样的事实:异步代码看起来并不像相应的同步代码那样漂亮和简单。

Generator提供了新的希望:我们不必再写那样丑陋的代码。

Q.async()是一个实验性的尝试,它使用Generators与Promises来产生类似于相应同步代码的异步代码。比如说:

// Synchronous code to make some noise.
function makeNoise() {
  shake();
  rattle();
  roll();
}

// Asynchronous code to make some noise.
// Returns a Promise object that becomes resolved
// when we're done making noise.
function makeNoise_async() {
  return Q.async(function* () {
    yield shake_async();
    yield rattle_async();
    yield roll_async();
  });
}

主要的区别是,异步版本必须在调用异步函数的每个地方添加关键字yield。在该版本中添加像语句if或try/catch块这样的代码,就像在普通的同步版本中添加它一样。

与其他编写异步代码的方式相比,这感觉不像是在学习一种全新的语言。

因此,Generator为一种新的异步编程模型指明了方向,它似乎更适合人类的大脑。这项工作正在进行中。在其他方面,更好的语法可能会有帮助。

一项关于异步函数的建议,建立在Promises和Generators的基础上,并从C#的类似功能中获得灵感,已被提上ES7的议程。

Copyright© 2013-2020

All Rights Reserved 京ICP备2023019179号-8