理解 ECMAScript 规范(1)

305次阅读  |  发布于3年以前

翻译本文的目的是尝试给出 ECMAScript 规范中核心术语的译法,供同好品评。

在这篇文章里,我们会从规范中找一个简单的功能,借以理解规范中的符号。开始吧!

前言

即便你懂 JavaScript,阅读其规范也会让人畏缩。

让我们从一个具体的例子开始,然后通过规范去理解它。下面的代码演示了 Object.prototype.hasOwnProperty的用法:

const o = { foo: 1 };
o.hasOwnProperty('foo'); // true
o.hasOwnProperty('bar'); // false

o并没有一个叫hasOwnProperty的属性,因此要沿原型链向上查找。于是,在o的原型Object.prototype上找到了它。

为描述Object.prototype.property的工作原理,规范使用了类似伪代码的说明:

Object.prototype.hasOwnProperty(V) 在以参数 V 调用hasOwnProperty方法时,将执行以下步骤: 1. 令P为 ? ToPropertyKey(V); 2. 令O为 ? ToObject(this值); 3. 返回? HasOwnProperty(O, P)

以及

HasOwnProperty(O, P) 抽象操作HasOwnProperty用于确定对象是否有一个以指定属性为键的自有属性。返回布尔值。这个操作以参数OP调用,其中O是对象,P是属性键。这个抽象操作执行以下步骤。 1. 断言:Type(O)Object; 2. 断言:IsPropertyKey(P)true; 3. 令desc? O.[[GetOwnProperty]](P); 4. 若descundefined,返回false; 5. 返回true

什么是“抽象操作”?[[]]里面的东西表示什么?为什么把一个?放在函数前面?“断言”又是什么意思?

语言类型与规范类型

规范使用了undefinedtruefalse这些我们在 JavaScript 中已经知道的值。这些都是语言值[1],即规范中定义的语言类型的值。

规范内部也使用语言值,比如某个内部数据类型的字段可能包含truefalse。相对而言,JavaScript 引擎通常不会在内部使用语言值。例如,如果 JavaScript 引擎是用 C++写的,那通常会使用 C++的truefalse,而这并不是 JavaScript 语言值truefalse的内部表示。

除了语言类型,规范也有自己的规范类型[2]。规范类型是只存在于规范中的类型,JavaScript 语言中不存在。JavaScript 引擎不需要(但完全可以)实现它们。本文将介绍规范类型记录(Record)及其子类型完成记录(Completion Record)。

抽象操作

抽象操作[3]是 ECMAScript 规范定义的函数,定义它们的目的是为了让规范更简洁。JavaScript 引擎不必在内部实现这些函数。这些函数不能直接在 JavaScript 中调用。

内部栏位及内部方法

内部栏位(slot)和内部方法[4]包含在[[]]中。

内部栏位是 JavaScript 对象或规范类型的数据成员,用于存储对象的状态。内部方法是 JavaScript 对象的内部成员函数。

比如,每个 JavaScript 对象都有一个内部栏位[[Prototype]]和一个内部方法[[GetOwnProperty]]

内部栏位和内部方法不能在 JavaScript 中使用。换句话说,不能访问o.[[Prototype]]或调用o.[[GetOwnProperty]]()。JavaScript引擎可以为了内部使用实现它们,但不是必需的。

有时候内部方法也会委托到名字类似的抽象操作,比如普通对象(ordinary object)的[[GetOwnProperty]]

[[GetOwnProperty]](p)   在以属性键 P 调用内部方法[[GetOwnProperty]]时,将执行以下步骤: 1. 返回! OrdinaryGetOwnProperty(O, P)

(下一篇文章会介绍这里的叹号表示什么意思。)

OrdinaryGetOwnProperty不是内部方法,因为它不与任何对象关联,而是以接收参数的形式取得要操作的对象。

OrdinaryGetOwnProperty前面的“ordinary”(普通)表示它只操作普通对象。ECMAScript 对象要么是普通对象(ordinary),要么是异质对象(exotic)。普通对象必须具有一组被称为基本内部方法(essential internal methods)的方法所定义的默认行为。如果某个对象修改了默认行为(即覆盖或重写了一个或多个基本内部方法。——译者注),那它就是异质对象。

大家最熟悉的Array就是异质对象,因为其length属性的行为与默认行为不同:设置数组的length属性可能会从数组中删除元素。

这里给出了所有基本内部方法[5](普通对象 11 个,函数对象 2 个。——译者注)。

完成记录

前面例子中出现的问号和叹号表示什么意思?要理解它们,需要先理解完成记录[6](Completion Record)!

完成记录是一种规范类型(只在规范中使用)。JavaScript 引擎不需要实现对应的内部数据类型。

完成记录是一种记录类型(Record),而记录具有一组固定的命名字段。完成记录具有以下 3 个字段。

所有抽象操作都会隐式返回一个完成记录。即便一个抽象操作看起来返回简单类型(如 Boolean)的值,这个值也会被隐式包装在一个normal类型(正常完成)的完成记录中返回(参见隐式完成值[7])。

注 1:规范本身在这方面也不是完全一致。有一些辅助函数会返回裸值,而这些值将直接被使用,无需从完成记录中提取。不过这种情况在上下文中通常能够一目了然。 注 2:规范编辑也在致力于更显式地处理完成记录。

如果某个算法抛出异常,则意味着返回的完成记录的[[Type]]throw[[Value]]为异常对象。我们这里不讨论breakcontinuereturn类型(规范中没有相应的例子,因为这几种类型不能跨函数。——译者注)。

ReturnIfAbrupt(argument)表示执行如下步骤:

1. 若argument为硬性完成,返回argument; 2. 设argumentargument.[[Value]]

换句话说,对于完成记录,如果是硬性完成,则立即返回;如果是正常完成,则提取完成记录的值。

ReturnIfAbrupt看起来虽然像函数调用,但它不是。ReturnIfAbrup会导致它所在位置的函数返回,而不是ReturnIfAbrupt本身返回。ReturnIfAbrupt有点像 C 语言中的宏。

ReturnIfAbrupt可以这样用:

1.令objFoo();(obj是一个完成记录。) 2.ReturnIfAbrupt(obj); 3.Bar(obj)。(如果到了这一步,obj已经变成了从完成记录中提取出来的值。)

现在该说到问号[8]了:? Foo()等价于ReturnIfAbrupt(Foo())。显然,使用简写(?)可以省去每次都明确写出错误处理代码的麻烦。

类似地,“令val为 ! Foo()”等价于:

1. 令valFoo();(val是一个完成记录。) 2. 断言:val非硬性完成; 3. 设valval.[[Value]]

(换句话说,叹号表示从正常完成记录中提取值。——译者注 )

知道了这些之后,就可以把前面的Object.prototype.hasOwnProperty以完整但冗余的形式重写如下:

Object.prototype.hasOwnProperty(V) 1. 令PToPropertyKey(V); 2. 若P为硬性完成,返回P; 3. 设PP.[[Value]]; 4. 令OToObject(this值); 5. 若O为硬性完成,返回O; 6. 设OO.[[Value]]; 7. 令tempHasOwnProperty(O, P); 8. 若temp为硬性完成,返回temp; 9. 设temptemp.[[Value]]; 10. 返回NormalCompletion(temp)

把抽象操作HasOwnProperty()重写如下:

HasOwnProperty(O, P) 1. 断言:Type(O)Object; 2. 断言:IsPropertyKey(P)true; 3. 令descO.[[GetOwnProperty]](P); 4. 若desc为硬性完成,返回desc; 5. 设descdesc.[[Value]]; 6. 若descundefined,返回NormalCompletion(false); 7. 返回NormalCompletion(true)

进而把内部方法O.[[GetOwnProperty]]以不带叹号的形式重写如下:

O.[[GetOwnProperty]] 1. 令tempOrdinaryGetOwnProperty(O, P); 2. 断言:temp非硬性完成; 3. 令temptemp.[[Value]]; 4. 返回NormalCompletion(temp)

这里假设temp是个新的临时变量,不与任何其他变量冲突。

这里也用到了前面说的当返回语句返回非完成记录时,实际上返回值将被隐式包装在一个NormalCompletion中。

扩展学习:返回? Foo()

规范中使用“返回? Foo()”这种写法,为什么还要加个问号呢?

“返回? Foo()”扩展后是:

1. 令tempFoo(); 2. 若temp为硬性完成,返回temp; 3. 设temptemp.[[Value]]; 4. 返回NormalCompletion(temp)

这跟“返回Foo()”没有区别:即无论硬性完成还是正常完成,行为都一样。

写成“返回 ? Foo() ”仅仅是出于编辑方便的考虑,为了更明确地表示返回的Foo()是一个完成记录。

断言

规范中的“断言”提示算法中不变的条件。添加这些“断言”是为了明确起见,不要求实现。换句话说,实现不需要检查这些条件。

挑战

抽象操作也会委托给其他抽象操作(见下图),但根据本文的介绍,大家应该能推断出这些操作最终干了什么事。这里面会碰到属性描述符(Property Descriptor),也是一种规范类型。

小结

我们通过规范看到了一个简单的方法Object.prototype.hasOwnProperty和它调用的抽象操作,知道了?和!与错误处理有关,也了解了语言类型规范类型内部栏位内部方法

原文链接[9]

参考资料

[1] 语言值: https://tc39.es/ecma262/#sec-ecmascript-language-types

[2] 规范类型: https://tc39.es/ecma262/#sec-ecmascript-specification-types

[3] 抽象操作: https://tc39.es/ecma262/#sec-abstract-operations

[4] 内部栏位(slot)和内部方法: https://tc39.es/ecma262/#sec-object-internal-methods-and-internal-slots

[5] 基本内部方法: https://tc39.es/ecma262/#table-5

[6] 完成记录: https://tc39.es/ecma262/#sec-completion-record-specification-type

[7] 隐式完成值: https://tc39.es/ecma262/#sec-implicit-completion-values

[8] 问号: https://tc39.es/ecma262/#sec-returnifabrupt-shorthands

[9] 原文链接: https://v8.dev/blog/understanding-ecmascript-part-1

Copyright© 2013-2020

All Rights Reserved 京ICP备2023019179号-8