编译器如何实现lambda表达式？ - 哈喽比特

386次阅读 | 发布于4年以前

lambda表达式在C++11中引入，用lambda表达式表示匿名函数非常方便，语法很简单，而且可以使代码更紧凑，更易于阅读。

lambda表达式更适合定义小点的回调内联去传递给其他函数，而不是在其他地方定义个完整的函数对象，并在其重载函数调用运算符中实现回调逻辑。所有的逻辑都在一个位置上，容易理解和维护，lambda表达式可以接收参数，可返回值，可模板化，可通过值或引用的方式访问外面的变量，相当的灵活。

关于lambda表达式的使用，我之前介绍过，可以看这篇文章[搞定c++11新特性std::function和lambda表达式] ，这里一笔带过：

auto lambda { []{ cout << "Hello \n"; } };
lambda();

那这个lambda表达式是如何实现的呢？

编译器会将lambda表达式自动转换为函数对象，编译器会为此生成个唯一的命名。上面的示例会自动的转换成下面这样的函数对象，注意函数调用运算符是个const方法，返回类型是auto，这方便编译器根据方法体自动推导出返回类型。

class CompilerGeneratedName {
    public:
        auto operator()() const { cout << "Hello \n"; }
};

编译器生成的lambda闭包名字会是一些奇怪的名子，例如__Lambda_21Za等，我们没法知道这个名字，我们也不需要知道这个名字。

lambda表达式可以接收参数，参数在圆括号之间指定，就像普通函数一样，下面是例子：

auto lambda {
    [](int value){ cout << "The value is " << value << endl; } };
lambda(42);

如果lambda表达式不接收任何参数，可以指定空括号或者直接省略括号。

编译器会将上面的lambda表达式自动转换为下面这样：

class CompilerGeneratedName {
    public:
        auto operator()(int value) const {
            cout << "The value is " << value << endl; }
};

lambda表达式可以返回值，返回类型在箭头后面指定，称为尾返回类型，看代码：

auto lambda { [](int a, int b) -> { return a + b; } };
int sum = lambda(11, 22);

编译器转成这样：

class CompilerGeneratedName {
    public:
        auto operator()(int a, int b) const { return a + b; }
};

那能捕获变量的lambda表达式是怎么实现的呢？

比如下面的lambda表达式：

double data { 1.234 };
auto lambda { [data]{ cout << "Data = " << data << endl; } }

捕获的变量会变为lambda闭包的数据成员，值捕获的变量被拷贝到仿函数的数据成员中，编译器的行为是这样：

class CompilerGeneratedName
{
    public:
        CompilerGeneratedName(const double& d) : data { d } {}
        auto operator()() const { cout << "Data = " << data << endl; }
    private:
        double data;
};

还有泛型lambda表达式：

auto areEqual { [](const auto& value1, const auto& value2) {
    return value1 == value2; } };

vector values1 { 2, 5, 6, 9, 10, 1, 1 };
vector values2 { 4, 4, 2, 9, 0, 3, 1 };
findMatches(values1, values2, areEqual, printMatch);

编译器会转换成这样：

class CompilerGeneratedName {
    public:
        template <typename T1, typename T2>
        auto operator()(const T1& value1, const T2& value2) const
{ return value1 == value2; }
};

如果findMatches()函数中的参数是其他类型，那么areEqual泛型表达式不需要任何更改就可以直接继续使用。

聊完了编译器怎么实现的lambda表达式，下面介绍下lambda表达式的捕获方式。

捕获方式

有两种方法从闭包作用域捕获所有变量，称为默认捕获：

[=] 值捕获所有变量
[&]引用捕获所有变量
注意：
使用引用方式捕获变量时，必须确保引用在lambda表达式执行期间是合法的。
当使用默认捕获时，通过值(=)或引用(&)，只有那些在lambda 表达式中真正使用的变量才会被捕获，未使用的变量不会被捕获。
不建议使用默认捕获，即使默认捕获只捕获那些在lambda 表达式主体中真正使用的变量，通过使用=默认捕获，可能会意外的导致高代价的拷贝，通过使用&默认捕获，可能意外的在闭包作用域中修改变量，建议明确指定想要捕获哪些变量以及捕获方式。

再注意：全局变量总是通过引用捕获，例如在下面的代码中，默认捕获用于按值捕获所有内容，然而全局变量global其实是通过引用捕获的，在执行lambda 后它的值被更改。

int global { 42 };
int main() {
    auto lambda { [=] { global = 2; } };
    lambda();
    // 这里global是2！
}

不允许像下面这样显式捕获全局变量，这样编译会失败：

auto lambda { [global] { global = 2; } }; // error

所以，建议不要使用全局变量。

对于不捕获任何内容的lambda表达式，编译器自动提供转换运算符，将lambda 表达式转换为函数指针。这样的lambda表达式可作为参数传递给其他函数。

在C++20中关于lambda表达式也做了一些更新，可以模板化lambda表达式，也可以默认构造、拷贝和赋值lambda表达式，像下面这样：

auto lambda { [](int a, int b) { return a + b; } };
decltype(lambda) lambda2; // 默认构造
auto copy { lambda }; // 拷贝构造
copy = lambda2; // 拷贝赋值

这不是本文的主题，就不过多介绍了。

关于lambda表达式的内容，打完收工！