开源 Serverless 框架 Laf 性能优化实践-526互联

介绍

Laf 是一个完全开源的 Serverless 框架，Laf 的 Node.js 运行时容器 (以下简称为 Runtime) 是 Laf 的函数执行环境，依托于 Express.js 框架。采用容器进程常驻的方式，每一个应用对应于一个或多个容器 (弹性伸缩下)，底层使用了 Node.js 的 vm 模块，使用 MongoDB 的 watch() 方法来监听函数变更事件，以实现函数发布和配置发布。

Node.js vm 模块

Node.js 的 vm 模块是一个提供虚拟机功能的模块，用于在 Node.js 环境中创建一个独立的 JavaScript 执行环境。它允许在应用程序中运行和控制一段 JavaScript 代码，同时提供了一些安全性和隔离性。

这个模块包括一些可用于创建隔离的执行环境的函数，使得代码能够在独立的上下文中运行，防止对主应用程序的影响。这在某些情况下可以提供更高的安全性，例如在沙盒环境中执行用户提供的代码，或者实现一些动态加载和执行代码的需求。

原文链接：https://forum.laf.run/d/1146

为什么要优化

目前 Laf 的函数运行时存在以下问题：

频繁使用 Node.js vm 模块重复创建 vm，vm 创建执行的过程中，CPU 消耗很高。在以下对 runtime 的 CPU 火焰图分析可见，在函数执行过程中，有两部分 CPU 执行时间较长，分别是输出函数请求日志和 vm 创建执行过程。

有时候遇到复杂的函数嵌套引用的时候，会导致循环引用，内存迟迟无法回收，造成内存泄漏，导致 OOM Killed。
交由 runtime 自己通过 HTTP 调用的形式，异步请求持久化函数日志，性能损耗大，QPS 直接减半。
函数引擎这块的逻辑越来越复杂和臃肿，维护难度很大，急需重构。

如何优化

在前面的分析中，我们知道，当前造成性能瓶颈的原因主要有两点：

为了实现隔离，vm 模块重复创建，CPU 消耗高，特别是当函数引用达到一定规模时。另一方面，复杂的引用下，甚至会发生内存难以回收造成内存泄漏的问题。
频繁打印函数请求日志，依赖单线程的 Node.js 通过异步请求处理 console.log 等日志，导致实际业务请求吞吐量下降。

因此，我们采用以下优化思路：

日志方面：使用标准输出的形式输出日志，交由 K8s 自己采集日志，而不由 runtime 自己处理。
函数引擎方面：第一次函数调用时，构建并缓存函数模块，下次调用直接取出使用，不需要重复编译，这块更改需要确保以下因素：
1. 保证这个缓存的函数模块是无状态，即 y = f(x)，输入相同的 x，则必然输出确定的 y。
2. 函数发布时，要及时清理缓存的函数模块。

优化前后架构对比分析

优化前：

优化后：

优化步骤

改造日志方案为容器日志标准输出，交由 K8s 收集，完全去除日志的有状态依赖。
重构函数引擎，建立函数模块，每一个函数模块的导出都是一个 JS 对象，无论是代码还是引用的第三方包，都被视作为一个 Module，在代码中只会存在一份，等同于原生的 require / export：
1. 简化代码，尽可能复用，保留核心逻辑；
2. 去除函数模块中的有状态部分；
3. 在函数执行、函数引入处建立函数模块缓存。
针对调试模式，每次函数执行时重新构建函数模块，主动收集执行日志。

核心函数调用逻辑

const vm = require('vm')

// 函数列表
const functionList = {
    a: "const b = require('b'); const func = () => b(); module.exports = func",
    b: "module.exports = () => 'hello world'"
}

// 函数模块缓存
const functionModuleCache = new Map()

// 构建函数模块
const buildFunctionModule = (name) => {
    // 自定义 require 逻辑，用来加载函数
    const customRequire = (specifier) => {
        if (functionModuleCache.has(specifier)) {
            return functionModuleCache.get(specifier)
        }
        if(functionList[specifier]) {
            return buildFunctionModule(specifier)
        }
        return require(specifier)
    }
    
    // 全局上下文
    const ctx = {
        __require: customRequire,
        module: {
            exports: {},
        }
    }

    // 重新定义 require
    const wrapCode = code => {
        return `
        const require = (name) => {
            return __require(name)
        }

        ${code}
        module.exports;
        `
    }
    
    // 构建模块
    const script = new vm.Script(wrapCode(functionList[name]))
    const mod = script.runInNewContext(ctx)
    // 缓存构建结果
    functionModuleCache.set(name, mod)
    return mod
}

// 简单写一个入口函数
const main = () => {
    const func = buildFunctionModule('a')
    const res = func()
    console.log(res)
}

main()