# 模块

# 模块风格

一些广为使用的模块格式有：

CommonJS
Asynchronous Module Definition（AMD）- RequireJS
Common Module Definition（CMD）- SeaJS
Universal Module Definition（UMD）
ES6 Module

模块化的作用：

解决命名冲突
解决空间污染
按需加载
复用、模块化

# CommonJS

2009 年 Nodejs 发布，其中 Commonjs 是作为 Node 中模块化规范以及原生模块面世的。基本上 Commonjs 发布之后，就成了 Node 里面标准的模块化管理工具。同时 Node 还推出了 npm 包管理工具，npm 平台上的包均满足 Commonjs 规范。

# 使用

module.exports
require

CommonJS 还可以细分为 CommonJSl 和 CommonJS2，区别在于 CommonJSl 只能通过 exports.XX = XX 的方式导出，而 CommonJS2 在 CommonJSl 的基础上加入了 module.exports = XX 的导出方式。 CommonJS 通常指 CommonJS2。

module.exports 属性表示当前模块对外输出的接口，其他文件加载该模块，实际上就是读取 module.exports 变量。node 为每一个模块提供了一个 exports 变量(可以说是一个对象)，指向 module.exports。这相当于每个模块中都有一句这样的命令 var exports = module.exports。既然两个不好区分，那就放弃 exports, 只用 module.exports 就好。

Module 对象

module.id 模块的识别符，通常是带有绝对路径的模块文件名。
module.filename 模块的文件名，带有绝对路径。
module.loaded 返回一个布尔值，表示模块是否已经完成加载。
module.parent 返回一个对象，表示调用该模块的模块。
module.children 返回一个数组，表示该模块要用到的其他模块。
module.exports 表示模块对外输出的值。

# 特点

由于使用了 Node 的 api，只能在服务端环境上运行
模块编译本质上是沙箱编译，其内部代码运行无法访问当前执行上下文。但可以访问 global。
原生 Module 对象，每个文件都是一个 Module 实例，所有代码都运行带模块作用域、不会污染全局作用域。
CommonJS 模块输出的是一个值的拷贝，ES6 模块输出的是值的引用。CommonJS 模块输出的是值的拷贝，也就是说，一旦输出一个值，模块内部的变化就影响不到这个值。
使用 require 来导入一个模块，用 module.exports 来导出一个模块。通过 require 导入一个模块时，拿到的是导出模块 module.exports 对象的引用（值拷贝，浅拷贝，栈地址）。若给module.exports赋值一个新对象，那么就会破坏引用。
所有文件加载均是运行时、同步加载，模块加载的顺序是按照其在代码中出现的顺序，在 require 的时候才去加载模块文件，加载完再接着执行。
每个模块加载一次之后就会被缓存。
CommonJS 模块是运行时加载，ES6 模块是编译时输出接口。

# 优点

强大的查找模块功能，开发十分方便
标准化的输入输出，非常统一
每个文件引入自己的依赖，最终形成文件依赖树
模块缓存机制，提高编译效率
利用 node 实现文件同步读取
依靠注入变量的沙箱编译实现模块化

沙箱编译

require 进来的 js 模块会被 Module 模块注入一些变量，使用立即执行函数编译，看起来就好像：

(function (exports, require, module, __filename, __dirname) {
    //原始文件内容
})();

1
2
3

Node 内部提供一个 Module 构建函数。所有模块都是 Module 的实例。

require 查找文件的过程

先尝试在 cache 中查找；若没有找到，根据解析路径，查找 node_modules 文件下包的 package.json 中的 main 字段，确定文件入口；还是未找到，则逐级向上查找，一直到根目录，若有路径标识参数，会进入文件夹中查找。

通过 require 导入一个模块时，拿到的是导出模块 module.exports 对象的引用（值拷贝，浅拷贝，栈地址）。若给module.exports赋值一个新对象，那么就会破坏引用。

CommonJS 的缺点在于: 这样的代码无法直接运行在浏览器环境下，必须通过工具转换成标准的 ES5。

# AMD

Commonjs 的诞生给 js 模块化发展有了重要的启发，Commonjs 非常受欢迎，但是局限性很明显：

Commonjs 基于 Node 原生 api 在服务端可以实现模块同步加载，但是仅仅局限于服务端，客户端如果同步加载依赖的话时间消耗非常大，所以需要一个在客户端上基于 Commonjs但是对于加载模块做改进的方案，于是 AMD 规范诞生了。

AMD(Asynchronous Module Definition) 异步模块定义。它采用异步方式加载模块，模块的加载不影响它后面语句的运行。所有依赖这个模块的语句，都定义在一个回调函数中，等到所有依赖加载完成之后（前置依赖），这个回调函数才会运行。它大大的利用了浏览器的并发请求能力，让模块的依赖过程的阻塞变得更少了。requireJs 就是 AMD 模块化规范的实现。

CommonJS 规范加载模块是同步的，也就是说，只有加载完成，才能执行后面的操作。AMD 规范则是非同步加载模块，允许指定回调函数。由于 Node.js 主要用于服务器编程，模块文件一般都已经存在于本地硬盘，所以加载起来比较快，不用考虑非同步加载的方式，所以 CommonJS 规范比较适用。但是，如果是浏览器环境，要从服务器端加载模块，这时就必须采用非同步模式，因此浏览器端一般采用 AMD 规范。

# 使用

模块功能主要的几个命令：define、require、return 和 define.amd。

使用 define 来定义模块，return 来输出接口， require 来加载模块，这是 AMD 官方推荐用法。

define(id?, dependencies?, factory);
require([module], callback);

AMD 模块运行在浏览器环境下，它使用 define 函数来定义模块。不同于CommonJS，它要求两个参数：

require([module], callback);

第一个参数[module]，是一个数组，里面的成员就是要加载的模块；第二个参数callback，则是加载成功之后的回调函数。如果将前面的代码改写成AMD形式，就是下面这样：

define(['dep1', 'dep2'], function (dep1, dep2) {
    return function () {};
});

1
2
3

不同于 Commonjs，在定义模块的时候需要使用 define 函数定义：

define(id?, dependencies?, factory);

define 方法与 require 类似，id 是定义模块的名字，仍然会在所有依赖加载完毕之后执行 factory。

# RequireJs

RequireJs 是 js 模块化的工具框架，是 AMD 规范的具体实现。RequireJs 有两个最鲜明的特点：

依赖前置：动态创建 <script> 引入依赖，在 <script> 标签的 onload 事件监听文件加载完毕；一个模块的回调函数必须得等到所有依赖都加载完毕之后，才可执行，类似 Promise.all。
配置文件：有一个 main 文件，配置不同模块的路径，以及 shim 不满足 AMD 规范的 js 文件。

# 优点

动态并行加载 js，依赖前置，无需再考虑 js 加载顺序问题。
核心还是注入变量的沙箱编译，解决模块化问题。
规范化输入输出，使用起来方便。
对于不满足 AMD 规范的文件可以很好地兼容。

# CMD

同样是受到 Commonjs 的启发，国内（阿里）诞生了一个 CMD（Common Module Definition）规范。该规范借鉴了 Commonjs 的规范与 AMD 规范，在两者基础上做了改进。一个文件就是一个模块，可以像 Node.js 一般书写模块代码。主要在浏览器中运行，当然也可以在 Node.js 中运行。现在 CMD 已经凉了。

# 特点

与 AMD 相比非常类似，CMD 规范（2011）具有以下特点：

define 定义模块，require 加载模块，exports 暴露变量。
不同于 AMD 的依赖前置，CMD 推崇依赖就近（需要的时候再加载）
推崇 api 功能单一，一个模块干一件事。

# SeaJS

SeaJs 是 CMD 规范的实现，跟 RequireJs 类似，CMD 也是 SeaJs 推广过程中诞生的规范。CMD 借鉴了很多 AMD 和 Commonjs 优点，同样 SeaJs 也对 AMD 和 Commonjs 做出了很多兼容。

需要配置模块对应的url。
入口文件执行之后，根据文件内的依赖关系整理出依赖树，然后通过插入 <script> 标签加载依赖。
依赖加载完毕之后，执行根factory。
在 factory 中遇到 require，则去执行对应模块的 factory，实现就近依赖。
类似 Commonjs，对所有模块进行缓存（模块的 url 就是 id）。
类似 Commonjs，可以使用相对路径加载模块。
可以向 RequireJs 一样前置依赖，但是推崇就近依赖。
exports 和 return 都可以暴露变量。

AMD vs CMD

AMD 是提前执行， CMD 是延迟执行
CMD 推崇依赖就近，AMD 推崇依赖前置
AMD 的 API 默认是一个当多个用，CMD 的 API 严格区分，推崇职责单一

# UMD

UMD(Universal Module Definition)通用模块定义模式，该模式主要用来解决 CommonJS 模式和 AMD 模式代码不能通用的问题，并同时还支持老式的全局变量规范。它可以通过运行时或者编译时让同一个代码模块在使用 CommonJs、CMD 甚至是 AMD 的项目中运行。未来同一个 JavaScript 包运行在浏览器端、服务区端甚至是 APP 端都只需要遵守同一个写法就行了。它没有自己专有的规范，是集结了 CommonJs、CMD、AMD 的规范于一身。它或许不是未来最好的模块化方式，未来在 ES6+、TypeScript、Dart 这些拥有高级语法的语言回代替这些方案。

# ES Modules

ES modules（ESM）是 JavaScript 官方的标准化模块系统。

它因为是标准，所以未来很多浏览器会支持，可以很方便的在浏览器中使用。(浏览器默认加载不能省略.js)
它同时兼容在 node 环境下运行。
模块的导入导出，通过 import 和 export 来确定，import 命令会被 JavaScript 引擎静态分析，优先于模块内的其他内容执行，即 import 优先执行；export 命令会有变量声明提前的效果，即 export 变量声明提升。
可以和 Commonjs 模块混合使用。
ES modules 输出的是值的引用，输出接口动态绑定，而 CommonJS 输出的是值的拷贝（浅拷贝，引用类型会影响），一旦输出一个值，模块内部的变化就影响不到这个值。
- 因为 CommonJS 加载的是一个对象（即 module.exports 属性），该对象只有在脚本运行完才会生成。而 ES6 模块不是对象，它的对外接口只是一种静态定义，在代码静态解析阶段就会生成。
ES modules 模块编译时执行（静态编译），跟 require.js 的执行结果是一致的，也就是将需要使用的模块先加载完再执行代码。而 CommonJS 模块总是在运行时加载。
无论是 ES6 模块还是 CommonJS 模块，当你重复引入某个相同的模块时，模块只会执行一次。

CommonJS 模块输出的是值的拷贝，也就是说，一旦输出一个值，模块内部的变化就影响不到这个值。举个例子：

// 输出模块 counter.js
var counter = 3;
function incCounter() {
  counter++;
}
module.exports = {
    counter: counter,
    incCounter: incCounter,
};

// 引入模块 main.js
var mod = require('./counter');

console.log(mod.counter);  // 3
mod.incCounter();
console.log(mod.counter); // 3

// counter.js 模块加载以后，它的内部变化就影响不到输出的 mod.counter 了。
// 这是因为 mod.counter 是一个原始类型的值，会被缓存。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19

但是如果修改 counter 为一个引用类型的话：

// 输出模块 counter.js
var counter = {
    value: 3
};

function incCounter() {
    counter.value++;
}
module.exports = {
    counter: counter,
    incCounter: incCounter,
};

// 引入模块 main.js
var mod = require('./counter.js');

console.log(mod.counter.value); // 3
mod.incCounter();
console.log(mod.counter.value); // 4

// value 是会发生改变的。不过也可以说这是 "值的拷贝"，只是对于引用类型而言，值指的其实是引用。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21

而如果我们将这个例子改成 ES6:

// counter.js
export let counter = 3;
export function incCounter() {
  counter++;
}

// main.js
import { counter, incCounter } from './counter';
console.log(counter); // 3
incCounter();
console.log(counter); // 4

1
2
3
4
5
6
7
8
9
10
11

ES6 模块的运行机制与 CommonJS 不一样。JS 引擎对脚本静态分析的时候，遇到模块加载命令 import，就会生成一个只读引用。等到脚本真正执行时，再根据这个只读引用，到被加载的那个模块里面去取值。换句话说，ES6 的 import 有点像 Unix 系统的“符号连接”，原始值变了，import 加载的值也会跟着变。因此，ES6 模块是动态引用，并且不会缓存值，模块里面的变量绑定其所在的模块。

# ESM 在浏览器的使用

借助 babel
借助打包工具，例如 webpack

Babel 是怎么编译 import 和 export 语法：

// ES6
var firstName = 'Michael';
var lastName = 'Jackson';
var year = 1958;

export {firstName, lastName, year};

// Babel 编译后
'use strict';

Object.defineProperty(exports, "__esModule", {
  value: true
});
var firstName = 'Michael';
var lastName = 'Jackson';
var year = 1958;

exports.firstName = firstName;
exports.lastName = lastName;
exports.year = year;

// 再看 import 的编译结果：

// ES6
import {firstName, lastName, year} from './profile';
// Babel 编译后
'use strict';

var _profile = require('./profile');

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29

Babel 只是把 ES6 模块语法转为 CommonJS 模块语法，然而浏览器是不支持这种模块语法的，所以直接跑在浏览器会报错的，如果想要在浏览器中运行，还是需要使用打包工具将代码打包。

什么浏览器中不支持 CommonJS 语法呢？因为浏览器环境中并没有 module、 exports、 require 等环境变量。

换句话说，webpack 打包后的文件之所以在浏览器中能运行，就是靠模拟了这些变量的行为 - 运行时依赖。

例如，有这么一个模块：

// square.js
console.log('加载了 square 模块')

var multiply = require('./multiply.js');


var square = function(num) {　
    return multiply.multiply(num, num);
};

module.exports.square = square;

1
2
3
4
5
6
7
8
9
10
11

webpack 会将其包裹一层，注入这些变量：

function(module, exports, require) {
    console.log('加载了 square 模块');

    var multiply = require("./multiply");
    module.exports = {
        square: function(num) {
            return multiply.multiply(num, num);
        }
    };
}

1
2
3
4
5
6
7
8
9
10

那 webpack 又会将 CommonJS 项目的代码打包成什么样呢？

// 自执行函数
(function(modules) {

    // 用于储存已经加载过的模块
    var installedModules = {};

    function require(moduleName) {

        if (installedModules[moduleName]) {
            return installedModules[moduleName].exports;
        }

        var module = installedModules[moduleName] = {
            exports: {}
        };

        modules[moduleName](module, module.exports, require);

        return module.exports;
    }

    // 加载主模块
    return require("main");

})({
    "main": function(module, exports, require) {

        var addModule = require("./add");
        console.log(addModule.add(1, 1))

        var squareModule = require("./square");
        console.log(squareModule.square(3));

    },
    "./add": function(module, exports, require) {
        console.log('加载了 add 模块');

        module.exports = {
            add: function(x, y) {
                return x + y;
            }
        };
    },
    "./square": function(module, exports, require) {
        console.log('加载了 square 模块');

        var multiply = require("./multiply");
        module.exports = {
            square: function(num) {
                return multiply.multiply(num, num);
            }
        };
    },

    "./multiply": function(module, exports, require) {
        console.log('加载了 multiply 模块');

        module.exports = {
            multiply: function(x, y) {
                return x * y;
            }
        };
    }
})

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64

require.ensure 的出现是 webpack 的产物：

它是因为浏览器需要一种异步的机制可以用来异步加载模块，从而减少初始的加载文件的体积，所以如果在服务端的话 require.ensure 就无用武之地了，因为服务端不存在异步加载模块的情况，模块同步进行加载就可以满足使用场景了。 CommonJS 模块可以在运行时确认模块加载。

Tree shaking 就是得益 ES modules 的发展的产物：

ES Modules 之所以能 Tree-shaking 主要为以下四个原因（摘自尤雨溪在知乎的回答）:

import 只能作为模块顶层的语句出现，不能出现在 function 里面或是 if 里面。
import 的模块名只能是字符串常量。
不管 import 的语句出现的位置在哪里，在模块初始化的时候所有的 import 都必须已经导入完成。
import binding 是 immutable 的，类似 const。比如说你不能 import { a } from ‘./a’ 然后给 a 赋值个其他什么东西。

关于模块化的进一步理解可阅读前端工程化专栏模块化规范，模块编译及运行时等章节。

参考文献

js模块化编程不完全指北 (opens new window)

彻底理清 AMD,CommonJS,CMD,UMD,ES6 (opens new window)

一文搞懂JS模块、模块格式、模块加载器和模块打包器 (opens new window)

前端模块化发展历史 (opens new window)

深入理解 ES6 模块机制 (opens new window)

[译]JavaScript 模块打包方案 (opens new window)

← Proxy 和 Reflect 装饰器 →