【前端知识体系-NodeJS相关】对NodeJS模块机制的理解

程序员文章站 2022-11-07 18:36:53

什么是CommonJS规范？它与NodeJS是什么关系呢？CommonJS 的底层实现原理是什么? ......

1. commonjs模块规范

1.1 模块引用

var math = require('math');

1.2 模块定义

[!note]
上下文提供exports对象用于导出当前模块的方法和变量，并且他是唯一的导出出口

exports实际上是module.exports，而module.exports就是以一个暴露给外部的对象。

exports.some就是给这个对象上添加属性
直接使用 module.exports = {...} 则可以让外部直接获取到这个对象，相当与为exports换了一个引用，如果在这之前使用exports.some会把之前的覆盖

1.3 commonjs 用法

// a.js
module.exports = {
    a: 1
}
// or 
exports.a = 1

// b.js
var module = require('./a.js')
module.a // -> log 1

1.4 原理

var module = require('./a.js')
module.a 
// 这里其实就是包装了一层立即执行函数，这样就不会污染全局变量了，
// 重要的是 module 这里，module 是 node 独有的一个变量
module.exports = {
    a: 1
}
// module 基本实现
var module = {
  id: 'xxxx', // 我总得知道怎么去找到他吧
  exports: {} // exports 就是个空对象
}
// 这个是为什么 exports 和 module.exports 用法相似的原因
var exports = module.exports 
var load = function (module) {
    // 导出的东西
    var a = 1
    module.exports = a
    return module.exports
};
// 然后当我 require 的时候去找到独特的
// id，然后将要使用的东西用立即执行函数包装下，over

2. node的模块实现

在node中引入模块，需要经历3个步骤

路径分析
文件定位
编译执行

在node中，模块分为两类：一类是node提供的模块称为核心模块，一类是用户编写的成为文件模块。

核心模块在编译中编译成了二进制文件。在node进程启动时，部分核心模块就被直接加载入内存。所以这部分核心模块引入时就省了文件定位和编译执行这两个步骤，并且在路径分析中优先判断，它的加载速度是最快的。
文件模块是运行时动态加载。需要完整的路径分析、文件定位、编译执行

2.1 优先从缓存加载

node对引入的模块都回进行缓存，而且缓存的是编译执行后的对象。

不管是核心模块还是文件模块，require()都一律采用缓存优先的方式。

2.2 路径分析和文件定位

2.2.1 模块标识符分析

核心模块
路径形式的文件模块
自定义模块
- node_modules下
- 查找最费时

2.2.2 文件定位

文件拓展名分析
- 如果省略拓展名，回按 .js .node .json的次序依次尝试
- 如果.node .json的话，加上拓展名会加快一点速度
- 同步配合缓存，可大幅缓解单线程中阻塞式调用的缺陷
目录分析和包
- 如果没有文件名，会将index当作默认文件名

2.3 模块编译

.js文件
- 通过fs同步读取后编译执行
.node
- 这是用c/c++编写的拓展文件，通过dlopen()方法加载最后编译生成的文件
.json
- 用json.parse()解析返回结果
其余拓展名
- 当作.js文件处理

[!note]
每一个编译成功的模块都会将其文件路径索引缓存在module._cache对象上，以提高二次引入性能

2.3.1 js模块的编译

[!note]
在编译的过程中，node对获取的js文件进行了头尾包装。这也是每个模块都能访问到 require、exports、module、__filename、__dirname的原因

(funciton(exports, require, module, __filename, __dirname) {
  
  /* 自己写的代码  */

});

这样使得模块文件间都进行了作用域隔离，不用担心变量污染全局。

为moudle.exports赋值，exports对象是通过形参的方式传入，直接赋值形参会改变形参的引用，但并不能改变作用域外的值。

exports = function() {
  // my class
}

var change = function(a) {
  a = 100;
}

var a = 10;
change(a);
console.log(a); // => 10

如果要达到require引入一个类的效果，请赋值给 module.exports对象。这个迂回的方案不改变形参的引用。

2.3.2 c/c++ 模块的编译

node调用process.dlopen()方法进行加载和执行。

实际上 .node模块并不需要编译，因为它是编写c/c++模块之后编译生成的，所以这里只有加载和执行的过程。在执行的过程中，模块exports对象与.node模块产生练习，然后返回给调用者。

3. 核心模块

[!note]
node的核心模块在编译成可执行文件的过程中被编译进了二进制文件。核心模块其实分为c/c++编写的和javascript编写的两部分，其中c/c++文件存放在node项目的src目录下，javascript文件存放在lib目录下。

c/c++拓展模块
模块调用栈
前后端公用模块
模块侧重点

前端瓶颈在于带宽，后端瓶颈在于cpu和内存等资源。前端需要通过网络加载代码，后端则从磁盘加载，二者加载速度不再同一量级上。
node的模块引入几乎都是同步的，但前端模块若是也采用同步方式来引入必会在用户体验上造成很大的问题，即ui初始化实际过长

4. amd规范

asynchronous moudle definition “异步模块定义”, amd需要在声明的时候指定所有的依赖，通过形参传递依赖到模块内容中。

定义如下

define(id?, dependencies, factory);

5. cmd 规范

与amd主要区别在于定于模块与依赖引入部分。

cmd支持动态引入

define(funtion(require, exports, moudle) {
  // the module code goes here
})

上一篇：做为GPU服务器管理员，当其他用户需要执行某个要root权限的命令时，除了告诉他们root密码，还有没有别的办法？

下一篇： MySQL8.0 新特性 Hash Join