欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

浅析node.js的模块加载机制

程序员文章站 2022-06-05 08:06:03
在node.js中,模块使用commonjs规范,一个文件是一个模块 node.js中的模块可分为三类 内部模块 - node.js提供的模块如 fs,http...

在node.js中,模块使用commonjs规范,一个文件是一个模块

node.js中的模块可分为三类

  1. 内部模块 - node.js提供的模块如 fs,http,path等
  2. 自定模块 - 我们自己写的模块
  3. 第三方模块 - 通过npm安装的模块

node.js提供了大量的模块供我们使用,比如 想解析一个文件的路径,可以使用path模块下的相应方法实现:

const path = require('path');
//返回目标文件的绝对路径
console.log(path.resolve('./1.txt'));

运行结果:

/users/cuiyue/workspace/test/1.txt

使用require引入相应的模块,即可使用。

__dirname和__filename

node.js的每个模块都有这两个参数,它们都是一个绝对路径的地址,区别是__filename存放了从根目录到当前文件名的路径,__dirname只存放从根目录到模块的所在目录:

console.log(__dirname);
console.log(__filename);

运行结果:

/users/cuiyue/workspace/test
/users/cuiyue/workspace/test/module.js

vm模块

vm模块是node.js提供在v8虚拟机中编译和运行的工具,node.js中的模块内部实现就是通过此模块完成。

说说vm的基本用法。

在js环境中有一个eval函数,它可以运行js的代码字符串,比如:

eval('console.log("hello javascript.")'); //输出hello javascript.

可以看到,eval函数的参数是一段字符串,它可以运行字符串形式的js代码,但它可以使用上下文环境中的变量:

var num=100;
eval('console.log(num)'); //输出100

以上是可以正确访问num的值。

vm模块提供了方法创建一个安全的沙箱,在指定的上下文环境中运行代码,不受外界干扰。

const vm = require('vm');
var num = 100;
vm.runinthiscontext('console.log(num)');

运行结果:

console.log(num)
            ^
referenceerror: num is not defined

可以看到代码报错了,说明在vm创建了指定的上下文环境中,拿不到外界的参量。

commonjs规范

在以前,由于javascript的历史原因导致它的模块机制很差,由于这些缺点使得javascript不太善于开发大型应用,于是提出了commonjs规范以弥补javascript的不足。

commonjs规范主要分为三块内容:模块导入导出、模块定义、模块标识。

模块导入导出

commonjs中使用require()函数进行模块的引入。

const mymodule = require('mymodule');

使用exports导出模块

module.exports = {
  name: 'tom'
};

引用的名称可以不带路径,若不带路径表示引入的是node提供的模块或是npm安装的第三方模块(node_modules)

模块定义

module对象:在每一个模块中,module对象代表该模块自身。

export属性:module对象的一个属性,它向外提供接口。

模块标识

模块标识指的是传递给require方法的参数,必须是符合小驼峰命名的字符串,或者以 .、..、开头的相对路径,或者绝对路径。

node中模块解析流程

  1. 首先接收参数,把传入的模块名称解析成绝对路径
  2. 若没有后缀名称,依次拼接.js .json .node尝试加载,仍到不到模块则报错
  3. 取得正确的路径后判断缓存中是否存在此模块,若有则取出
  4. 若缓存中不存在则加载此文件,在外包裹一层闭包并执行它

以上为大致流程,下面尝试着写一下模块。

代码的基本结构:

/**
 * module类,用于处理模块加载
 */
function module() {}

//模块的缓存
module._cachemodule = {};

//不同扩展名的加载策略
module._extensions = {};

//根据moduleid解析绝对路径,
module._resolvefilename = function(moduleid) {};

//入口函数
function req(moduleid) {}

附上全部代码:

const path = require('path');
const fs = require('fs');
const vm = require('vm');

/**
 * module类,用于处理模块加载
 */
function module(file) {
 this.id = file; //当前模块的id,它使用完整的绝对路径标识,因此是唯一的
 this.exports = {}; //导出
 this.loaded = false; //模块是否已加载完毕
}

//模块的缓存
module._cachemodule = {};

module._wrapper = ['(function(exports,require,module,__dirname,__filename){', '});'];

//不同扩展名的加载策略
module._extensions = {
 '.js': function(currentmodule) {
  let js = fs.readfilesync(currentmodule.id, 'utf8'); //读取出js文件内容
  let fn = module._wrapper[0] + js + module._wrapper[1];
  vm.runinthiscontext(fn).call(
   currentmodule.exports,
   currentmodule.exports,
   req,
   currentmodule,
   path.dirname(currentmodule.id),
   currentmodule.id);
  return currentmodule.exports;
 },
 '.json': function(currentmodule) {
  let json = fs.readfilesync(currentmodule.id, 'utf8');
  return json.parse(json); //转换为json对象返回
 },
 '.node': ''
};

//加载模块(实例方法)
module.prototype.load = function(file) {
 let extname = path.extname(file); //获取后缀名
 return module._extensions[extname](this);
};

//根据moduleid解析绝对路径,
module._resolvefilename = function(moduleid) {
 let p = path.resolve(moduleid);

 if (!path.extname(moduleid)) { //传入的模块没有后缀
  let arr = object.keys(module._extensions);

  //循环读取不同扩展名的文件
  for (var i = 0; i < arr.length; i++) {
   let file = p + arr[i]; //拼接上后缀名成为一个完整的路径
   try {
    fs.accesssync(file);
    return file; //若此文件存在返回它
   } catch (e) {
    console.log(e);
   }
  }
 } else {
  return p;
 }
};

function req(moduleid) {
 let file = module._resolvefilename(moduleid);

 if (module._cachemodule[file]) { //若缓存中存在此模块
  return module._cachemodule[file];
 } else {
  let module = new module(file);
  module.exports = module.load(file);
  return module.exports;
 }
}

console.log(req('./a.js')());

a.js的文件内容:

module.exports = function() {
 console.log('this message from a.js');
 console.log(__dirname);
 console.log(__filename);
}

最终运行结果:

this message from a.js
/users/cuiyue/workspace/test
/users/cuiyue/workspace/test/a.js

重要代码说明

_resolvefilename

_resolvefilename方法的主要作用是把传入的模块解析成绝对路径,这样才可以进行下一步,根据完整的路径加载模块。

因此要进行判断,如果传入的模块不存在,则要报错;如果传入的模块已经有扩展名了,就不要拼接了;若没有扩展名,依次以.js .json .node的顺序拼接成完成的模块进行加载。

_extensions

此对象中封装了加载不同类型模块的处理方法,其中若是.json类型则使用fs读取文件直接转换成json对象并返回。

若是.js文件则读取后,拼接闭包,将exports,require,module,__dirname,__filename五大参数拼接好,使用vm模块的沙箱机制运行,得到的结果放入module.exports返回。

总结

以上就是node.js的模块加载的简单逻辑,实际上node.js的源码远远比上面的代码复杂,光是处理模块路径、判断合法等操作就写了n行。而且我这里没有写缓存以及其它的复杂逻辑,但核心差不多就是这些,核心的核心就是用fs.readfilesync读取js文件,把内容拼接到一个大大的闭包中,这也解释了为什么我们自己写的所有node模块中都会有require方法,exports导出,以及__dirname和__filename参数。

了解了node.js的模块加载逻辑,在以后写node.js就更可避免一些误解,写出精细的代码。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。