在node项目中,require和module.exports使用很是广泛,js模块化带来的效率大大提高。一直很好奇require背后是怎样运行的,最近仔细看了看这部分的源码,而后参考了其余人的文章,还好node中的Module是JavaScript写的能够看懂。javascript
commonJs规范能够说是js模块化中的里程碑,目前npm上面的包基本都支持该规范。在CommonJs中:html
举个🌰:a.jsjava
var aParam = 23; exports.value = aParam; module.exports = { calculate: function(param){ return aParam + param; }, getA: function(){ return aParam; }, value: aParam };
而后入口文件:index.jsnode
var a = require('./a'); console.log(a); // {calculate: [Function], getA: [Function], value: 23} console.log(a.calculate(2)); // 25 console.log(a.value); // 23
ok很简单的小例子,咱们知道了经过require方法能够加载一个js文件,该文件中exports出来的变量会当作文件运行结果。git
如今没有看源码,咱们凭借着使用经验能够梳理一下require和module的特色及实现思路:github
这至关因而一个小项目,需求都列出来了。先不着急本身动手实践,由于缺乏一些条件写不出来,看看大神的代码怎么写的。npm
再看源码以前,官方文档必定要准备好,里面用到了不少原生的api。Module源码在Node项目中,只有一个Module文件,全都包含在里面。该文件也引入了一些其余的依赖。json
// 原生的模块 var NativeModule = require('native_module'); var util = require('util'); // vm沙箱 var runInThisContext = require('vm').runInThisContext; var runInNewContext = require('vm').runInNewContext; var assert = require('assert').ok; var fs = require('fs'); function hasOwnProperty(obj, prop) { return Object.prototype.hasOwnProperty.call(obj, prop); }
文件开头引入了一些要用的工具类和方法,注意这里的文件引入是直接使用require关键字引入的。bootstrap
/** * 大写的Module其实是module的工厂 * @param id 路径 * @param parent 调用者的module对象 * @constructor */ function Module(id, parent) { this.id = id; // 文件验重的表示,字符串形式的绝对路径 this.exports = {}; this.parent = parent; if (parent && parent.children) { parent.children.push(this); } this.filename = null; this.loaded = false; this.children = []; } module.exports = Module; // 初始化一些变量 Module._contextLoad = (+process.env['NODE_MODULE_CONTEXTS'] > 0); Module._cache = {}; Module._pathCache = {}; Module._extensions = {}; // node_module文件夹可能的路径 var modulePaths = []; Module.globalPaths = []; Module.wrapper = NativeModule.wrapper; Module.wrap = NativeModule.wrap; var path = require('path');
而后定义了Module方法,Module是个工厂方法,module是工厂的实例。Module中主要的属性:(被加载的文件这里简称文件)api
而后初始化了一些变量,下面会用到。
/** * 暴露的require方法 * @param path 文件的相对路径或者是自带模块的名字 */ Module.prototype.require = function(path) { return Module._load(path, this); };
require方法其实是调用了Module的私有方法。
/** * 私有的加载文件 * @param request 须要的文件名字或路径 * @param parent 对应文件的父节点 * @param isMain 是不是入口调用 * @private */ Module._load = function(request, parent, isMain) { // 根据路径解析出filename var filename = Module._resolveFilename(request, parent); // 从Module缓存中取出是否有缓存 var cachedModule = Module._cache[filename]; if (cachedModule) { return cachedModule.exports; } // 系统自带模块中是否有该文件 if (NativeModule.exists(filename)) { // 单独对repl模块处理 if (filename == 'repl') { // 编译 var replModule = new Module('repl'); replModule._compile(NativeModule.getSource('repl'), 'repl.js'); NativeModule._cache.repl = replModule; return replModule.exports; } // 其余自带模块 return NativeModule.require(filename); } // 不是自带模块 生成一个实例 var module = new Module(filename, parent); // 若是是主程序入口 则肯定当前位置 if (isMain) { process.mainModule = module; module.id = '.'; } // 缓存实例 Module._cache[filename] = module; // 尝试加载该文件module,若是有错误则回滚该module var hadException = true; try { module.load(filename); hadException = false; } finally { if (hadException) { delete Module._cache[filename]; } } // 暴露 return module.exports; };
_load方法是加载文件的主要流程的方法:
这就是require方法的工做主流程,这里很重要一点:文件被加载过会缓存结果。
该方法中重要的两个步骤:
咱们一个个来看。
/** * 肯定模块的绝对路径(filename) * @param request 文件相对路径 * @param parent 调用者的Module实例 * @returns filename * @private */ Module._resolveFilename = function(request, parent) { // 若是是自带模块 filename 就是 request if (NativeModule.exists(request)) { return request; } // 肯定request可能的路径有哪些 var resolvedModule = Module._resolveLookupPaths(request, parent); var id = resolvedModule[0]; var paths = resolvedModule[1]; var filename = Module._findPath(request, paths); if (!filename) { var err = new Error("Cannot find module '" + request + "'"); err.code = 'MODULE_NOT_FOUND'; throw err; } // 解析后的文件的绝对路径 return filename; };
_resolveFilename处理文件的绝对路径方法,这个方法主要流程:
为何要算出可能的路径呢,由于文件来源不少:相对路径下的文件;系统自带模块;还有多是node_modules中的包。若是是第三种node_modules文件夹位置没法肯定,因此要进行路径测算。
路径测算两个方法:
/** * 查找文件可能的路径 * @param request 文件的相对路径 * @param parent 父节点的Module实例 * @returns [request, paths] [文件的相对路径, 可能的路径(Array)] * @private */ Module._resolveLookupPaths = function(request, parent) { // 自带模块 返回request if (NativeModule.exists(request)) { return [request, []]; } // 判断路径开头 不是相对路径 补充可能的路径(依赖包里的路径) var start = request.substring(0, 2); if (start !== './' && start !== '..') { var paths = modulePaths; if (parent) { if (!parent.paths) parent.paths = []; paths = parent.paths.concat(paths); } return [request, paths]; } // 没有调用者 if (!parent || !parent.id || !parent.filename) { var mainPaths = ['.'].concat(modulePaths); mainPaths = Module._nodeModulePaths('.').concat(mainPaths); return [request, mainPaths]; } // 路径是结尾是不是index var isIndex = /^index\.\w+?$/.test(path.basename(parent.filename)); // 肯定调用者(parent)的绝对路径 var parentIdPath = isIndex ? parent.id : path.dirname(parent.id); var id = path.resolve(parentIdPath, request); if (parentIdPath === '.' && id.indexOf('/') === -1) { id = './' + id; } return [id, [path.dirname(parent.filename)]]; }; /** * 解析出node_modules目录可能的路径 * @param from 当前模块的路径 * @returns [Array] * @private */ Module._nodeModulePaths = function(from) { // 从from解析出绝对路径 from = path.resolve(from); // 根据操做系统不一样兼容处理 解析出可能的路径 var splitRe = process.platform === 'win32' ? /[\/\\]/ : /\//; var paths = []; var parts = from.split(splitRe); /** * 这段比较有意思 * 咱们假设form的绝对路径是: * /Users/aus/Documents/node * 则项目的node_module文件夹路径多是: * /Users/aus/Documents/node/node_modules * /Users/aus/Documents/node_modules * /Users/aus/node_modules * /Users/node_modules * /node_modules */ for (var tip = parts.length - 1; tip >= 0; tip--) { // don't search in .../node_modules/node_modules if (parts[tip] === 'node_modules') continue; var dir = parts.slice(0, tip + 1).concat('node_modules').join(path.sep); paths.push(dir); } return paths; };
这里面如何算出可能的路径:
第二个方法Module._nodeModulePaths则是推测项目中node_modules文件夹的路径。
这块测算路径挺有意思的,值得多看一看。
而后如何在全部可能的路径中找到惟一的结果:
/** * 根据全部可能的路径肯定真实的路径 * @param request 文件的相对路径 * @param paths 可能的路径 * @returns filename 文件的绝对路径 * @private */ Module._findPath = function(request, paths) { var exts = Object.keys(Module._extensions); // 若是是绝对路径,就再也不搜索 if (request.charAt(0) === '/') { paths = ['']; } // 是否有后缀的目录斜杠 var trailingSlash = (request.slice(-1) === '/'); // 若是当前路径已在缓存中,就直接返回缓存 var cacheKey = JSON.stringify({request: request, paths: paths}); if (Module._pathCache[cacheKey]) { return Module._pathCache[cacheKey]; } // For each path for (var i = 0, PL = paths.length; i < PL; i++) { var basePath = path.resolve(paths[i], request); var filename; if (!trailingSlash) { // try to join the request to the path filename = tryFile(basePath); if (!filename && !trailingSlash) { // try it with each of the extensions filename = tryExtensions(basePath, exts); } } // 是不是package.json中的文件 if (!filename) { filename = tryPackage(basePath, exts); } // 是否存在目录名 + index + 后缀名 if (!filename) { // try it with each of the extensions at "index" filename = tryExtensions(path.resolve(basePath, 'index'), exts); } // 找到文件路径了 缓存 if (filename) { Module._pathCache[cacheKey] = filename; return filename; } } // 404 return false; };
精确匹配路径过程则相对简单,就是一个个试:
经过上面的处理咱们能够将一个须要加载的文件绝对路径算出来,下一步只要编译该文件便可。
来到了module.load这个方法
/** * 根据文件路径名 尝试不一样扩展名解析文件 * @param filename 文件路径 */ Module.prototype.load = function(filename) { assert(!this.loaded); this.filename = filename; this.paths = Module._nodeModulePaths(path.dirname(filename)); var extension = path.extname(filename) || '.js'; if (!Module._extensions[extension]) extension = '.js'; Module._extensions[extension](this, filename); // 文件解析完毕 this.loaded = true; }; // Native extension for .js Module._extensions['.js'] = function(module, filename) { var content = fs.readFileSync(filename, 'utf8'); module._compile(stripBOM(content), filename); }; // Native extension for .json Module._extensions['.json'] = function(module, filename) { var content = fs.readFileSync(filename, 'utf8'); try { module.exports = JSON.parse(stripBOM(content)); } catch (err) { err.message = filename + ': ' + err.message; throw err; } }; //Native extension for .node Module._extensions['.node'] = process.dlopen;
找到了文件要根据文件的不一样后缀来处理;
其中js和json文件处理方法仔细看。
/** * 剥离 utf8 编码特有的BOM文件头 * @param content * @returns content 处理后的 */ function stripBOM(content) { // Remove byte order marker. This catches EF BB BF (the UTF-8 BOM) // because the buffer-to-string conversion in `fs.readFileSync()` // translates it to FEFF, the UTF-16 BOM. if (content.charCodeAt(0) === 0xFEFF) { content = content.slice(1); } return content; }
获取到文件,将文件转成二进制流要处理头信息。
为何要处理头信息,看这里。
ok,到这里准备工做作完了要到了真正的编译环节。
/** * 将文件在沙箱里运行 将暴露的变量提取出来 * @param content 文件字节流 * @param filename 文件路径 * @returns {*} * @private */ Module.prototype._compile = function(content, filename) { var self = this; // remove shebang content = content.replace(/^\#\!.*/, ''); function require(path) { return self.require(path); } require.resolve = function(request) { return Module._resolveFilename(request, self); }; Object.defineProperty(require, 'paths', { get: function() { throw new Error('require.paths is removed. Use ' + 'node_modules folders, or the NODE_PATH ' + 'environment variable instead.'); }}); require.main = process.mainModule; // Enable support to add extra extension types require.extensions = Module._extensions; require.registerExtension = function() { throw new Error('require.registerExtension() removed. Use ' + 'require.extensions instead.'); }; require.cache = Module._cache; var dirname = path.dirname(filename); if (Module._contextLoad) { if (self.id !== '.') { debug('load submodule'); // not root module var sandbox = {}; for (var k in global) { sandbox[k] = global[k]; } sandbox.require = require; sandbox.exports = self.exports; sandbox.__filename = filename; sandbox.__dirname = dirname; sandbox.module = self; sandbox.global = sandbox; sandbox.root = root; return runInNewContext(content, sandbox, { filename: filename }); } debug('load root module'); // root module global.require = require; global.exports = self.exports; global.__filename = filename; global.__dirname = dirname; global.module = self; return runInThisContext(content, { filename: filename }); } // create wrapper function var wrapper = Module.wrap(content); var compiledWrapper = runInThisContext(wrapper, { filename: filename }); if (global.v8debug) { if (!resolvedArgv) { // we enter the repl if we're not given a filename argument. if (process.argv[1]) { resolvedArgv = Module._resolveFilename(process.argv[1], null); } else { resolvedArgv = 'repl'; } } // Set breakpoint on module start if (filename === resolvedArgv) { global.v8debug.Debug.setBreakPoint(compiledWrapper, 0, 0); } } var args = [self.exports, require, self, filename, dirname]; return compiledWrapper.apply(self.exports, args); };
这里编译主要是沙箱(沙盒)编译,文件的内容被嵌入到一个闭包盒子中,盒子中的运行结果不会对外部环境产生影响,经过module.exports通讯,好比这样:
(function (exports, require, module, __filename, __dirname) { //原始文件内容 });
这样发现,在js文件里,require和module都是注入的变量,而不是真正的全局变量。经过这样闭包沙盒实现模块化。(这样看起来是否是跟requireJs很像)
最后初始化一下当前模块
// bootstrap main module. Module.runMain = function() { // Load the main module--the command line argument. Module._load(process.argv[1], null, true); // Handle any nextTicks added in the first tick of the program process._tickCallback(); }; /** * 初始化node全局依赖 * @private */ Module._initPaths = function() { var isWindows = process.platform === 'win32'; if (isWindows) { var homeDir = process.env.USERPROFILE; } else { var homeDir = process.env.HOME; } var paths = [path.resolve(process.execPath, '..', '..', 'lib', 'node')]; if (homeDir) { paths.unshift(path.resolve(homeDir, '.node_libraries')); paths.unshift(path.resolve(homeDir, '.node_modules')); } var nodePath = process.env['NODE_PATH']; if (nodePath) { paths = nodePath.split(path.delimiter).concat(paths); } modulePaths = paths; // clone as a read-only copy, for introspection. Module.globalPaths = modulePaths.slice(0); }; // bootstrap repl Module.requireRepl = function() { return Module._load('repl', '.'); }; Module._initPaths(); // backwards compatibility Module.Module = Module;
整理一下Module模块的特色:
require方法调用__load方法加载模块文件
_resolveFilename解析文件的绝对路径
load解析文件
Module._extensions[extension]不一样后缀尝试加载
而后经过源码的阅读,我也注意到了几个以前没有注意到的点:
require方法接受的路径能够是:
最后我对源码进行了中文注释,方法重写排序,须要的github自取。