RequireJS最简实现
liu1084
8年前
<p>网上有不少解析RequireJS源码的文章,我觉得意义不大。阅读源代码的目的不是为了熟悉代码,而是为了学习核心实现原理。相对RequireJS的源码, kitty.js 的实现更简单,更容易理解。本文正是抄了kitty.js的实现,是一个更精简的RequireJS,用于理解RequireJS的实现原理。</p> <p>github dummy-requirejs 。这个实现仅支持核心feature:</p> <pre> <code class="language-javascript">require(deps, callback) // deps 是依赖数组 define(id, deps, factory) // factory是一个函数</code></pre> <p>例子参考git中rect.js/main.js。</p> <p>从实现来看,require/define是基本一致的,require的callback等同于define的factory:都会要求deps被加载且被执行,获得deps的exports作为整个module传入callback/factory。不同的是,factory的返回值会被作为define出来的模块的export,可被视为模块本身;而callback返回值被忽略。</p> <p>从用法来看,define仅是定义了模块,这个模块可能被作为deps被其他模块依赖,但define传入的factory此时是不执行的;而require则会触发各个模块的factory执行。</p> <h2>实现</h2> <p>主要实现分为3部分内容,其中关键的地方在于模块载入。</p> <h3>数据结构</h3> <p>既然是模块加载器,并且需要处理模块之间的依赖问题,所以设置一个哈希表保存所有的模块。</p> <pre> <code class="language-javascript">var mods = {} // <id, Module> function Module(id) { var mod = this mod.id = id mod.uri = id // 简单起见,根据id拼出uri: abc.js mod.deps = [] // 依赖的模块id列表 mod.factory = blank // 定义模块时的factory mod.callback = blank // 模块加载完毕后回调 mod.exports = {} // 模块导出的对象 }</code></pre> <p>define的实现就比较简单,主要就是往mods里添加一个Module对象,简单来说就是:</p> <pre> <code class="language-javascript">function define(id, deps, factory) { var mod = getModule(id) // mods存在就返回,否则就往mods里新增 mod.deps = deps mod.factory = factory }</code></pre> <h3>模块载入</h3> <p>遇到require时就会产生模块载入的动作。模块载入时可能发生以下动作:</p> <ul> <li>往页面添加script标签以让浏览器从服务端拉取js文件</li> <li>js文件中可能遇到define从而立即添加模块 (非AMD模块不考虑)</li> <li>define定义的模块可能有其他依赖模块,递归载入这些模块,直到所有模块载入完毕</li> </ul> <p>这里的模块载入只是把模块js文件载入到浏览器环境中。以上过程对应的大概代码为:</p> <pre> <code class="language-javascript">Module.prototype.load = function() { var mod = this if (mod.status == STATUS.FETCHING) return if (mod.status == STATUS.UNFETCH) { return mod.fetch() // 添加script标签从服务端拉取文件 } mod.status = STATUS.LOADING mod.remain = mod.deps.length // 所有依赖载入完毕后通知回调 function callback() { mod.remain-- if (mod.remain === 0) { mod.onload() // 通知回调 } } each(mod.deps, function (dep) { var m = getModule(dep) // 获取依赖模块对象,依赖模块可能已经被载入也可能没有 if (m.status >= STATUS.LOADED || m.status == STATUS.LOADING) { // 已经载入 mod.remain-- return } m.listeners.push(callback) if (m.status < STATUS.LOADING) { m.load() } }) if (mod.remain == 0) { mod.onload() } }</code></pre> <p>load的实现由于混合了异步问题,所以理解起来会有点难。fetch的实现就是一般的往页面添加script及设置回调的过程。在fetch完毕后会重新调用load以完成递归载入该模块的依赖:</p> <pre> <code class="language-javascript">// 该函数回调时,该js文件已经被浏览器执行,其内容包含define则会添加模块(当然已经被添加过了) // 可以回头看上面的define调用的是getModule,此时会重新设置deps/factory等属性 function onloadListener() { var readyState = script.readyState; if (typeof readyState === 'undefined' || /^(loaded|complete)$/.test(readyState)) { mod.status = STATUS.FETCHED mod.load() } }</code></pre> <h3>模块生效</h3> <p>模块载入后模块其实还没生效,还无法使用模块中定义的各种符号。要让模块生效,就得执行模块定义的factory函数。在直接间接依赖的模块被全部载入完成后,最终回调到我们的callback。此时可以看看require的实现:</p> <pre> <code class="language-javascript">// 前面提到require/define实现类似,所以这里创建了Module对象,只是复用代码 function require(deps, callback) { var mod = new Module(getId()) mod.deps = deps mod.factory = callback mod.callback = function () { mod.exec() } mod.status = STATUS.FETCHED mod.load() }</code></pre> <p>就是简单地调用了load,完成后调用了exec。exec又是一个涉及到递归的函数,它会递归执行所有模块的factory。factory的执行需要各个模块的exports对象,只有模块exec后才会得到exports对象。</p> <pre> <code class="language-javascript">Module.prototype.exec = function() { var mod = this if (mod.status >= STATUS.EXECUTED) { return mod.exports } // 获取依赖模块的exports列表 var args = mod.getDepsExport() var ret = mod.factory.apply(null, args) // factory 返回值作为该模块的exports mod.exports = ret mod.status = STATUS.EXECUTED return mod.exports }</code></pre> <p>上面的代码主要是实现这样的功能:</p> <pre> <code class="language-javascript">// 将依赖[d1, d2]的exports作为参数d1,d2传入 define('my-module', ['d1', 'd2'], function (d1, d2) { return {func: function() {}} })</code></pre> <p>getDepsExport就是一个取依赖模块exports的过程:</p> <pre> <code class="language-javascript">Module.prototype.getDepsExport = function() { var mod = this var exports = [] var deps = mod.deps var argsLen = mod.factory.length < deps.length ? mod.factory.length : deps.length for (var i = 0; i < argsLen; i++) { exports.push(mod.require(deps[i])) } return exports }</code></pre> <p>Module.require(id)用于exec目标模块并返回其exports:</p> <pre> <code class="language-javascript">Module.prototype.require = function(dep) { // 由于之前已经递归载入过所有模块,所以该依赖模块必然是已经存在的,可以被exec的 var mod = getModule(dep) return mod.exec() }</code></pre> <p>于是又回到了exec,实现了递归执行所有依赖模块的功能。exec主要是获取依赖模块exports并调用factory,所以最初的require将用户的callback作为factory传入那个临时Module,最终使得调用到用户的callback。</p> <p>通过以上过程,实际上就已经走通了从define到require实现的整个过程。整个代码不到200行。基于此可以添加更多RequireJS的附加功能。完。</p> <p> </p> <p> </p> <p>来自:http://www.udpwork.com/item/16088.html</p> <p> </p>