Javascript模板引擎原理,几行代码的事儿

from:http://www.cnblogs.com/hustskyking/p/principle-of-javascript-template.html

1、前言

什么是模板引擎,说的简单点,就是一个字符串中有几个变量待定。好比:javascript

var tpl = 'Hei, my name is <%name%>, and I\'m <%age%> years old.';

经过模板引擎函数把数据塞进去,php

var data = {    "name": "Barret Lee",    "age": "20"};var result = tplEngine(tpl, data);//Hei, my name is Barret Lee, and I'm 20 years old.

那这玩意儿有什么做用呢?其实他就是一个预处理器(preprocessor),搞php开发的童鞋对Smarty必然是十分熟悉,Smarty是一个php模板引擎,tpl中待处理的字符经过数据匹配而后输出相应的html代码,加之比较给力的缓存技术,其速度和易用性是很是给力的!JS Template也是同样的,咱们的数据库里保存着数以千万计的数据,而每一条数据都是经过同一种方式输入,就拿上面的例子来讲,咱们不可能在数据库里存几千条"Hei, my name...",而是只保存对应的name和age,经过模板输出结果。html

JS模板引擎应该作哪些事情?看看下面一串代码:前端

var tpl = '<% for(var i = 0; i < this.posts.length; i++) {' + 
    'var post = posts[i]; %>' +
    '<% if(!post.expert){ %>' +
        '<span>post is null</span>' +
    '<% } else { %>' +
        '<a href="#"><% post.expert %> at <% post.time %></a>' +
    '<% } %>' +
'<% } %>';

一个基本的模板引擎至少能够保证上面的代码能够正常解析。如送入的数据是:java

var data = {    "posts": [{        "expert": "content 1",        "time": "yesterday"
    },{        "expert": "content 2",        "time": "today"
    },{        "expert": "content 3",        "time": "tomorrow"
    },{        "expert": "",        "time": "eee"
    }]
};

 能够输出:node

<a href="#">content 1 at yesterday</a><a href="#">content 2 at today</a><a href="#">content 3 at tomorrow</a><span>post is null</span>

先戳这个demo看看 git

下面就具体说说这个模板引擎的原理是啥样的。github

 

2、JS模板引擎的实现原理

1.正则抠出要匹配的内容

针对这一串代码,经过正则获取内容正则表达式

var tpl = 'Hei, my name is <%name%>, and I\'m <%age%> years old.';var data = {    "name": "Barret Lee",    "age": "20"};

 最简单的方式就是经过replace函数了:数据库

var result = tpl.replace(/<%([^%>]+)?%>/g, function(s0, s1){    return data[s1];
});

 经过正则替换,咱们很轻松的拿到了result,你能够去试一试,他正式咱们想要的结果。可是这里又有了一个问题,改一下data和tpl,

var tpl = 'Hei, my name is <%name%>, and I\'m <%info.age%> years old.';var data = {    "name": "Barret Lee",    "info": { age": "20"}
};

 再用上面的方式去获取结果,呵呵,不行了吧~ 这里data["info.age"]自己就是undefined,因此咱们须要换一种方式来处理这个问题,那就是将它转换成真正的JS代码。如:

return 'Hei, my name is ' + data.name + ', and I\'m ' + data.info.age' + ' years old.'

 可是接着又有一个问题来了,当咱们的代码中出现for循环和if的时候,上面的转换明显是不起做用的,如:

var tpl = 'Posts: ' + 
          '<% for(var i = 0; i < post.length; i++) {'+
            '<a href="#"><% post[i].expert %></a>' + 
          '<% } %>'

 若是继续采用上面的方式,获得的结果即是:

return 'Posts: ' + 
       for(var i = 0; i < post.length; i++) { +
         '<a href="#">' + post[i].exper + '</a>' +
       }

 这显然不是咱们愿意看到的,稍微观察一下上面的结构,若是能够返回一个这样的结果也挺不错哦:

'Posts: ' 
for(var i = 0; i < post.length; i++) {    '<a href="#">' + post[i].exper + '</a>'}

 可是咱们须要获得的是一个字符串,而不是上面这样零散的片断,所以能够把这些东西装入数组中。

2.装入数组

var r = [];
r.push('Posts: ' );
r.push(for(var i = 0; i < post.length; i++) {);
r.push('<a href="#">');
r.push(post[i].exper);
r.push('</a>');
r.push(});

 有人看到上面的代码就要笑了,第三行和最后一行代码的逻辑明显是不正确的嘛,那肿么办呢?呵呵,很简单,不放进去就好了呗,

var r = [];
r.push('Posts: ' );for(var i = 0; i < post.length; i++) {
    r.push('<a href="#">');
    r.push(post[i].exper);
    r.push('</a>');
}

 这样的逻辑就十分完善了,不存在太多的漏洞,可是这个转化的过程是如何实现的?咱们必须仍是要写一个解析的模板函数出来。

3.分辨js逻辑部分

var r = [];
tpl.replace(/<%([^%>]+)?%>/g, function(s0, s1){    //完蛋了,这里貌似又要回到上面那好笑的逻辑有错误的一步啦... 该怎么处理比较好?});

 完蛋了,这里貌似又要回到上面那好笑的逻辑有错误的一步啦... 该怎么处理比较好?咱们知道,JS给咱们提供了构造函数的“类”,

var fn = new Function("data", 
    "var r = []; for(var i in data){ r.push(data[i]); } return r.join(' ')");
fn({"name": "barretlee", "age": "20"}); // barretlee 20

 知道了这个就好办了,咱们能够把逻辑部分和非逻辑部分的代码连接成一个字符串,而后利用相似fn的函数直接编译代码。而/<%([^%>]+)?%>/g,这一个正则只能把逻辑部分匹配出来,要想把全部的代码都组合到一块儿,必须还得匹配非逻辑部分代码。replace函数虽然很强大,他也能够完成这个任务,可是实现的逻辑比较晦涩,因此咱们换另一种方式来处理。

先看一个简单的例子:

var reg = /<%([^%>]+)?%>/g;var tpl = 'Hei, my name is <%name%>, and I\'m <%age%> years old.';var match = reg.exec(tpl);
console.log(match);

 看到的是:

[    0: "<%name%>",    1: name,
    index: 16,
    input: "Hei, my name is <%name%>, and I'm <%age%> years old."
    length: 2]

 这。。。咱们但是想获得全部的匹配啊,他居然只获取了name而忽略了后面的age,好吧,对正则稍微熟悉点的童鞋必定会知道应该这样处理:

var reg = /<%([^%>]+)?%>/g;while(match = reg.exec(tpl)) {
    console.log(match);
}

 关于正则表达式的内容就不在这里细说了,有兴趣的同窗能够多去了解下match,exec,search等正则的相关函数。这里主要是靠match的index属性来定位遍历位置,而后利用while循环获取全部的内容。

4.引擎函数

因此咱们的引擎函数雏形差很少就出来了:

var tplEngine = function(tpl, data){    var reg = /<%([^%>]+)?%>/g,
            code = 'var r=[];\n',
            cursor = 0;  //主要的做用是定位代码最后一截
    var add = function(line) {
        code += 'r.push("' + line.replace(/"/g, '\\"') + '");\n';
    };    while(match = reg.exec(tpl)) {
        add(tpl.slice(cursor, match.index)); //添加非逻辑部分
        add(match[1]);  //添加逻辑部分 match[0] = "<%" + match[1] + "%>";
        cursor = match.index + match[0].length;
    }

    add(tpl.substr(cursor, tpl.length - cursor)); //代码的最后一截 如:" years old."
    code += 'return r.join("");'; // 返回结果,在这里咱们就拿到了装入数组后的代码    console.log(code);    return tpl;
};

 这样一来,测试一个小demo:

 var tpl = '<% for(var i = 0; i < this.posts.length; i++) {' + 
        'var post = posts[i]; %>' +
        '<% if(!post.expert){ %>' +
            '<span>post is null</span>' +
        '<% } else { %>' +
            '<a href="#"><% post.expert %> at <% post.time %></a>' +
        '<% } %>' +
    '<% } %>';
tplEngine(tpl, data);

 返回的结果让人很满意:

var r=[];
r.push("");
r.push(" for(var i = 0; i < this.posts.length; i++) {var post = posts[i]; ");
r.push("");
r.push(" if(!post.expert){ ");
r.push("<span>post is null</span>");
r.push(" } else { ");
r.push("<a href=\"#\">");
r.push(" post.expert ");
r.push(" at ");
r.push(" post.time ");
r.push("</a>");
r.push(" } ");
r.push("");
r.push(" } ");
r.push("");return r.join("");

 不过咱们并须要for,if,switch等这些东西也push到r数组中去,因此呢,还得改善下上面的代码,若是在line中发现了包含js逻辑的代码,咱们就不该该让他进门:

regOut = /(^( )?(if|for|else|switch|case|break|{|}))(.*)?/g;var add = function(line, js) {
    js? code += line.match(regOut) ? line + '\n' : 'r.push(' + line + ');\n' :
        code += 'r.push("' + line.replace(/"/g, '\\"') + '");\n';
};

 因此咱们只剩下最后一步工做了,把data扔进去!

5.把data扔进去

没有比完成这东西更简单的事情啦,经过上面对Function这个函数的讲解,你们应该也知道怎么作了。

return new Function(code).apply(data);

 使用apply的做用就是让code中的一些变量做用域绑定到data上,否则做用域就会跑到global上,这样获得的数据索引就会出问题啦~ 固然咱们能够再优化一下:

return new Function(code.replace(/[\r\t\n]/g, '')).apply(data);

 把回车换行以及tab键都给匹配掉,让代码更加干净一点。那么最终的代码就是:

var tplEngine = function(tpl, data) {    var reg = /<%([^%>]+)?%>/g, 
        regOut = /(^( )?(if|for|else|switch|case|break|{|}))(.*)?/g, 
        code = 'var r=[];\n', 
        cursor = 0;    var add = function(line, js) {
        js? (code += line.match(regOut) ? line + '\n' : 'r.push(' + line + ');\n') :
            (code += line != '' ? 'r.push("' + line.replace(/"/g, '\\"') + '");\n' : '');        return add;
    }    while(match = reg.exec(tpl)) {
        add(tpl.slice(cursor, match.index))(match[1], true);
        cursor = match.index + match[0].length;
    }
    add(tpl.substr(cursor, tpl.length - cursor));
    code += 'return r.join("");';    return new Function(code.replace(/[\r\t\n]/g, '')).apply(data);
};

 

3、应用场景

毕竟是前端代码,因此写出来是要为前端服务的,平时咱们处理的通常是一个html的模板,一般的状况下,模板代码是放在script标签或者textarea中,因此首先是要获取到这里头的东西,而后再来作解析。

var barretTpl = function(str, data) {    //获取元素
    var element = document.getElementById(str);    if (element) {        //textarea或input则取value,其它状况取innerHTML
        var html = /^(textarea|input)$/i.test(element.nodeName) ? element.value : element.innerHTML;        return tplEngine(html, data);
    } else {        //是模板字符串,则生成一个函数
        //若是直接传入字符串做为模板,则可能变化过多,所以不考虑缓存
        return tplEngine(str, data);
    }    var tplEngine = function(tpl, data) {        // content above    };
};

 

这样一来就更加简单了,使用方式就是 barretTpl(str, data), 这里的str能够是模板代码,也能够是一个DOM元素的id~ 能够看看这两段代码:https://gist.github.com/barretlee/7765698https://gist.github.com/barretlee/7765587

也能够直接戳这个demo

 

4、优化以及功能拓展

总共就三四十行代码,完成的东西确定是一个简洁版的,不过对于一个简单的页面而言,这几行代码已经足够使用了,若是还想对他作优化,能够从这几个方面考虑:

  • 优化获取的模板代码,好比去掉行尾空格等

  • 符号转义,若是咱们想输出<span>hehe</span>相似这样的源代码,在push以前必须进行转义

  • 代码缓存,若是一个模板会常用,能够将它用一个数组缓存在barretTpl闭包内

  • 用户本身设置分隔符

 

5、参考资料

[1] http://tech.pro/tutorial/1743/javascript-template-engine-in-just-20-lines  Krasimir Tsonev 

[2] http://tangram.baidu.com/BaiduTemplate/  JS template

相关文章
相关标签/搜索