JQuery中trim函数的具体实现代码

因为Javascript 1.8.1 以前的版本,没有内置 trim 函数,因此 JQuery 对它有本身的实现。不一样的JQuery版本,trim函数的实现也不尽相同。html

阅读本文须要掌握正则表达式用法,若是不是很了解,建议阅读这个。若是只是想了解一下,建议读我写的 5分钟读懂正则表达式正则表达式

鉴于正则表达式的强大用途(在各类语言如JS,Python,Ruby,Java中都会用到),建议重点学习并掌握。数组

 

JQuery 1.7.2版本浏览器


 

// 截取的部分源码,不是完整语句,旨在说明实现过程
trimLeft = /^\s+/,
trimRight = /\s+$/,

text.toString().replace( trimLeft, "" ).replace( trimRight, "" );

简化后就是ruby

yourstr.replace( /^\s+/, "" ).replace(/\s+$/, "" )
// 正则表达式 /^\s/     匹配以空白字符串开头的字符串
// 正则表达式 /\s+$/   匹配以空白字符串结尾的字符串
//replace参数,左边是查找模式,右边是替换量,返回替换后的字符串

 

JQuery 2.1.1 版本函数


 

var whitespace = "[\\x20\\t\\r\\n\\f]",
    rtrim = new RegExp( "^" + whitespace + "+|((?:^|[^\\\\])(?:\\\\.)*)" + whitespace + "+$", "g" );
//....
trim: function( text ) {
    return text == null ?
        "" :
        ( text + "" ).replace( rtrim, "" );
},

合并以后,从字符串转变为正则表达式(各去掉一个反斜线!)性能

字符串  "^[\\x20\\t\\r\\n\\f]+|((?:^|[^\\\\])(?:\\\\.)*)[\\x20\\t\\r\\n\\f]+$"
正则表达式   /^[\x20\t\r\n\f]+|((?:^|[^\\])(?:\\.)*)[\x20\t\r\n\f]+$/g
//其实,若不考虑转义,空白符用...替代
//可这么理解(注意:这么写只是帮助理解,不是内部原理)
/ ^ [...]+ | ( (?: ^ | [^\] ) (?:.)* ) [...]+ $/g
//(?:) 可同义替换为 ()
/ ^ [...]+ | ( ( ^ | [^\] )) (.)* )    [...]+ $/g

 

细看会发现其实它是有两个部分组合的。一是:whitespace,一是 ((?:^|[^\\\\])(?:\\\\.)*)。其中whitespace就是空格符,制表符,回车符,换行符,翻页符。学习

下面细细说说后面这串表达式含义。优化

 

由简入繁:this

/^[...]+ | ( (?: ) ( )* ) [...]+ $/g
/^[...]+ | ( (?: ^ | [^\\] ) (?:\\.)* ) [...]+ $/g
//(?:)             可同义替换为 ()    
//[^\\]            除了\的任一字符
//(^|[^\\])        开头没有字符 或 非\的字符
//(?:\\.)*         任一字符(不含\n换行符)重复0或屡次
// | 后面意思就是    开头没有字符(即下个字符即为原始串的第一个字符)或是非\字符(此时才1位字符)
//                 和除了换行符的任意字符串
//                 和一个whitespace,而后字符串结束
//
//固然 | 前面无非就是匹配以 whitespace 开头而已

 

 

其实,实现 trim 函数不止有以上几种办法,并且 JQuery 采用的也不是最好的。这里是一些其它的实现:

 

实现1

String.prototype.trim=function(){returnthis.replace(/^\s\s*/,'').replace(/\s\s*$/,'');}

看起来不怎么样,动用了两次正则替换,实际速度很是惊人,主要得益于浏览器的内部优化。一个著名的例子字符串拼接,直接相加比用Array作成的StringBuffer还快。base2类库使用这种实现.

 

实现2

String.prototype.trim=function(){returnthis.replace(/^\s+/,'').replace(/\s+$/,'');}

和实现1很类似,但稍慢一点,主要缘由是它最早是假设至少存在一个空白符。Prototype.js使用这种实现,不过其名字为strip,由于Prototype的方法都是力求与Ruby同名。能够看到Jquery1.7版本也是用的这个方法。

 

实现3

String.prototype.trim=function(){returnthis.substring(Math.max(this.search(/\S/),0),this.search(/\S\s*$/)+1);}

以截取方式取得空白部分(固然容许中间存在空白符),总共调用了四个原生方法。设计得很是巧妙,substring以两个数字做为参数。Math.max以两个数字做参数,search则返回一个数字。速度比上面两个慢一点,但比下面大多数都快。

 

实现4

String.prototype.trim=function(){returnthis.replace(/^\s+|\s+$/g,'');}

这个能够称得上实现2的简化版,就是利用候选操做符链接两个正则。但这样作就失去了浏览器优化的机会,比不上实现3。因为看来很优雅,许多类库都使用它,如JQuery与mootools

 

实现5

String.prototype.trim=function(){var str =this; str = str.match(/\S+(?:\s+\S+)*/);return str ? str[0]:'';}

match是返回一个数组,所以原字符串符合要求的部分就成为它的元素。为了防止字符串中间的空白符被排除,咱们须要动用到非捕获性分组(?:exp)。因为数组可能为空,咱们在后面还要作进一步的断定。好像浏览器在处理分组上比较无力,一个字慢。因此不要迷信正则,虽然它基本上是万能的。

 

实现6

String.prototype.trim=function(){returnthis.replace(/^\s*(\S*(\s+\S+)*)\s*$/,'$1');}

把符合要求的部分提供出来,放到一个空字符串中。不过效率不好,尤为是在IE6中。

 

实现7

String.prototype.trim=function(){returnthis.replace(/^\s*(\S*(?:\s+\S+)*)\s*$/,'$1');}

和实现6很类似,但用了非捕获分组进行了优势,性能效之有一点点提高。

 

实现8

String.prototype.trim=function(){returnthis.replace(/^\s*((?:[\S\s]*\S)?)\s*$/,'$1');}

沿着上面两个的思路进行改进,动用了非捕获分组与字符集合,用?顶替了*,效果很是惊人。尤为在IE6中,能够用疯狂来形容此次性能的提高,直接秒杀火狐。

 

实现9

String.prototype.trim=function(){returnthis.replace(/^\s*([\S\s]*?)\s*$/,'$1');}

此次是用懒惰匹配顶替非捕获分组,在火狐中获得改善,IE没有上次那么疯狂。

 

实现10

String.prototype.trim=function()
{
var str =this, whitespace =' \n\r\t\f\x0b\xa0\u2000\u2001\u2002\u2003\u2004\u2005\u2006\u2007\u2008\u2009\u200a\u200b\u2028\u2029\u3000';

for(var i =0,len = str.length; i < len; i++){   if(whitespace.indexOf(str.charAt(i))===-1){     str = str.substring(i);break;
  }
}

for(i = str.length-1; i >=0; i--){   if(whitespace.indexOf(str.charAt(i))===-1){     str = str.substring(0, i +1);break;   } } return whitespace.indexOf(str.charAt(0))===-1? str :''; }

我只想说,搞出这个的人已经不是用牛来形容,已经是神同样的级别。它先是把可能的空白符所有列出来,在第一次遍历中砍掉前面的空白,第二次砍掉后面的空白。全过程只用了indexOf与substring这个专门为处理字符串而生的原生方法,没有使用到正则。速度快得惊人,估计直逼上内部的二进制实现,而且在IE与火狐(其余浏览器固然也毫无疑问)都有良好的表现。速度都是零毫秒级别的。

 

实现11

String.prototype.trim=function(){
var str =this, str = str.replace(/^\s+/,'');
for(var i = str.length-1; i >=0; i--){
    if(/\S/.test(str.charAt(i))){
      str =str.substring(0, i +1);
    break;
  }
}

return str;
}

实现10已经告诉咱们普通的原生字符串截取方法是远胜于正则替换,虽然是复杂一点。但只要正则不过于复杂,咱们就能够利用浏览器对正则的优化,改善程序执行效率,如实现8在IE的表现。我想一般不会有人在项目中应用实现10,由于那个whitespace 实现太长太难记了(固然若是你在打造一个类库,它绝对是首先)。实现11可谓其改进版,前面部分的空白由正则替换负责砍掉,后面用原生方法处理,效果不逊于原版,但速度都是很是逆天。

 

实现12

String.prototype.trim=function(){
var str =this, str = str.replace(/^\s\s*/,''), ws =/\s/, i = str.length;
while (ws.test(str.charAt(--i)));

return str.slice(0, i +1);
}

实现10与实现11在写法上更好的改进版,注意说的不是性能速度,而是易记与使用上。和它的两个前辈都是零毫秒级别的,之后就用这个来工做与吓人。

下面是老外给出的比较结果,执行背景是对Magna Carta 这文章(超过27,600字符)进行trim操做。

 

内容参考:Javascript trim函数大赏

相关文章
相关标签/搜索