译者按: 还没学好ES6?ECMAScript 2018已经到来啦!javascript
为了保证可读性,本文采用意译而非直译。另外,本文版权归原做者全部,翻译仅用于学习。html
1999年,ECMAScript 3添加了对正则表达式的支持。java
16年以后,ECMAScript 6(即ECMAScript 2015或者ES6)引入了Unicode模式(u选项), sticky模式(y选项)以及RegExp.prototype.flags的getter方法。git
这篇博客将介绍ECMAScript正则表达式的最新特性:es6
这个特性已经在ECMAScript 2018正式发布了。
默认状况下,.
能够匹配任意字符,除了换行符:github
/foo.bar/u.test('foo\nbar'); // false
另外,.
不能匹配Unicode字符,须要使用u
选项启用Unicode模式才行。正则表达式
ES2018引入了dotAll模式,经过s
选项能够启用,这样,.
就能够匹配换行符了。express
/foo.bar/su.test('foo\nbar'); // true
这个特性已经在ECMAScript 2018正式发布了。
ECMAScript目前仅支持lookahead断言。小程序
下面示例是Positive lookahead,匹配字符串“42 dollars”中紧跟着是"dollars"的数字:微信小程序
const pattern = /\d+(?= dollars)/u; const result = pattern.exec('42 dollars'); console.log(result[0]); // 打印42
下面示例是Negative lookahead,匹配字符串“42 pesos”中紧跟着的不是"dollars"的数字:
const pattern = /\d+(?! dollars)/u; const result = pattern.exec('42 pesos'); console.log(result[0]); // 打印42
ES2018添加了lookbehind断言。
下面示例是Positive lookbehind,匹配字符串“$42”中前面是"\$"的数字:
const pattern = /(?<=\$)\d+/u; const result = pattern.exec('$42'); console.log(result[0]); // 打印42
下面示例是Negative lookbehind,匹配字符串“$42”中前面不是是"\$"的数字:
const pattern = /(?<!\$)\d+/u; const result = pattern.exec('€42'); console.log(result[0]); // 打印42
Fundebug专一于网页、微信小程序、微信小游戏,支付宝小程序,React Native,Node.js和Java线上BUG实时监控,欢迎免费试用
这个特性已经在ECMAScript 2018正式发布了。
目前,正则表达式中小括号匹配的分组是经过数字编号的:
const pattern = /(\d{4})-(\d{2})-(\d{2})/u; const result = pattern.exec('2017-01-25'); console.log(result[0]); // 打印"2017-01-25" console.log(result[1]); // 打印"2017" console.log(result[2]); // 打印"01" console.log(result[3]); // 打印"25"
这样很方便,可是可读性不好,且不易维护。一旦正则表达式中小括号的顺序有变化时,咱们就须要更新对应的数字编号。
ES2018添加named capture groups, 能够指定小括号中匹配内容的名称,这样能够提升代码的可读性,也便于维护。
const pattern = /(?<year>\d{4})-(?<month>\d{2})-(?<day>\d{2})/u; const result = pattern.exec('2017-01-25'); console.log(result.groups.year); // 打印"2017" console.log(result.groups.month); // 打印"01" console.log(result.groups.day); // 打印"25"
这个特性已经在ECMAScript 2018正式发布了。
Unicode标准为每个字符分配了多个属性。好比,当你要匹配希腊语字符时,则能够搜索Script_Extensions属性为Greek的字符。
Unicode property escapes使得咱们可使用ECMAScript正则表达式直接匹配Unicode字符的属性:
const regexGreekSymbol = /\p{Script_Extensions=Greek}/u; console.log(regexGreekSymbol.test('π')); // 打印true
这个特性还处在Stage 3 Draft
g和y选项一般用于匹配一个字符串,而后遍历全部匹配的子串,包括小括号匹配的分组。String.prototype.matchAll让这个操做变得更加简单了。
const string = 'Magic hex numbers: DEADBEEF CAFE 8BADF00D'; const regex = /\b[0-9a-fA-F]+\b/g; for (const match of string.matchAll(regex)) { console.log(match); }
每个迭代所返回的match对象与regex.exec(string)所返回的结果相同:
// Iteration 1: [ 'DEADBEEF', index: 19, input: 'Magic hex numbers: DEADBEEF CAFE 8BADF00D' ] // Iteration 2: [ 'CAFE', index: 28, input: 'Magic hex numbers: DEADBEEF CAFE 8BADF00D' ] // Iteration 3: [ '8BADF00D', index: 33, input: 'Magic hex numbers: DEADBEEF CAFE 8BADF00D' ]
注意,这个特性还处在Stage 3 Draft,所以还存在变化的可能性,示例代码是根据最新的提案写的。另外,浏览器也尚未支持这个特性。String.prototype.matchAll最快能够被加入到ECMAScript 2019中。
这个提案还处在Stage 3 Draft
这个提案规范了RegExp的遗留特性,好比RegExp.prototype.compile方法以及它的静态属性从RegExp.$1到RegExp.$9。虽然这些特性已经弃用(deprecated)了,可是为了兼容性咱们不能将他们去。所以,规范这些RegExp遗留特性是最好的方法。所以,这个提案有助于保证兼容性。
Fundebug专一于JavaScript、微信小程序、微信小游戏、支付宝小程序、React Native、Node.js和Java实时BUG监控。 自从2016年双十一正式上线,Fundebug累计处理了6亿+错误事件,获得了Google、360、金山软件等众多知名用户的承认。欢迎免费试用!
转载时请注明做者Fundebug以及本文地址:
https://blog.fundebug.com/2018/08/30/ecmascript-regular-expression-new-features/