ES9(五) —— Unicode Property Escapes

时间 2020-11-16

标签 html 正则表达式 express 学习编码 spa code htm blog 栏目字符编码繁體版

原文原文链接

目录

Unicode Property
Unicode Script
Unicode Block
ES6-ES10学习版图

了解这个新的知识点，须要对文本的编码很是熟悉，否则意识不到这个功能的意义。对于文本的编码须要了解两个概念：字符编码和文件编码。html

字符编码包括 ASCII 和 Unicode
文件编码包括 UTF-8、GBK等。

字符编码和文件编码的关系能够用一句话来归纳：文件编码和字符编码没有关系，也就是说即便指定了文件编码，字符变也能够灵活选择而不受任何限制。正则表达式

根据 Unicode 规范，每个 Unicode 字符除了有惟一的码点，还具备其它属性:express

Unicode Property
Unicode Script
Unicode Block

这些通常用在正则里面。学习

Unicode Property

它按照字符的功能对字符进行分类，一个字符只能属于一个 Unicode Property。也就是说 Property 并不关心字符所属的语言，只关心字符的功能。编码

能够将Unicode property 理解为字符组，将小写 p 改为大写，就是该字符组的排除型字符组。想一想看 \\d 匹配 0-9 这个字符组，而 \\D 匹配 0-9 之外的字符组。spa

let input = 'abcdAeCd中国'
console.log(input.match(/\p{L}/ug))
// ["a", "b", "c", "d", "A", "e", "C", "d", "中", "国"]

这段代码的含义是在输入中匹配全部的字符（不限语言），这里使用的是 Unicode Property：{L}，这个属性的含义是任何语言的任何字母。它有点等同于code

let input = 'abcdAeCd中国'
console.log(input.match(/./sg))

{Ll} [任何具备大写字母的小写字母]
{N} [任何语言下的数字]

更多的 Unicode Property 请查阅官网htm

Unicode Script

按照字符所属的书写系统来划分字符，它通常对应某种语言。好比 \\p{Script=Greek} 表示希腊语，\\p{Script=Han} 表示汉语。blog

匹配下列字符串中的中文ip

let input = `I'm chinese!我是中国人`
console.log(input.match(/\p{Script=Han}+/u))
// ["我是中国人", index: 12, input: "I'm chinese!我是中国人", groups: undefined]

若是不适用这个新功能点，在 ES9 以前大概只能这样作：

let input = `I'm chinese!我是中国人`
console.log(input.match(/[\u4e00-\u9fa5]+/))
// ["我是中国人", index: 12, input: "I'm chinese!我是中国人", groups: undefined]

虽然不一样的写法看上去结果同样，然而时光飞逝， Unicode 在2017年6月发布了 10.0.0版本。在这20年间， Unicode 添加了许多汉字。好比 Unicode 8.0 添加的 109 号化学元素「鿏（⿰⻐麦）」，其码点是 9FCF，不在这个正则表达式范围中。而若是咱们指望程序里的 /[\\u4e00-\\u9fa5]/能够与时俱进匹配最新的 Unicode 标准，显然是不现实的事情。如今只须要在 Unicode Scripts 找到对应的名称便可，而不须要本身去计算全部对应语言字符的的 Unicode 范围。

Unicode Block

将 Unicode 字符按照编码区间进行划分，因此每个字符都只属于一个 Unicode Block，举例说明：

\\p{InBasic_Latin}: U+0000–U+007F
\\p{InLatin-1_Supplement}: U+0080–U+00FF
\\p{InLatin_Extended-A}: U+0100–U+017F
\\p{InLatin_Extended-B}: U+0180–U+024F

目前 JavaScript RegExp 还不支持 Unicode Block

ES6-ES10学习版图

相关文章

相关标签/搜索

一百五十五

正则表达式

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

最新文章

本站公众号

欢迎关注本站公众号,获取更多信息

相关文章

>>更多相关文章<<