0utf-8
utf8是变长的,不是定长, ucs-4范围是1~6字节, 决定一个utf8字长度得看它首个字符, CJK通常是3字节字符
2
utf-8是不定长的,根据左侧位1的个数来决定占用了几个字节
false的:
utf-8能够根据字的第一个字节移位推出长度的
0xxxxxxx
110xxxxx 10xxxxxx
1110xxxx 10xxxxxx 10xxxxxx
11110xxx 10xxxxxx 10xxxxxx 10xxxxxx