UTF-8编码下中文占几个字节

 

0utf-8

utf8是变长的,不是定长, ucs-4范围是1~6字节, 决定一个utf8字长度得看它首个字符, CJK通常是3字节字符

2

utf-8是不定长的,根据左侧位1的个数来决定占用了几个字节

false的:

 

utf-8能够根据字的第一个字节移位推出长度的

0xxxxxxx

 

110xxxxx 10xxxxxx

1110xxxx 10xxxxxx 10xxxxxx

11110xxx 10xxxxxx 10xxxxxx 10xxxxxx

相关文章
相关标签/搜索