C++里将string类字符串(utf-8编码)分解成单个字(可中英混输)

 1)对于单字节的符号,字节的第一位设为0,后面7位为这个符号的unicode码。所以对于英语字母,UTF-8编码和ASCII码是相同的。编码   2)对于n字节的符号(n>1),第一个字节的前n位都设为1,第n+1位设为0,后面字节的前两位一概设为10。剩下的没有说起的二进制位,所有为这个符号的unicode码。code   如表: utf-8 1字节 0xxxxxxx  2字节 110xxxx
相关文章
相关标签/搜索