如何判断一个文件的编码格式是gb2312仍是gbk等

GB2312-80编码的编码范围是高位0xa1-0xfe,低位是 0xa1-0xfe ,其中汉字范围为 0xb0a1 和 0xf7fe,若是只是简单地判断汉字,则只要查看高字节是否大于等于0xa1就能够了,还有就是,全角字符的高字节通通等于0xa3,因此很容易能够区别出全角字符来。 html  Unicode:FF、FE     Unicode big endian:FE、FF     UTF-8
相关文章
相关标签/搜索