NLP基础编程------中文编码

0. ASCII 1个字节,使用其中七位二进制数,定义128个字符 最高位不使用,恒等为0. 1. 扩展ASCII( ISO 8859) 原有ASCII 表示128位,最高位不用 扩展ASCII使用第一位后,7位扩展到8位. 增加128个码元,扩展到256,增加了一些欧洲国家的字母,主要为拉丁系 但是对于中文还是不够 2. GB2312-80(又叫国标码) 汉字有多少个? 汉字标准共有 6763
相关文章
相关标签/搜索