1. 计算机存的是二进制,咱们平时使用的汉字都不是二进制,存在计算机里用的是字符编码。编码
2. 字符集就是一套文字符号及其编码的描述。字符集有不少种。字符编码
3. 概念:二进制
A. 位:计算机中的最小单位,二进制中的一位,用0/1表示。(比特)数据
B. 字节:八位组成一个字节。(一个汉字能够是两个或三个字节)英文
C. 字符:咱们肉眼可见的文字或符号。(一个汉字是一个字符,一个英文字母是一个字符)计算机
D. 字符集:字符的集合。集合
E. 编码:将字符转换成计算机能够识别的0/1代码。字符集
F. 解码:将计算机表示的0/1编码转换成肉眼可见的字符。字符
4. 编码:文字
ASCII:
GB2312:收录7千多简体汉字
GBK:收录2万多汉字(流行)
GB18030:另加了少数民族的文字
UCS:全部字符采用四个字节进行编码,
UTF-8:对不一样范围的字符使用不一样长度的编码
UFT-16:以16位无符号整型数据为单位的