编码相关

位(bit):数据存储的最小单位。表示二进制位、每一个二进制数字0或者1就是1个位
字(word):1字=2字节(1 word = 2 byte)
字节(byte):8个位构成一个字节;即:1byte(字节)=8bit(位);计算机中存储数据的单元,一个8位的二进制数,是一个很具体的存储空间。
1 KB = 1024 B(字节);
1 MB = 1024 KB;   (2^10 B)
1 GB = 1024 MB;  (2^20 B)
1 TB = 1024 GB;   (2^30 B)
字符:a、A、中、+、*、の......均表示一个字符;人们使用的记号,抽象意义上的一个符号。
通常 utf-8 编码下,一个汉字 字符 占用 3 个 字节;
通常 gbk 编码下,一个汉字 字符 占用 2 个 字节;
字符集:即各类各个字符的集合,也就是说哪些汉字,字母(A、b、c)和符号(空格、引号..)会被收入标准中;
base64为一种字符集、标准ASCii字符集、扩展ASCii字符集、gbk字符集、浏览器

编码:规定每一个“字符”分别用一个字节仍是多个字节存储,用哪些字节来存储,这个规定就叫作“编码”。(其实际是对字符集中字符进行编码,即:每一个字符用二进制在计算中表示存储);
通俗的说:编码就是按照规则对字符进行翻译成对应的二进制数,在计算器中运行存储,用户看的时候(好比浏览器),在用对应的编码解析出来用户能看懂的;

Unicode字符集:容纳世界上全部语言字符和符号的集合(以及对应的二进制数字)
Unicode只是一个编码规范,目前实际实现的unicode编码只要有三种:UTF-8,UCS-2和UTF-16,三种unicode字符集之间能够按照规范进行转换。
UTF-8是一种针对Unicode的可变长度字符编码,也是一种前缀码。网络

bps 是 bits per second 的简称。通常数据机及网络通信的传输速率都是以「bps」为单位。如56Kbps、100.0Mbps 等等。
Bps便是Byte per second 的简称。而电脑通常都以Bps 显示速度,如1Mbps 大约等同 128 KBps。
bit 电脑记忆体中最小的单位,在二进位电脑系统中,每一bit 能够表明0 或 1 的数位讯号。
Byte一个Byte由8 bits 所组成,可表明一个字元(A~Z)、数字(0~9)、或符号(,.?!%&+-*/),是记忆体储存资料的基本单位,至於每一个中文字则需要两Bytes。当记忆体容量过大时,位元组这个单位就不够用,所以就有千位元组的单位KB出现,如下乃个记忆体计算单位之间的相关性:编码

相关文章
相关标签/搜索