【转载】二进制编码

时间 2019-11-08

标签转载二进制编码繁體版

原文原文链接

本文转载，原文连接不详程序员

负数：学习

原码就是原来的表示方法编码

反码是除符号位（最高位）外取反spa

补码=反码+1设计

之前学习二进制编码时，老师讲了一堆堆的什么原码啊反码啊补码啊xxxx转换啊，还有负数的表示方式啊老是记不零清，终于从网上找到了一种比较好的讲解方式，保存再share一下，不过为了系统化讲解，又找来了一些编码的基础知识，若是只想看负数编码记忆法，请跳转到blog

1.若是你不知道二进制怎么编码，请继续，不然请跳到2get

1字节 = 8位，因此它能表示的最大数固然是8位都是1（既然2进制的数只能是0或1,若是是咱们常见的10进制，那就8位都为9，这样说，你该懂了？）数学

1字节的二进制数中，最大的数：11111111。it

这个数的大小是多少呢？让咱们来把它转换为十进制数。io

不管是什么进制，都是左边是高位，右边是低位。10进制是咱们很是习惯的计数方式，第一位表明有几个1（即几个10⁰），第二位表明有几个10（即几个10¹），第三位表明有几个100（即有几个10²）…，用小学课本上的说法就是：个位上的数表示几个1，十位上的数表示向个10，百位上的数表示几个100……

同理可证，二进制数则是：第1位数表示几个1 （2⁰），第2位数表示几个2（2¹），第3位数表示几个4（2²），第4位数表示向个8(2³)……

之前咱们知道1个字节有8位，如今经过计算,咱们又得知：1个字节能够表达的最大的数是255，也就是说表示0~255这256个数。

那么两个字节（双字节数）呢？双字节共16位。 1111111111111111，这个数并不大，但长得有点眼晕，从如今起，咱们要学会这样来表达二制数：

1111 1111 1111 1111,即每4位隔一空格。

双字节数最大值为：

1 * 2¹⁵ + 1 *2¹⁴ + 1* 2¹³ + 1 * 2¹² + 1 * 2¹¹ + 1 * 2¹⁰ + …… + 1 * 2² + 1 * 2¹ + 1* 2⁰ = 65535

　很天然，咱们能够想到，一种数据类型容许的最大值，和它的位数有关。具体的计算方法方法是，若是它有n位，那么最大值就是：

n位二进制数的最大值：1 * 2^(n-1) + 1 * 2^(n-2) + ... + 1 * 2⁰

二、理解有符号数和无符号数

负数在计算机中如何表示呢？这一点，你可能听过两种不一样的回答。

一种是教科书，它会告诉你：计算机用“补码”表示负数。但是有关“补码”的概念一说就得一节课，这一些咱们须要在第6章中用一章的篇幅讲2进制的一切。再者，用“补码”表示负数，其实一种公式，公式的做用在于告诉你，想得问题的答案，应该如何计算。却并无告诉你为何用这个公式就能够和答案？ -----我就是被这个弄混淆的>_<

另外一种是一些程序员告诉你的：用二进制数的最高位表示符号，最高位是0，表示正数，最高位是1，表示负数。这种说法自己没错，但是若是没有下文，那么它就是错的。至少它不能解释，为何字符类型的-1用二进制表示是“1111 1111”(16进制为FF)；而不是咱们更能理解的“1000 0001”。（为何说后者更好理解呢？由于既然说最高位是1时表示负数，那1000 0001不是正好是-1吗？-----re！当初偶就是这么想的，so一直在脑中打架，越打越混淆＝，＝）。

让咱们从头提及。

2.一、你自已决定是否须要有正负。

就像咱们必须决定某个量使用整数仍是实数，使用多大的范围数同样，咱们必须自已决定某个量是否须要正负。若是这个量不会有负值，那么咱们能够定它为带正负的类型。

在计算机中，能够区分正负的类型，称为有符类型，无正负的类型（只有正值），称为无符类型。

数值类型分为整型或实型，其中整型又分为无符类型或有符类型，而实型则只有符类型。

字符类型也分为有符和无符类型。

好比有两个量，年龄和库存，咱们能够定前者为无符的字符类型，后者定为有符的整数类型。

二、使用二制数中的最高位表示正负。

首先得知道最高位是哪一位？1个字节的类型，如字符类型，最高位是第7位，2个字节的数，最高位是第15位，4个字节的数，最高位是第31位。不一样长度的数值类型，其最高位也就不一样，但老是最左边的那位（以下示意）。字符类型固定是1个字节，因此最高位老是第7位。

(红色为最高位)

单字节数： 1111 1111

双字节数： 1111 1111 1111 1111

四字节数： 1111 1111 1111 1111 1111 1111 1111 1111

当咱们指定一个数量是无符号类型时，那么其最高位的1或0，和其它位同样，用来表示该数的大小。

当咱们指定一个数量是有符号类型时，此时，最高数称为“符号位”。为1时，表示该数为负值，为0时表示为正值。

　三、无符号数和有符号数的范围区别。

无符号数中，全部的位都用于直接表示该值的大小。有符号数中最高位用于表示正负，因此，当为正值时，该数的最大值就会变小。咱们举一个字节的数值对比：

无符号数： 1111 1111 值：255 1* 2⁷ + 1* 2⁶ + 1* 2⁵ + 1* 2⁴ + 1* 2³ + 1* 2² + 1* 2¹ + 1* 2⁰

有符号数： 0111 1111 值：127 1* 2⁶ + 1* 2⁵ + 1* 2⁴ + 1* 2³ + 1* 2² + 1* 2¹ + 1* 2⁰

　一样是一个字节，无符号数的最大值是255，而有符号数的最大值是127。缘由是有符号数中的最高位被挪去表示符号了。而且，咱们知道，最高位的权值也是最高的（对于1字节数来讲是2的7次方=128），因此仅仅少于一位，最大值一会儿减半。

不过，有符号数的长处是它能够表示负数。所以，虽然它的在最大值缩水了，却在负值的方向出现了伸展。咱们仍一个字节的数值对比：

无符号数： 0 ----------------- 255

有符号数： -128 --------- 0 ---------- 127

一样是一个字节，无符号的最小值是 0 ，而有符号数的最小值是-128。因此两者能表达的不一样的数值的个数都同样是256个。只不过前者表达的是0到255这256个数，后者表达的是-128到+127这256个数。

一个有符号的数据类型的最小值是如何计算出来的呢？

有符号的数据类型的最大值的计算方法彻底和无符号同样，只不过它少了一个最高位（见第3点）。但在负值范围内，数值的计算方法不能直接使用1* 2⁶ + 1* 2⁵ 的公式进行转换。在计算机中，负数除为最高位为1之外，还采用补码形式进行表达。因此在计算其值前，须要对补码进行还原。这里，先直观地看一眼补码的形式：

以咱们原有的数学经验，在10进制中：1 表示正1，而加上负号：-1 表示和1相对的负值。

那么，咱们会很容易认为在2进制中（1个字节）： 0000 0001 表示正1，则高位为1后：1000 0001应该表示-1。

然而，事实上计算机中的规定有些相反，请看下表：

二进制值（1字节）	十进制值
1000 0000红色的1表明负数蓝色的是补码(补码=反码+1)	-128
1000 0001蓝色部分表明多大的值？：将补码还原为原码	-127想化成负数？：先减去1再按位取反
1000 0010还原方法：补码-1再取反	-126
1000 0011	-125
...	...
1111 1110	-2
1111 1111	-1

首先咱们看到，从-1到-128，其二进制的最高位都是1（表中标为红色），正如咱们前面的学。

而后咱们有些奇怪地发现，1000 0000 并无拿来表示 -0；而1000 0001也不是拿来直观地表示-1。事实上，-1 用1111 1111来表示。

怎么理解这个问题呢？先得问一句是-1大仍是-128大？

固然是 -1 大。-1是最大的负整数。以此对应，计算机中不管是字符类型，或者是整数类型，也不管这个整数是几个字节。它都用全1来表示 -1。好比一个字节的数值中：1111 1111表示-1，那么，1111 1111 - 1 是什么呢？和现实中的计算结果彻底一致。1111 1111 - 1 = 1111 1110，而1111 1110就是-2。这样一直减下去，当减到只剩最高位用于表示符号的1之外，其它低位全为0时，就是最小的负值了，在一字节中，最小的负值是1000 0000，也就是-128。

--------小米批注：就是这部分蓝色的文字，让我终于能记清楚-1的编码方式了，汗＝。＝

咱们以-1为例，来看看不一样字节数的整数中，如何表达-1这个数：

字节数	二进制值	十进制值
单字节数	1111 1111红色表示负数蓝色部分的补码为值1	-1
负数：原码就是原来的表示方法、反码是除符号位（最高位）外取反、补码=反码+1双字节数	1111 1111 1111 1111	-1
四字节数	1111 1111 1111 1111 1111 1111 1111 1111	-1

可能有同窗这时会混了：为何 1111 1111 有时表示255，有时又表示-1？因此我再强调一下本节前面所说的第2点：你自已决定一个数是有符号仍是无符号的。写程序时，指定一个量是有符号的，那么当这个量的二进制各位上都是1时，它表示的数就是-1；相反，若是事选声明这个量是无符号的，此时它表示的就是该量容许的最大值，对于一个字节的数来讲，最大值就是255。

ok 摘抄暂告段落，其实原文对于c的一些基础数据类型知识介绍的很是详细，8过太长了，摘到我须要的内容后就没全帖过来，若是有须要学习的同窗，建议参见原文：）

转自http://blog.cersp.com/7892477/1201309.aspx

关键字：二进制编码，负数二进制，二进制

1-6 什么叫机器数？计算机为何要采用补码？

2007-09-09 14:24:25

大中小

标签：教育杂谈

在计算机内部，全部信息都是用二进制数串的形式表示的。整数一般都有正负之分，计算机中的整数分为无符号的和带符号的。无符号的整数用来表示0和正整数，带符号的证书能够表示全部的整数。因为计算机中符号和数字同样，都必须用二进制数串来表示，所以，正负号也必须用0、1来表示。一般咱们用最高的有效位来表示数的符号（当用8位来表示一个整数时，第8位即为最高有效位，当用16位来表示一个整数时，第16位即为最高有效位。）0表示正号、1表示负号，这种正负号数字化的机内表示形式就称为“机器数”，而相应的机器外部用正负号表示的数称为“真值”。将一个真值表示成二进制字串的机器数的过程就称为编码。

无符号数没有原码、反码和补码一说。只有带符号数才存在不一样的编码方式。

带符号整数有原码、反码、补码等几种编码方式。原码即直接将真值转换为其相应的二进制形式，而反码和补码是对原码进行某种转换编码方式。正整数的原码、反码和补码都同样，负数的反码是对原码的除符号位外的其余位进行取反后的结果（取反即若是该位为0则变为1，而该位为1则变为0的操做）。而补码是先求原码的反码，而后在反码的末尾位加1 后获得的结果，即补码是反码+1。IBM-PC中带符号整数都采用补码形式表示。（注意，只是带符号的整数采用补码存储表示的，浮点数另有其存储方式。）

采用补码的缘由或好处以下。

采用补码运算具备以下两个特征：

1）由于使用补码能够将符号位和其余位统一处理，同时，减法也能够按加法来处理，即若是是补码表示的数，无论是加减法都直接用加法运算便可实现。

2）两个用补码表示的数相加时，若是最高位（符号位）有进位，则进位被舍弃。

这样的运算有两个好处：

1）使符号位能与有效值部分一块儿参加运算，从而简化运算规则。从而能够简化运算器的结构，提升运算速度；（减法运算能够用加法运算表示出来。）

2）加法运算比减法运算更易于实现。使减法运算转换为加法运算，进一步简化计算机中运算器的线路设计。

下面深刻分析上面所陈述的采用补码的缘由（目的）。

用带符号位的原码进行乘除运算时结果正确,而在加减运算的时候就出现了问题，以下：假设字长为8bits

( 1 ) 10- ( 1 )10 = ( 1 )10 + ( -1 )10 = ( 0 )10

(00000001)原 + (10000001)原 = (10000010)原 = ( -2 ) 显然不正确.。

由于在两个整数的加法运算中是没有问题的，因而就发现问题出如今带符号位的负数身上，对除符号位外的其他各位逐位取反就产生了反码。反码的取值空间和原码相同且一一对应。下面是反码的减法运算：

( 1 )10 - ( 1 ) 10= ( 1 ) 10+ ( -1 ) 10= ( 0 )10

(00000001) 反+ (11111110)反 = (11111111)反 = ( -0 ) 有问题。

( 1 )10 - ( 2)10 = ( 1 )10 + ( -2 )10 = ( -1 )10

(00000001) 反+ (11111101)反 = (11111110)反 = ( -1 ) 正确

问题出如今(+0)和(-0)上，在人们的计算概念中零是没有正负之分的。

因而就引入了补码概念。负数的补码就是对反码加一，而正数不变，正数的原码反码补码是同样的。在补码中用(-128)代替了(-0)，因此补码的表示范围为：

(-128~0~127)共256个。

注意:(-128)没有相对应的原码和反码， (-128) = (10000000) 补码的加减运算以下：

( 1 ) 10- ( 1 ) 10= ( 1 )10 + ( -1 )10 = ( 0 )10

(00000001)补 + (11111111)补 = (00000000)补 = ( 0 ) 正确

( 1 ) 10- ( 2) 10= ( 1 )10 + ( -2 )10 = ( -1 )10

(00000001) 补+ (11111110) 补= (11111111)补 = ( -1 ) 正确

采用补码表示还有另一个缘由，那就是为了防止0的机器数有两个编码。原码和反码表示的0有两种形式+0和-0，而咱们知道，+0和-0是相同的。这样，8位的原码和反码表示的整数的范围就是-127~+127（11111111~01111111），而采用补码表示的时候，00000000是+0，即0；10000000再也不是-0，而是-128，这样，补码表示的数的范围就是-128~+127了，不但增长了一个数得表示范围，并且还保证了0编码的惟一性。

整数和0的原码、反码和补码都相同，下面介绍手工快速求负数补码的方法。这个方法在教材的第8页已经提到了，这里再写出来以便能引发你们的注意。其方法以下：

先写出该负数的相反数（正数），再将该正数的二进制形式写出来，而后对这个二进制位串按位取反，即如果1则改成0，如果0则改成1，最后在末位加1。

接下来的问题是，如何能将减法运算转换成加法运算呢？

咱们已经知道，原码表示简单直观，与真值转换容易。但若是用原码表示，其符号位不能参加运算。在计算机中用原码实现算术运算时，要取绝对值参加运算，符号位单独处理，这对乘除运算是很容易实现的，但对加减运算是很是不方便的，如两个异号数相加，实际是要作减法，而两个异号数相减，实际是要作加法。在作减法时，还要判断操做数绝对值的大小，这些都会使运算器的设计变得很复杂。而补码这种编码方式实际上正是针对上述问题的。经过用补码进行表示，就能够把减法运算化为加法运算。

在平常生活中，有许多化减为加的例子。例如，时钟是逢12进位，12点也可看做0点。当将时针从10点调整到5点时有如下两种方法：

一种方法是时针逆时针方向拨5格，至关于作减法：

10－5＝5

另外一种方法是时针顺时针方向拨7格，至关于作加法：

10＋7＝12＋5＝5 (MOD 12)

这是因为时钟以12 为模，在这个前提下，当和超过12时，可将12舍去。因而，减5至关于加7。同理，减4可表示成加8，减3可表示成加9，…。

在数学中，用“同余”概念描述上述关系，即两整数A、B用同一个正整数M (M称为模)去除而余数相等，则称A、B对M同余，记做：

A＝B (MOD M)

具备同余关系的两个数为互补关系，其中一个称为另外一个的补码。当M＝12时，－5和＋7，－4和＋8，－3和＋9就是同余的，它们互为补码。

从同余的概念和上述时钟的例子，不可贵出结论：对于某一肯定的模，用某数减去小于模的另外一个数，总能够用加上“模减去该数绝对值的差”来代替。所以，在有模运算中，减法就能够化做加法来作。

能够看出，补码的加法运算所依据的基本关系为：

[x]补+ [y]补= [x+y]补

补码减法所依据的基本关系式：

[x-y]补 =[x+(-y)]补= [x]补+ [-y]补

至于加法运算为何比减法运算易于实现以及CPU如何实现各类算术运算等问题，则须要经过对数字电路的学习来理解CPU的运算器的硬件实现问题的相关内容了。