二进制中补码计算简单详实的讲解

时间 2019-11-10

标签二进制补码计算简单详实讲解繁體版

原文原文链接

本文说明一个基本的问题，补码的问题。
须要说明一点补码是对负整数在计算机中存储的一种形式；另外一种形式是负数在计算机中能够用符号+负数绝对值的形式表示一个负数；好比（-3: 1000 0011存储）可是这种表示的负数有两个零+0，-0，最要命的一点是不能作算术运算。好比10-3=10+（-3）=0000 1010+ 1000 0011=1000 1101=-13显然是错的。因此负整数必须以补码存储。
负数在计算机中如何表示？
举例来讲，+8在计算机中表示为二进制的1000，那么-8怎么表示呢？
很容易想到，能够将一个二进制位（bit）专门规定为符号位，它等于0时就表示正数，等于1时就表示负数。好比，在8位机中，规定每一个字节的最高位为符号位。那么，+8就是00001000，而-8则是10001000。
可是，随便找一本《计算机原理》，都会告诉你，实际上，计算机内部采用2的补码（Two’s Complement）表示负数。ui

在讲补码以前简单介绍机器数，真值，原码和反码的背景。
一、机器数
一个数在计算机中的二进制表示形式, 叫作这个数的机器数。机器数是带符号的，在计算机用一个数的最高位存放符号, 正数0，负数为1。
1
好比，十进制中的数 +3 ，计算机字长为8位，转换成二进制就是0000 0011。若是是 -3 ，就是 1111 1101 。那么，这里的 00000011 和 1111 1101 就是机器数。机器数包含了符号和数值部分。3d

二、真值
由于第一位是符号位，因此机器数的形式值就不能很好的表示真正的数值。例如上面的有符号数 1111 1101，其最高位1表明负，其真正数值是 -3 而不是形式值253（1111 1101按无符号整数转换成十进制等于253）。因此，为区别起见，将带符号位的机器数对应的真正数值称为机器数的真值。
例：0000 0001的真值 = +000 0001 = +1，1000 0001的真值 = –0111 1111 = –127；这里所说的好比-3二进制代码为10000011，就是咱们计算机里面对-3表示的源码。下面介绍源码
首先说明一点
在计算机内，有符号数有3种表示法：原码、反码和补码。blog

三、原码
原码就是符号位加上真值的绝对值, 即用第一位表示符号, 其他位表示值. 好比若是是8位二进制
[+1]原 = 0000 0001
[-1]原 = 1000 0001
由于第一位是符号位, 因此如果8位二进制数，其取值范围就是:
[1111 1111 , 0111 1111]
即[-127 , 127]
原码是人脑最容易理解和计算的表示方式。部署

4 、反码
反码表示法规定：正数的反码与其原码相同；负数的反码是对其原码逐位取反，但符号位除外。
[+1] = [ 00000001 ]原码 = [ 00000001 ]反码；
[-1] = [ 10000001 ]原码 = [ 11111110 ]反码；
可见若是一个反码表示的是负数, 人脑没法直观的看出来它的数值. 一般要将其转换成原码再计算。源码

什么是二进制的补码？
注明：正数的补码与负数的补码一致，负数的补码符号位为1，这位1便是符号位也是数值位，而后加1it

补码借鉴的模概念，虽然理解起来有点晦涩难懂。能够跳过
模的概念：把一个计量单位称之为模或模数。例如，时钟是以12进制进行计数循环的，即以12为模。
在时钟上，时针加上（正拨）12的整数位或减去（反拨）12的整数位，时针的位置不变。14点钟在舍去模12后，成为（下午）2点钟（14=14-12=2）。从0点出发逆时针拨10格即减去10小时，也可当作从0点出发顺时针拨2格（加上2小时），即2点（0-10=-10=-10+12=2）。所以，在模12的前提下，-10可映射为+2。因而可知，对于一个模数为12的循环系统来讲，加2和减10的效果是同样的；所以，在以12为模的系统中，凡是减10的运算均可以用加2来代替，这就把减法问题转化成加法问题了（注：计算机的硬件结构中只有加法器，因此大部分的运算都必须最终转换为加法）。10和2对模12而言互为补数。同理，计算机的运算部件与寄存器都有必定字长的限制（假设字长为16），所以它的运算也是一种模运算。当计数器计满16位也就是65536个数后会产生溢出，又从头开始计数。产生溢出的量就是计数器的模，显然，16位二进制数，它的模数为2^16=65536。在计算中，两个互补的数称为“补码”。好比一个有符号8位的数能够表示256个数据，最大数是0 1 1 1 1 1 1 1（+127），最小数1 0 0 0 0 0 0 0 （-128）；那么第255个数据，加2和减254都是同样的效果得出的结果是第一个数据，因此2和254是同样的效果。对于255来讲2和254是互补的数。
求一个正数对应补码是一种数值的转换方法，要分二步完成：
第一步，每个二进制位都取相反值，即取得反码；0变成1，1变成0。好比，00001000的反码就是11110111。
第二步，将上一步获得的反码加1。11110111就变成11111000。因此，00001000的二进制补码就是11111000。也就是说，-8在计算机（8位机）中就是用11111000表示。
不知道你怎么看，反正我以为很奇怪，为何要采用这么麻烦的方式表示负数，更直觉的方式难道很差吗？原理

二进制补码的好处
首先，要明确一点。计算机内部用什么方式表示负数，实际上是无所谓的。只要可以保持一一对应的关系，就能够用任意方式表示负数。因此，既然能够任意选择，那么理应选择一种用的爽直观方便的方式。
二进制的补码就是最方便的方式。它的便利体如今，全部的加法运算可使用同一种电路完成。
仍是以-8做为例子。假定有两种表示方法。一种是直觉表示法，即10001000；另外一种是2的补码表示法，即11111000。请问哪种表示法在加法运算中更方便？随便写一个计算式，16 + (-8) = ?16的二进制表示是 00010000，因此用直觉表示法，加法就要写成：
　０００１００００
＋１０００１０００原码形式-8
－－－－－－－－－
　１００１１０００
能够看到，若是按照正常的加法规则，就会获得10011000的结果，转成十进制就是-24。显然，这是错误的答案。也就是说，在这种状况下，正常的加法规则不适用于正数与负数的加法，所以必须制定两套运算规则，一套用于正数加正数，还有一套用于正数加负数。从电路上说，就是必须为加法运算作两种电路。因此用原码表示负数是不行的。
如今，再来看二进制的补码表示法。
　０００１００００
＋１１１１１０００补码形式-8
－－－－－－－－－
１００００１０００
能够看到，按照正常的加法规则，获得的结果是100001000。注意，这是一个9位的二进制数。咱们已经假定这是一台8位机，所以最高的第9位是一个溢出位，会被自动舍去。因此，结果就变成了00001000，转成十进制正好是8，也就是16 + (-8) 的正确答案。这说明了，2的补码表示法能够将加法运算规则，扩展到整个整数集，从而用一套电路就能够实现所有整数的加法。扩展

二进制补码的本质，本质是用来表示负整数的
在回答二进制补码为何能正确实现加法运算以前，咱们先看看它的本质，也就是那两个求补码步骤的转换方法是怎么来的。下面描述了一个正数怎么求它对应负数在计算机的表达方式。好比128，正数为10000000，可是惊奇的发现-128也是10000000。可是这里因为属于数据类型的限定，第八位一样一个1表明不一样的含义，前面的 1是数值位，后面数的 1是符号位。
要将正数转成对应的负数，其实只要用0减去这个数就能够了。好比，-8其实就是0-8。用模数的概念解释以下图

已知8的二进制是00001000，-8就能够用下面的式子求出：
　００００００００
－００００１０００
－－－－－－－－－- - - -
由于00000000（被减数）小于0000100（减数），因此不够减。请回忆一下小学算术，若是被减数的某一位小于减数，咱们怎么办？很简单，问上一位借1就能够了。
因此，0000000也问上一位借了1，也就是说，被减数实际上是100000000，这是重点；算式也就改写成：
１００００００００
－００００１０００
－－－－－－－－－- - -
　１１１１１０００
进一步观察，能够发现可分拆为100000000 = 11111111 + 1，因此上面的式子能够拆成两个：
１１１１１１１１
－００００１０００
－－－－－－－－－
　１１１１０１１１取反
＋０００００００１加一
－－－－－－－－－
　１１１１１０００
二进制的补码两个转换步骤就是这么来的。
举个例子，好比-128补码的由来，先把正整数128二进制表示出来10000000求-128的补码
1 1 1 1 1 1 1 1
-1 0 0 0 0 0 0 0
－－－－－－－－－
0 1 1 1 1 1 1 1
+0 0 0 0 0 0 0 1
－－－－－－－－－
1 0 0 0 0 0 0 0
即-128的补码是10000000。8位的结构能表示的最小数是-128；
因此能够总结求补码的范式是这样的：
求n位系统的一个数正数A : 01101101101……….11101100（n位二进制），怎么求他的补码呢，就用n位的1111111111111111111…..111(n位) - 11101101101……….11101100（n位二进制） + 1 = A的补码就行啦！可是
若是一个1111111111111…..111111(n位全为1的正整数的补码)，要用1111111111111…….11111(n+1位) - 1111111111111…..111111(n位全为1的正整数) +1 才能求的她对应的补码。
如uint16 A =200, uint16 B =65535,那么C =A-B;
65535的补码：正数65535为1111 1111 1111 1111，进行下面的计算求得B的补码即-B；先展现有补码符号位，即补码有最高位位1的；
1 1111 1111 1111 1111 -1111 1111 1111 1111 +1 =1 0000 0000 0000 0001,至关于被减数是10 0000 0000 0000 0000（18位） =1 1111 1111 1111 1111 +1
由于A和B 都是16位的无符号数，因此65535的补码最高位舍去，至关于被减数是1 0000 0000 0000 0000 =1111 1111 1111 1111 +1，便可以用上面的范式方法，可是这样-B就没有体现它的负数的符号位了；固然这是由于16位运算超出16位的位都舍去了。即-B=1;即A-B= 200+1 =201。其实也能够用模数概念解释A -B；以下图正数的模数循环

为何正数加法也适用于二进制的补码？
实际上，咱们要证实的是，X-Y或X+(-Y)能够用X加上Y的2的补码(-Y)完成。
Y的二进制补码等于(11111111-Y)+1。因此，X加上Y的2的补码，就等于：X + (11111111-Y) + 1；咱们假定这个算式的结果等于Z，即 Z = X + (11111111-Y) + 1。
接下来，分红两种状况讨论。
第一种状况，若是X小于Y，那么Z是一个负数。这时，咱们就对Z采用补码的逆运算，就是在作一次求补码运算，求出它对应的正数绝对值，只要前面加上负号就好了。因此，
Z = -[11111111-Z+1] = -[11111111-(X + (11111111-Y) + 1)+1)] = X - Y;这里若是X Y Z都是无符号型的，且X < Y 那么Z 最终获得的数是|X-Y|距离的绝对值了，好比X=1,Y= 255,那么Z=2,由于从255到1只要加两次就到了。这里你不要问我为何，这里就用到上面的模概念。
第二种状况，若是X大于Y，这意味着Z确定大于11111111，可是咱们规定了这是8位机，最高的第9位是溢出位，必须被舍去，舍去至关于减去吗！因此减去100000000。因此，
Z = Z - 100000000 = X + (11111111-Y) + 1 - 100000000 = X - Y
这就证实了，在正常的加法规则下，能够利用2的补码获得正数与负数相加的正确结果。换言之，计算机只要部署加法电路和补码电路，就能够完成全部整数的加法。
硬件