本文说明一个基本的问题,补码的问题。
须要说明一点补码是对负整数在计算机中存储的一种形式;另外一种形式是负数在计算机中能够用符号+负数绝对值的形式表示一个负数;好比(-3: 1000 0011存储)可是这种表示的负数有两个零+0,-0,最要命的一点是不能作算术运算。好比10-3=10+(-3)=0000 1010+ 1000 0011=1000 1101=-13显然是错的。因此负整数必须以补码存储。
负数在计算机中如何表示?
举例来讲,+8在计算机中表示为二进制的1000,那么-8怎么表示呢?
很容易想到,能够将一个二进制位(bit)专门规定为符号位,它等于0时就表示正数,等于1时就表示负数。好比,在8位机中,规定每一个字节的最高位为符号位。那么,+8就是00001000,而-8则是10001000。
可是,随便找一本《计算机原理》,都会告诉你,实际上,计算机内部采用2的补码(Two’s Complement)表示负数。ui
在讲补码以前简单介绍机器数,真值,原码和反码的背景。
一、机器数
一个数在计算机中的二进制表示形式, 叫作这个数的机器数。机器数是带符号的,在计算机用一个数的最高位存放符号, 正数0,负数为1。
1
好比,十进制中的数 +3 ,计算机字长为8位,转换成二进制就是0000 0011。若是是 -3 ,就是 1111 1101 。那么,这里的 00000011 和 1111 1101 就是机器数。 机器数包含了符号和数值部分。3d
二、真值
由于第一位是符号位,因此机器数的形式值就不能很好的表示真正的数值。例如上面的有符号数 1111 1101,其最高位1表明负,其真正数值是 -3 而不是形式值253(1111 1101按无符号整数转换成十进制等于253)。因此,为区别起见,将带符号位的机器数对应的真正数值称为机器数的真值。
例:0000 0001的真值 = +000 0001 = +1,1000 0001的真值 = –0111 1111 = –127;这里所说的好比-3二进制代码为10000011,就是咱们计算机里面对-3表示的源码。下面介绍源码
首先说明一点
在计算机内,有符号数有3种表示法:原码、反码和补码。blog
三、原码
原码就是符号位加上真值的绝对值, 即用第一位表示符号, 其他位表示值. 好比若是是8位二进制
[+1]原 = 0000 0001
[-1]原 = 1000 0001
由于第一位是符号位, 因此如果8位二进制数,其取值范围就是:
[1111 1111 , 0111 1111]
即[-127 , 127]
原码是人脑最容易理解和计算的表示方式。部署
4 、反码
反码表示法规定:正数的反码与其原码相同;负数的反码是对其原码逐位取反,但符号位除外。
[+1] = [ 00000001 ]原码 = [ 00000001 ]反码;
[-1] = [ 10000001 ]原码 = [ 11111110 ]反码;
可见若是一个反码表示的是负数, 人脑没法直观的看出来它的数值. 一般要将其转换成原码再计算。源码
什么是二进制的补码?
注明:正数的补码与负数的补码一致,负数的补码符号位为1,这位1便是符号位也是数值位,而后加1it
补码借鉴的模概念,虽然理解起来有点晦涩难懂。能够跳过
模的概念:把一个计量单位称之为模或模数。例如,时钟是以12进制进行计数循环的,即以12为模。
在时钟上,时针加上(正拨)12的整数位或减去(反拨)12的整数位,时针的位置不变。14点钟在舍去模12后,成为(下午)2点钟(14=14-12=2)。从0点出发逆时针拨10格即减去10小时,也可当作从0点出发顺时针拨2格(加上2小时),即2点(0-10=-10=-10+12=2)。所以,在模12的前提下,-10可映射为+2。因而可知,对于一个模数为12的循环系统来讲,加2和减10的效果是同样的;所以,在以12为模的系统中,凡是减10的运算均可以用加2来代替,这就把减法问题转化成加法问题了(注:计算机的硬件结构中只有加法器,因此大部分的运算都必须最终转换为加法)。10和2对模12而言互为补数。同理,计算机的运算部件与寄存器都有必定字长的限制(假设字长为16),所以它的运算也是一种模运算。当计数器计满16位也就是65536个数后会产生溢出,又从头开始计数。产生溢出的量就是计数器的模,显然,16位二进制数,它的模数为2^16=65536。在计算中,两个互补的数称为“补码”。好比一个有符号8位的数能够表示256个数据,最大数是0 1 1 1 1 1 1 1(+127),最小数1 0 0 0 0 0 0 0 (-128);那么第255个数据,加2和减254都是同样的效果得出的结果是第一个数据 ,因此2和254是同样的效果。对于255来讲2和254是互补的数。
求一个正数对应补码是一种数值的转换方法,要分二步完成:
第一步,每个二进制位都取相反值,即取得反码;0变成1,1变成0。好比,00001000的反码就是11110111。
第二步,将上一步获得的反码加1。11110111就变成11111000。因此,00001000的二进制补码就是11111000。也就是说,-8在计算机(8位机)中就是用11111000表示。
不知道你怎么看,反正我以为很奇怪,为何要采用这么麻烦的方式表示负数,更直觉的方式难道很差吗?原理
二进制补码的好处
首先,要明确一点。计算机内部用什么方式表示负数,实际上是无所谓的。只要可以保持一一对应的关系,就能够用任意方式表示负数。因此,既然能够任意选择,那么理应选择一种用的爽直观方便的方式。
二进制的补码就是最方便的方式。它的便利体如今,全部的加法运算可使用同一种电路完成。
仍是以-8做为例子。假定有两种表示方法。一种是直觉表示法,即10001000;另外一种是2的补码表示法,即11111000。请问哪种表示法在加法运算中更方便?随便写一个计算式,16 + (-8) = ?16的二进制表示是 00010000,因此用直觉表示法,加法就要写成:
00010000
+10001000原码形式-8
---------
10011000
能够看到,若是按照正常的加法规则,就会获得10011000的结果,转成十进制就是-24。显然,这是错误的答案。也就是说,在这种状况下,正常的加法规则不适用于正数与负数的加法,所以必须制定两套运算规则,一套用于正数加正数,还有一套用于正数加负数。从电路上说,就是必须为加法运算作两种电路。因此用原码表示负数是不行的。
如今,再来看二进制的补码表示法。
00010000
+11111000补码形式-8
---------
100001000
能够看到,按照正常的加法规则,获得的结果是100001000。注意,这是一个9位的二进制数。咱们已经假定这是一台8位机,所以最高的第9位是一个溢出位,会被自动舍去。因此,结果就变成了00001000,转成十进制正好是8,也就是16 + (-8) 的正确答案。这说明了,2的补码表示法能够将加法运算规则,扩展到整个整数集,从而用一套电路就能够实现所有整数的加法。扩展
二进制补码的本质,本质是用来表示负整数的
在回答二进制补码为何能正确实现加法运算以前,咱们先看看它的本质,也就是那两个求补码步骤的转换方法是怎么来的。下面描述了一个正数怎么求它对应负数在计算机的表达方式。好比128,正数为10000000,可是惊奇的发现-128也是10000000。可是这里因为属于数据类型的限定,第八位一样一个1表明不一样的含义,前面的 1是数值位,后面数的 1是符号位。
要将正数转成对应的负数,其实只要用0减去这个数就能够了。好比,-8其实就是0-8。用模数的概念解释以下图
已知8的二进制是00001000,-8就能够用下面的式子求出:
00000000
-00001000
---------- - - -
由于00000000(被减数)小于0000100(减数),因此不够减。请回忆一下小学算术,若是被减数的某一位小于减数,咱们怎么办?很简单,问上一位借1就能够了。
因此,0000000也问上一位借了1,也就是说,被减数实际上是100000000,这是重点;算式也就改写成:
100000000
-00001000
---------- - -
11111000
进一步观察,能够发现可分拆为100000000 = 11111111 + 1,因此上面的式子能够拆成两个:
11111111
-00001000
---------
11110111取反
+00000001加一
---------
11111000
二进制的补码两个转换步骤就是这么来的。
举个例子,好比-128补码的由来,先把正整数128二进制表示出来10000000求-128的补码
1 1 1 1 1 1 1 1
-1 0 0 0 0 0 0 0
---------
0 1 1 1 1 1 1 1
+0 0 0 0 0 0 0 1
---------
1 0 0 0 0 0 0 0
即-128的补码是10000000。8位的结构能表示的最小数是-128;
因此能够总结求补码的范式是这样的:
求n位系统的一个数正数A : 01101101101……….11101100(n位二进制),怎么求他的补码呢,就用n位的1111111111111111111…..111(n位) - 11101101101……….11101100(n位二进制) + 1 = A的补码就行啦!可是
若是一个1111111111111…..111111(n位全为1的正整数的补码),要用1111111111111…….11111(n+1位) - 1111111111111…..111111(n位全为1的正整数) +1 才能求的她对应的补码。
如uint16 A =200, uint16 B =65535,那么C =A-B;
65535的补码:正数65535为1111 1111 1111 1111,进行下面的计算求得B的补码即-B;先展现有补码符号位,即补码有最高位位1的;
1 1111 1111 1111 1111 -1111 1111 1111 1111 +1 =1 0000 0000 0000 0001,至关于被减数是10 0000 0000 0000 0000(18位) =1 1111 1111 1111 1111 +1
由于A和B 都是16位的无符号数,因此65535的补码最高位舍去,至关于被减数是1 0000 0000 0000 0000 =1111 1111 1111 1111 +1,便可以用上面的范式方法,可是这样-B就没有体现它的负数的符号位了;固然这是由于16位运算超出16位的位都舍去了。即-B=1;即A-B= 200+1 =201。其实也能够用模数概念解释A -B;以下图正数的模数 循环
为何正数加法也适用于二进制的补码?
实际上,咱们要证实的是,X-Y或X+(-Y)能够用X加上Y的2的补码(-Y)完成。
Y的二进制补码等于(11111111-Y)+1。因此,X加上Y的2的补码,就等于:X + (11111111-Y) + 1;咱们假定这个算式的结果等于Z,即 Z = X + (11111111-Y) + 1。
接下来,分红两种状况讨论。
第一种状况,若是X小于Y,那么Z是一个负数。这时,咱们就对Z采用补码的逆运算,就是在作一次求补码运算,求出它对应的正数绝对值,只要前面加上负号就好了。因此,
Z = -[11111111-Z+1] = -[11111111-(X + (11111111-Y) + 1)+1)] = X - Y;这里若是X Y Z都是无符号型的,且X < Y 那么Z 最终获得的数是|X-Y|距离的绝对值了,好比X=1,Y= 255,那么Z=2,由于从255到1只要加两次就到了。这里你不要问我为何,这里就用到上面的模概念。
第二种状况,若是X大于Y,这意味着Z确定大于11111111,可是咱们规定了这是8位机,最高的第9位是溢出位,必须被舍去,舍去至关于减去吗!因此减去100000000。因此,
Z = Z - 100000000 = X + (11111111-Y) + 1 - 100000000 = X - Y
这就证实了,在正常的加法规则下,能够利用2的补码获得正数与负数相加的正确结果。换言之,计算机只要部署加法电路和补码电路,就能够完成全部整数的加法。
硬件