位运算简介及实用技巧（一）：基础篇

时间 2019-11-13

标签运算简介实用技巧基础繁體版

原文原文链接

转载连接：http://www.matrix67.com/blog/archives/263算法

去年年末写的关于位运算的日志是这个Blog里少数大受欢迎的文章之一，不少人都但愿我能不断完善那篇文章。后来我看到了很多其它的资料，学习到了更多关于位运算的知识，有了从新整理位运算技巧的想法。从今天起我就开始写这一系列位运算讲解文章，与其说是原来那篇文章的follow-up，不如说是一个remake。固然首先我仍是从最基础的东西提及。数组

什么是位运算？
    程序中的全部数在计算机内存中都是以二进制的形式储存的。位运算说穿了，就是直接对整数在内存中的二进制位进行操做。好比，and运算原本是一个逻辑运算符，但整数与整数之间也能够进行and运算。举个例子，6的二进制是110，11的二进制是1011，那么6 and 11的结果就是2，它是二进制对应位进行逻辑运算的结果（0表示False，1表示True，空位都当0处理）：
     110
AND 1011
———-
    0010  –>  2
    因为位运算直接对内存数据进行操做，不须要转成十进制，所以处理速度很是快。固然有人会说，这个快了有什么用，计算6 and 11没有什么实际意义啊。这一系列的文章就将告诉你，位运算到底能够干什么，有些什么经典应用，以及如何用位运算优化你的程序。数据结构

Pascal和C中的位运算符号
    下面的a和b都是整数类型，则：
C语言  |  Pascal语言
——-+————-
a & b  |  a and b
a | b  |  a or b
a ^ b  |  a xor b
  ~a   |   not a
a << b |  a shl b
a >> b |  a shr b
    注意C中的逻辑运算和位运算符号是不一样的。520|1314=1834，但520||1314=1，由于逻辑运算时520和1314都至关于True。一样的，!a和~a也是有区别的。学习

各类位运算的使用
=== 1. and运算 ===
and运算一般用于二进制取位操做，例如一个数 and 1的结果就是取二进制的最末位。这能够用来判断一个整数的奇偶，二进制的最末位为0表示该数为偶数，最末位为1表示该数为奇数.优化

=== 2. or运算 ===
or运算一般用于二进制特定位上的无条件赋值，例如一个数or 1的结果就是把二进制最末位强行变成1。若是须要把二进制最末位变成0，对这个数or 1以后再减一就能够了，其实际意义就是把这个数强行变成最接近的偶数。加密

    === 3. xor运算 ===
    xor运算一般用于对二进制的特定一位进行取反操做，由于异或能够这样定义：0和1异或0都不变，异或1则取反。
    xor运算的逆运算是它自己，也就是说两次异或同一个数最后结果不变，即(a xor b) xor b = a。xor运算能够用于简单的加密，好比我想对我MM说1314520，但怕别人知道，因而双方约定拿个人生日19880516做为密钥。1314520 xor 19880516 = 20665500，我就把20665500告诉MM。MM再次计算20665500 xor 19880516的值，获得1314520，因而她就明白了个人企图。
    下面咱们看另一个东西。定义两个符号#和@（我怎么找不到那个圈里有个叉的字符），这两个符号互为逆运算，也就是说(x # y) @ y = x。如今依次执行下面三条命令，结果是什么？
x <- x # y y <- x @ y x <- x @ y
    执行了第一句后x变成了x # y。那么第二句实质就是y <- x # y @ y，因为#和@互为逆运算，那么此时的y变成了原来的x。第三句中x实际上被赋值为(x # y) @ x，若是#运算具备交换律，那么赋值后x就变成最初的y了。这三句话的结果是，x和y的位置互换了。
    加法和减法互为逆运算，而且加法知足交换律。把#换成+，把@换成-，咱们能够写出一个不须要临时变量的swap过程(Pascal)。
procedure swap(var a,b:longint); begin    a:=a + b;    b:=a - b;    a:=a - b; end;
    好了，刚才不是说xor的逆运算是它自己吗？因而咱们就有了一个看起来很是诡异的swap过程：
procedure swap(var a,b:longint); begin    a:=a xor b;    b:=a xor b;    a:=a xor b; end;日志

    === 4. not运算 ===
    not运算的定义是把内存中的0和1所有取反。使用not运算时要格外当心，你须要注意整数类型有没有符号。若是not的对象是无符号整数（不能表示负数），那么获得的值就是它与该类型上界的差，由于无符号类型的数是用$0000到$FFFF依次表示的。下面的两个程序（仅语言不一样）均返回65435。
var    a:word; begin    a:=100;    a:=not a;    writeln(a); end.
#include <stdio.h> int main() {     unsigned short a=100;     a = ~a;     printf( "%dn", a );         return 0; }
    若是not的对象是有符号的整数，状况就不同了，稍后咱们会在“整数类型的储存”小节中提到。code

    === 5. shl运算 ===
    a shl b就表示把a转为二进制后左移b位（在后面添b个0）。例如100的二进制为1100100，而110010000转成十进制是400，那么100 shl 2 = 400。能够看出，a shl b的值实际上就是a乘以2的b次方，由于在二进制数后添一个0就至关于该数乘以2。
    一般认为a shl 1比a * 2更快，由于前者是更底层一些的操做。所以程序中乘以2的操做请尽可能用左移一位来代替。
    定义一些常量可能会用到shl运算。你能够方便地用1 shl 16 – 1来表示65535。不少算法和数据结构要求数据规模必须是2的幂，此时能够用shl来定义Max_N等常量。对象

=== 6. shr运算 ===
和shl类似，a shr b表示二进制右移b位（去掉末b位），至关于a除以2的b次方（取整）。咱们也常常用shr 1来代替div 2，好比二分查找、堆的插入操做等等。想办法用shr代替除法运算可使程序效率大大提升。最大公约数的二进制算法用除以2操做来代替慢得出奇的mod运算，效率能够提升60%。blog

位运算的简单应用
有时咱们的程序须要一个规模不大的Hash表来记录状态。好比，作数独时咱们须要27个Hash表来统计每一行、每一列和每个小九宫格里已经有哪些数了。此时，咱们能够用27个小于2^9的整数进行记录。例如，一个只填了2和5的小九宫格就用数字18表示（二进制为000010010），而某一行的状态为511则表示这一行已经填满。须要改变状态时咱们不须要把这个数转成二进制修改后再转回去，而是直接进行位操做。在搜索时，把状态表示成整数能够更好地进行判重等操做。这道题是在搜索中使用位运算加速的经典例子。之后咱们会看到更多的例子。
下面列举了一些常见的二进制位的变换操做。

    功能              |           示例            |    位运算
———————-+—————————+——————–
去掉最后一位          | (101101->10110)           | x shr 1
在最后加一个0         | (101101->1011010)         | x shl 1
在最后加一个1         | (101101->1011011)         | x shl 1+1
把最后一位变成1       | (101100->101101)          | x or 1
把最后一位变成0       | (101101->101100)          | x or 1-1
最后一位取反          | (101101->101100)          | x xor 1
把右数第k位变成1      | (101001->101101,k=3)      | x or (1 shl (k-1))
把右数第k位变成0      | (101101->101001,k=3)      | x and not (1 shl (k-1))
右数第k位取反         | (101001->101101,k=3)      | x xor (1 shl (k-1))
取末三位              | (1101101->101)            | x and 7
取末k位               | (1101101->1101,k=5)       | x and (1 shl k-1)
取右数第k位           | (1101101->1,k=4)          | x shr (k-1) and 1
把末k位变成1          | (101001->101111,k=4)      | x or (1 shl k-1)
末k位取反             | (101001->100110,k=4)      | x xor (1 shl k-1)
把右边连续的1变成0    | (100101111->100100000)    | x and (x+1)
把右起第一个0变成1    | (100101111->100111111)    | x or (x+1)
把右边连续的0变成1    | (11011000->11011111)      | x or (x-1)
取右边连续的1         | (100101111->1111)         | (x xor (x+1)) shr 1
去掉右起第一个1的左边 | (100101000->1000)         | x and (x xor (x-1))

最后这一个在树状数组中会用到。

Pascal和C中的16进制表示
Pascal中须要在16进制数前加$符号表示，C中须要在前面加0x来表示。这个之后咱们会常常用到。

整数类型的储存
    咱们前面所说的位运算都没有涉及负数，都假设这些运算是在unsigned/word类型（只能表示正数的整型）上进行操做。但计算机如何处理有正负符号的整数类型呢？下面两个程序都是考察16位整数的储存方式（只是语言不一样）。
var    a,b:integer; begin    a:=$0000;    b:=$0001;    write(a,' ',b,' ');    a:=$FFFE;    b:=$FFFF;    write(a,' ',b,' ');    a:=$7FFF;    b:=$8000;    writeln(a,' ',b); end.
#include <stdio.h> int main() {     short int a, b;     a = 0x0000;     b = 0x0001;     printf( "%d %d ", a, b );     a = 0xFFFE;     b = 0xFFFF;     printf( "%d %d ", a, b );     a = 0x7FFF;     b = 0x8000;     printf( "%d %dn", a, b );     return 0; }
    两个程序的输出均为0 1 -2 -1 32767 -32768。其中前两个数是内存值最小的时候，中间两个数则是内存值最大的时候，最后输出的两个数是正数与负数的分界处。由此你能够清楚地看到计算机是如何储存一个整数的：计算机用$0000到$7FFF依次表示0到32767的数，剩下的$8000到$FFFF依次表示-32768到-1的数。32位有符号整数的储存方式也是相似的。稍加注意你会发现，二进制的第一位是用来表示正负号的，0表示正，1表示负。这里有一个问题：0原本既不是正数，也不是负数，但它占用了$0000的位置，所以有符号的整数类型范围中正数个数比负数少一个。对一个有符号的数进行not运算后，最高位的变化将致使正负颠倒，而且数的绝对值会差1。也就是说，not a实际上等于-a-1。这种整数储存方式叫作“补码”。

最后还有两句话 Matrix67原创转贴请注明出处