详解BitMap算法

时间 2019-11-10

标签详解 bitmap 算法繁體版

原文原文链接

所谓的BitMap就是用一个bit位来标记某个元素所对应的value，而key便是该元素，因为BitMap使用了bit位来存储数据，所以能够大大节省存储空间。
java

1. 基本思想

首先用一个简单的例子来详细介绍BitMap算法的原理。假设咱们要对0-7内的5个元素(4,7,2,5,3)进行排序(这里假设元素没有重复)。咱们可使用BitMap算法达到排序目的。要表示8个数，咱们须要8个byte。算法

首先咱们开辟一个字节(8byte)的空间，将这些空间的全部的byte位都设置为0数组
而后便利这5个元素，第一个元素是4，由于下边从0开始，所以咱们把第五个字节的值设置为1code
而后再处理剩下的四个元素，最终8个字节的状态以下图blog

如今咱们遍历一次bytes区域，把值为1的byte的位置输出(2,3,4,5,7)，这样便达到了排序的目的

从上面的例子能够看出，BitMap算法的思想仍是比较简单的，关键的问题是如何肯定10进制数到二进制的转换排序

MAP映射：内存

假设须要排序或则查找的数的总数N=100000000，BitMap中1bit表明一个数字，1个int = 4Bytes = 4*8bit = 32 bit,那么N个数须要N/32 int空间。因此咱们须要申请内存空间的大小为int a[1 + N/32]，其中：a[0]在内存中占32为能够对应十进制数0-31，依次类推：数学

　 a[0]-----------------------------> 0-31it

　　a[1]------------------------------> 32-63class

　　a[2]-------------------------------> 64-95

　　a[3]--------------------------------> 96-127

　　......................................................

那么十进制数如何转换为对应的bit位，下面介绍用位移将十进制数转换为对应的bit位:

　　1.求十进制数在对应数组a中的下标

　　十进制数0-31，对应在数组a[0]中，32-63对应在数组a[1]中，64-95对应在数组a[2]中………，使用数学概括分析得出结论：对于一个十进制数n，其在数组a中的下标为：a[n/32]

　　2.求出十进制数在对应数a[i]中的下标

　　例如十进制数1在a[0]的下标为1，十进制数31在a[0]中下标为31，十进制数32在a[1]中下标为0。在十进制0-31就对应0-31，而32-63则对应也是0-31，即给定一个数n能够经过模32求得在对应数组a[i]中的下标。

　　3.位移

　　对于一个十进制数n,对应在数组a[n/32][n%32]中，但数组a毕竟不是一个二维数组，咱们经过移位操做实现置1

　　a[n/32] |= 1 << n % 32
　　

移位操做：
　　a[n>>5] |= 1 << (n & 0x1F)

　　n & 0x1F 保留n的后五位至关于 n % 32 求十进制数在数组a[i]中的下标

2.代码实现

public class BitMap {

    private static final int N = 10000000;

    private int[] a = new int[N/32 + 1];

    /**
     * 设置所在的bit位为1
     * @param n
     */
    public void addValue(int n){
        //row = n / 32 求十进制数在数组a中的下标
        int row = n >> 5;
        //至关于 n % 32 求十进制数在数组a[i]中的下标
        a[row] |= 1 << (n & 0x1F);
    }

    // 判断所在的bit为是否为0 
    public boolean exits(int n){
        int row = n >> 5;
        return (a[row] & ( 1 << (n & 0x1F))) != 0;
    }

    public void display(int row){
        System.out.println("BitMap位图展现");
        for(int i=0;i<row;i++){
            List<Integer> list = new ArrayList<Integer>();
            int temp = a[i];
            for(int j=0;j<32;j++){
                list.add(temp & 1);
                temp >>= 1;
            }
            System.out.println("a["+i+"]" + list);
        }
    }

    public static void main(String[] args){
        //int num[] = {1,5,30,32,64,56,159,120,21,17,35,45};
        int num[] = {4,7}
        BitMap map = new BitMap();
        for(int i=0;i<num.length;i++){
            map.addValue(num[i]);
        }

        int temp = 4;
        if(map.exits(temp)){
            System.out.println("value:[" + temp + "] has already exists");
        }
        map.display(3);
    }
}

运行结果：

value:[4] has already exists
BitMap位图展现
a[0][0, 0, 0, 0, 1, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
a[1][0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
a[2][0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]

解析代码：

若是将 0，1，2 ，3 这些10进制位的数字分别经过 & 0X1F (至关于取模32) 经过移位 << N

其实就是将其变为 :

0 ---> 0001 即2的0次方 1

1 ---> 0010 即2的1次方 2

2 ---> 0100 即2的2次方 4

再而后 | 运算因为都是经过直接左移得出(不会有重合的值 )

此时的 | 运算能够理解为相加那么若是 a[row] |= 1 << (n & 0x1F) 得出结果为 7

那么确定是由 0111 构成，那么无论是 0001 （1）、 0010 （2）、0100（4）与 0111 & 运算

其结果确定有相同位置同1 也就是必定不为0

应用范围: 能够运用在快速查找、去重、排序、压缩数据等。