觉得是高性能神仙算法,一看源代码才发现...

在昨天的文章中,咱们讲到了 RSA 算法。RSA 算法的根本原理中,有两个核心质数 p和 q,他们相乘获得一个数 n。因为反向从 n 分解出 p 和 q 很是困难,因此只要 p 和 q 足够大,RSA 算法在如今的计算机水平下就没法被破解。python

如今,你先暂停一下,打开百度或者 Google,搜索一下 RSA 算法的教程。随便看10篇。git

你会发现,这些教程无一例外都是说:寻找两个足够大的质数 p 和 q。但他们都不会告诉你,怎么寻找。github

在如今的数学体系中,质数是找出来的,而不是生成出来的。尚未一个完美的通项公式能够生成质数。咱们能够作到快速检查一个数是否是质数,可是咱们如今还作不到直接生成一个质数。算法

那么问题来了,RSA 算法中生成密钥时,须要的这两个质数,究竟是怎么来的?markdown

当咱们使用 RSA 算法生成2048 bit的密钥时,咱们须要找到的两个质数 p 和 q,他们各是1024bit。1024bit的数字有多大?它最小的值为2^{1024},最大为2^{1025} - 1。若是你从最小的这个数字开始数,数到最大的这个数,每秒你能数1亿个数字,你须要数570044753571256946895391042233962688235025678254156066950247593726955466151385601004275993538836681954338260654082297557264046704764131857219835840434659197037569423594829671728507799344387665269701556798848952843855120124119935570376436804099528276139492994306780499238797710357939232321万年才能数完。app

这么大范围的数字里面,让你去找两个质数。你说,这 TM 怎么找?dom

因此,Python的这个 rsa 库,里面是使用了什么神仙算法,可以快速找到这两个质数的?因而我去阅读了它的源代码。结果吓得我一身冷汗。函数

生成密钥使用的是rsa.newkeys()函数,因而我首先在 rsa/key.py文件中找到了这个函数:oop

先看758-762行,这里它经过poolsize参数来决定使用CPU的几个核,若是个人 CPU 是4核心,那么能够同时开4个进程来寻找质数。但这段代码咱们能够先跳过,由于在昨天的文章里面,咱们没有指定 poolsize参数,因此它使用默认值1.因而代码运行到第767行,经过gen_keys函数来生成p 和 q。spa

咱们再来看gen_keys函数:

能够看到,在第714行,经过函数find_p_q生成了 p 和 q,而且这里若是咱们的密钥是2048bit的话,p 和q 均是1024bit。

咱们再来看 find_p_q函数:

这个函数很长,可是大部分是在验证生成的 p 和 q 是否符合要求(不能相等,而且要相差足够大),若是不符合要求就重试。因此真正核心的代码只有第613行和第615行。这里调用的genprime_func函数是经过参数传进来的。而这个genprime_func是咱们在newkeys函数第764行得到的rsa.prime.getprime函数。

如今咱们进入/rsa/prime.py文件,阅读getprime函数的源代码:

这段代码居然很是简单。在第162行先判断要生成的质数的bit 数不小于3.而后高潮来了:

while True:
        integer = rsa.randnum.read_random_odd_int(nbits)

        # Test for primeness
        if is_prime(integer):
            return integer
复制代码

开一个死循环,调用read_random_odd_int不停获取nbit的奇数,而后,使用is_prime判断它是否是质数,若是是,返回这个数。若是不是质数,继续随机生成一个 nbit 的奇数,再判断它是否是质数。

这 TM 在逗我?在死循环里面随机生成奇数,而后判断是否是质数,不是就重试直到随机到一个质数为止?

2^{1024}2^{1025}-1这么大的范围里面随机选奇数?这要选多少年才碰得上两个质数啊?

为了解决这个疑惑,咱们来看一下素数定理

对于正实数x,定义π(x)为素数计数函数,亦即不大于x的素数个数。数学家找到了一些函数来估计π(x)的增加:\pi(x)\approx \frac{x}{ln(x)}

x足够大时,能够使用这个公司估算出不大于x的质数的个数。

那么咱们来看看,在2^{1024}2^{1025}-1的范围中,质数的密度是多少:

质数的密度居然高达0.14%!那么随机选一个数字,不是质数的几率是99.86%。咱们来计算一下,若是随机选10000个数字,即便在不考虑奇偶性的状况下:

也就是说,在随机10000个数字里面,不出现质数的几率是一千万分之一。出现质数的几率超过99.9999%

而用 Python 循环10000次,并不须要多长时间。因此,rsa 库里面的这个算法,居然没什么问题!!

最后,你们有兴趣能够看看prime.py中的is_prime函数,用于快速判断一个数是否是质数。还有randnum.py中的read_random_odd_int用于随机生成一个计数,代码都很简单,相信你能学到很多东西。

相关文章
相关标签/搜索