现代密码学中的数论基础知识梳理

时间 2019-11-29

标签现代密码学数论基础知识梳理繁體版

原文原文链接

导读

数论是一门研究天然数之间的关系和规律的学科，广泛认为是纯数学的分支，但并不是是彻底没有实用性的学科。现代密码学中用到了不少基础数论中的结论，特别是公钥加密体系（例如RSA算法，椭圆曲线加密等）。html

本文目的在于梳理现代密码学中经常使用到的基础数论方面的定理和结论。其中包括素数的特性、欧几里德算法、线性方程定理、算术基本定理、模算数运算、线性同余定理、欧拉函数、费马小定理、中国剩余定理、欧拉定理、本原根、离散对数问题等等一些基础知识。了解这些知识，应该可以理解现代密码学中经典的算法

Diffie-Hellman密钥协商和RSA算法的原理，进而可以理解秘钥管理、数字签名、消息认证、公钥证书等密码学领域的问题。安全

本文很大程度上参考了数论概述里面的内容，也借鉴了算法导论和密码编码学与网络安全原理与实践的相关章节。网络

1、关于互质和整除的一些有用结论和定理

数论对素数的特性尤为感兴趣，素数是整数的基础构件，就像是元素在化学式中的做用相似。函数

一、$d$整除$a$记做：$d \mid a$ui

若是$d \mid a$且$d \mid b$，那么$d \mid (ax + by)$.编码

二、若是$p$是素数，且$p$整除乘积$ab$，则$p$整除$a$或者$p$整除$b$（或者$p$同时整除$a$和$b$）。加密

证实的关键是假设$p$不整除$a$，考虑$1=gcd(p,a)$同时整除$p$和$a$。但因为$p$是素数，$p$的因子只能是1或者$p$，因此$gcd(p,a)=1$。由后面的线性方程定理得知，能够构造线性方程$px+ay=1=gcd(p,a)$，两边同时乘上$b$，得$bpx+aby=b$，$p$整除左边等价于$p$整除右边的$b$。$p$不整除$b$的状况能够用一样的方式证实。spa

拓展：若是素数$p$整除整数乘积$a_{1}a_{2}a_{3}...a_{r}$,则p至少整除$a_{1}$,$a_{2}$,$a_{2}$,$...$,$a_{r}$中至少一个因数。设计

三、1和任意一个天然数是都是互质关系。

四、任意两个质数构成互质关系。

五、一个数是质数，另外一个数只要不是前者的倍数，二者就构成互质关系，好比3和10。

六、若是两个数之中，较大的那个数是质数，则二者构成互质关系，好比97和57。

七、 $p$是大于1的整数，则$p$和$p-1$构成互质关系，好比57和56。

八、$p$是大于1的奇数，则$p$和$p-2$构成互质关系，好比17和15。

九、素数$p$与1到$p-1$的任意整数均互质。而且阶乘$(p-1)!$与$p$互质，这个结论在后面费马小定理和欧拉定理的证实过程当中会用到。

2、欧几里德算法

欧几里德算法的原理和流程其实比较容易理解。

(GCD递归定理) ：对于任意的非负整数$a$和正整数$b$，知足

$gcd(a,b)=gcd(b,a\;mod\;b)$

更详细的将，其计算流程：

$a=q_{1}\times b+r_{1}\\b=q_{2}\times r_{1}+r_{2}\\r_{1}=q_{3}\times r_{2}+r_{3}\\r_{2}=q_{4}\times r_{3}+r_{4}\\...\\r_{n-3}=q_{n-1}\times r_{n-2}+r_{n-1}\\r_{n-2}=q_{n}\times r_{n-1}+r_{n}\\r_{n-1}=q_{n+1}\times r_{n}+0\\$

$r_{n}$即为求得的$a$和$b$的最大公约数。

以上流程主要须要思考三个问题：

1）为何$r_{n}$是公约数？（须要从下往上推理）

2）为何$r_{n}$是最大的公约数？（假设$d$是$a$与$b$的任意公约数，若是可以证实$d$整数$r_{n}$，便可得证。）

3）为何欧几里德算法最后必定会终止？（由于每轮展转以后的余数是单调递减的，展转的轮次数有上界，最后必定可以保证余数为0，而后取最后一个非零余数$r_{n}$就是正确的结果。）

算法实现Demo：

    //欧几里德算法迭代实现
    public static int getGCD(int a,int b) {
        if (a<b) {//保证a>=b
            return getGCD(b, a);
        }
        if (b>=1) {//保证b>=1
            int temp = 0;
            while(b>0) {
                temp = a%b;
                a = b;
                b = temp;
            }
            return a;
        }else {
            return -1;
        }
    }

3、扩展欧几里德算法

扩展欧几里德算法能够用来求解一类有意思的线性方程的整数解，该线性方程的整数求解过程与最大公约数有密切关系。

对于线性方程（$a,b,c$为常数）：

$ax+by=c$

是很熟悉的方程。这里讨论状况是$a,b,c$知足必定的关系：$c=gcd(a,b)$，也便是这样的线性方程：

$ax+by=gcd(a,b)$

这个线性方程必然有整数解，但咱们更关心若是用更好算法去求解，该算法利用欧几里德算法求解最大公约数过程当中的中间商和余数，进行扩展运算，在求$gcd(a,b)$的过程当中，同时也就求得线性方程的整数解$(x,y)$。

算法实现Demo：

    public static long[] gcdExt(long a,long b){  
        long ans;  
        long[] result=new long[3];  
        if(b==0)  
        {  
            result[0]=a;  
            result[1]=1;  
            result[2]=0;  
            return result;  
        }  
        long [] temp=gcdExt(b,a%b);  
        ans = temp[0];  
        result[0]=ans;  
        result[1]=temp[2];  
        result[2]=temp[1]-(a/b)*temp[2];  
        return result;  
    }

4、算术基本定理

(算术基本定理)：每一个整数$n\geqslant 2$可惟一分解成素数的乘积：

$n=p_{1}^{e_{1}}p_{2}^{e_{2}}...p_{r}^{e_{r}}$

其中，$p_{i}$为素数，且$p_{1}<p_{2} <...<p_{r}$，$e_{i}$为正整数。

实际上，看似理所固然的事实，其实并不是如此。若是自定义一个有别正整数集合的其余集合，极可能就再也不知足惟一分解定理。例如，集合E是由偶数构成的集合：

$E=\left \{0,2,4,6,8,10,12...\right \}$

也可在这个集合中定义所谓的“素数”，称之为“E-素数”，2,6,10,14,18,22,26,30都是“E-素数”。对这个集合中的元素尝试作“素因子”分解，并不老是能都到惟一分解的结果，例如180=10x18=2x30，存在两种“E-素数”的分解形式。

实际上算术基本定理包含两个方面：

1）$n$能够分解成素数乘积的形式。

2）仅有一种这样的素因子分解的形式（固然这里不考虑因数重排序的状况）。

显然惟一性分解是算术基本定理的关键和重点。

另一个有意思的事实：

若是$n$是一个合数，则在小于等于$\sqrt{n}$的数中一定有一个数$a$整除合数$n$。

该结论基于算术基本定理：合数$n$一定能够惟一分解多个素数的乘积，这里假设$p$是它的素因子中最小的一个，则$n$一定能够写成$n=p\times m$的形式，这里的$m$是其他大于等于$p$的素因子的乘积，显然$m\geqslant p$,所以$n=p\times m\geqslant p\times p=p^{2}$

因此，在$0...\sqrt{n}$的范围内，一定存在一个数$a$整除$n$。

能够利用这种方法简单的分辨一个数是不是素数，也能够反复执行上述过程将一个较小的合数进行素因子分解。

5、同余式与模算术

通常来说，能够将$mod$视为一种求余数的二元运算符，例如$2=5\;mod\;3$；也能够用来表示同余关系，这种同余关系一般用同余式表示。例如$2\equiv 5\;(mod\;3)$表示模3时2与5同余。

同余式虽然有别于普通的算数运算下的等式，可是具备相同模的同余式与普通等式有一些类似的特性：

若是已知：

$a_{1}\equiv b_{1}\;(mod\;m)$ 且$a_{2}\equiv b_{2}\;(mod\;m)$

那么有：

$a_{2}\pm a_{2}\equiv b_{2}\pm b_{2}\;(mod\;m)$和$a_{2}a_{2}\equiv b_{2}b_{2}\;(mod\;m)$

同时，也不可贵出：

若是，$a^{k}\equiv b\;(mod\;m)$，那么，$(a^{k})^j\equiv b^{j}\;(mod\;m)$

特别的当$b=1$时：

若是$a^{k}\equiv 1\;(mod\;m)$，那么，$(a^{k})^{j}\equiv 1\;(mod\;m)$。

可是，由$ac\equiv bc\;(mod\;m)$不必定能获得$a\equiv b\;(mod\;m)$。

例如$2\times25\equiv2\times20\;(mod\;10) $，可是$25\not\equiv 20\;(mod\;10)$。

只有当$c$和$m$互质时（也便是$gcd=(c,m)=1$），才可以从同余式两边消去$c$。

由同余式能够引出同余方程：

$ax\equiv c\;(mod\;m)$

求解上述同余方程有一个定理，叫作同余方程定理。

(同余方程定理)：设$a,c,m$是整数，$m\geqslant 1$，且设$g=gcd(a,m)$，则

1）若是$g$不整除$c$，那么同余方程$ax\equiv c\;(mod\;m)$没有解。

2）若是$g$整除$c$，那么同余方程$ax\equiv c\;(mod\;m)$刚好有$g$个解。

以上同余方程的求解过程须要用到扩展欧几里德的求解方法。实际上$ax\equiv c\;(mod\;m)$能够转化为线性方程$ax+m(-y)=c$。

特别地，当$a$和$m$互质，即$g=gcd(a,m)=1$时，同余方程变成：

$ax\equiv 1\;(mod\;m)$

$a$和$x$互为模反元素，这在RSA公钥加密算法生成秘钥过程当中有应用。

6、费马小定理

费马小定理揭示了整数的幂在模运算下的特殊规律。

(费马小定理)：设$p$是素数，$a$是任意的正整数且知足$a\not\equiv0\;(mod\;p)$，则

$a^{p-1}\equiv 1 \;(mod\;p)$

实际上对于条件的更简单的表述能够为"$a$与素数$p$互质"便可。

证实费马小定理并非很是难，证实过程是基于这样一个结论：

设素数$p$与任意正整数$a$互质，那么集合$S=\left \{ a,2a,3a,...(p-1)a \right \}$中任意任意两个元素均不可能模$p$同余。也便是$ja\not\equiv ka\;(mod\;p)$。其证实过程只须要利用反证法便可。

上述结论代表，若是对集合$S$中的每个元素模$p$的结果，其结果恰好与集合$T= \left \{ 1,2,3,4...(p-1) \right \}$中的元素一一对应（不考虑次序重排）。

因而有：

$a\times 2a\times3a...\times(p-1)a\equiv 1\times2\times3...\times(p-1)\;(mod\;p)$

稍微整理得：

$(p-1)!\times a^{p-1}\equiv(p-1)!\;(mod\;p)$

这里必而后$gcd((p-1)!,p)=1$，因此，能够两边消去$(p-1)!$，获得$a^{p-1}\equiv 1 \;(mod\;p)$。

正是因为存在这样的关系，全部费马小定理能够用来简化对整数的幂取模的计算。

费马小定理在数论中很是重要，与其三个定理（分别是威尔逊定理、欧拉定理和中国剩余定理）合称数论四大基本定理。更有趣的是，费马小定理实际上能够视为欧拉定理的一个特例。

最后，费马小定理还有一种等价的表示形式：

若$p$是素数，$a$是正整数，则

$a^{p-1}\equiv a\;(mod\;p)$

这里不须要$a$与$p$互质的条件。这并非一件很奇怪的事情，无非是利用模算术的除法特性（见同余式与模算术）的变形。

7、中国剩余定理

中国剩余定理（也叫做孙子定理）所描述的问题在小学课本中都能找到，只不过当时只能用方程组去刻画这个的问题。

在数论中，它有不止一种表述形式，我见到的就至少有两种。

其中一种比较易懂的描述为：

设$m,n$是正整数，$gcd(m,n)=1$，$b,c$是任意正整数，则同余方程组

$x\equiv b\;(mod\;m)\\x\equiv c\;(mod\;n)$
恰有一个解$0\leqslant x\leqslant mn$。

以上是从方程的角度描述，另一种从对应的角度(数与k元组的对应关系)表述也是可行的，能够看作是上面表述形式更抽象的扩展：

令

$M=\prod_{i=1}^{k}m_{i}$，其中$m_{i}$两两互质

则$Z_{M}=\left \{ 0,1,2,3...(m-1)\right \}$中任意整数会对应一个$k$元组：

$A\leftrightarrow (a_{1},a_{2}...,a_{k})$

其中$a_{i}$固然是要在$Z_{m_{i}}$中(也便是$a_{i}\in Z_{m_{i}}$)，而且$a_{i}$由关系$a_{i}=A\;mod\;m_{i}$给出。

从以上定理实际上能够推断出$A$与$k$元组惟一一对应的事实。

以上描述形式是算法导论和密码编码学与网络安全--原理与实践中采用的表述形式。相比于第一种表述形式，第二种表述更具备通用性，也更抽象。中国剩余在推导欧拉函数求解公式时会用到。

8、欧拉函数

欧拉函数$\phi (m)$的含义是1到$m-1$中（也就是$\left [ 1,m-1 \right ]$）且与$m$互质的整数的个数。它是数论中一个很是重要的函数。

如何计算欧拉函数的值是一个关键的问题。欧拉函数的计算方法的推导主要用到两个结论：

（1）若是$p$是素数，$k\geqslant 1$，则$\phi (p^{k})=p^k-p^{k-1}=p^k(1-\frac{1}{p})$

（2）若是$gcd(m,n)=1$，则$\phi (mn)=\phi (m)\times \phi (n)$

证实（1）的思路很简单：从1到$p^{k}$共有$p^{k}$个整数，这些整数中固然有可能存在与$p^{k}$不互质的数，那么只要扣除去这些数就能够了。显而易见的是，这些与$p^{k}$不互质的数并不难找，它们分别是：

$p,2p,3p,...,(p^{k-1}-2)\times p,(p^{k-1}-1)\times p,p^{k-1}\times p$

一共有$p^{k-1}$个数与$p^{k}$不互质，那么从$p^{k}$中扣除这$p^{k-1}$个数便可。

证实（2）比较复杂一点，其思路是采用计数的思想而后结合中国剩余定理（第一种表述形式）来证实。

有了以上两个结论，结合算术基本定理，能够获得计算$\phi (m)$比较通用的公式：

假设任意正整数$m$，且其素因子分解形式为

$m=p_{1}^{k_{1}}p_{2}^{k_{2}}...p_{r}^{k_{r}}$

利用上面的（2）能够获得

$\phi (m)=\phi (p_{1}^{k_{1}})\phi (p_{2}^{k_{2}})...\phi (p_{r}^{k_{r}})$

而后利用（1），继续获得

$\phi (m)=p_{1}^{k_{1}}p_{2}^{k_{2}}...p_{r}^{k_{r}}(1-\frac{1}{p_{1}})(1-\frac{1}{p_{2}})...(1-\frac{1}{p_{r}})$

也就是

$\phi (m)=m(1-\frac{1}{p_{1}})(1-\frac{1}{p_{2}})...(1-\frac{1}{p_{r}})$

例如

$\phi (12)=\phi (2^{2}\times 3)=\phi (2^{2})\times \phi (3)=12\times (1-\frac{1}{2})\times (1-\frac{1}{3})=4$

另外，欧拉函数与各因数之间存在一种巧妙的关系：

设$d_{1},d_{2},...,d_{r}$是$n$的因数，则

$\phi (d_{1})+\phi (d_{2})+...+\phi (d_{r})=\phi (n)$

其实当$n=p$或者$n=p^{2}$甚至$n=p^{k}$（$p$是素数）时，很容易验证其正确性。

9、欧拉定理

欧拉定理与费马小定理一样都是揭示了整数的幂在模运算下的特殊规律，实际上他们有微妙的关系。

(欧拉定理)：若是$gcd(a,m)=1$，则

$a^{\phi (m)}\equiv 1\;(mod\;m)$

实际上证实欧拉定理的方法与证实费马小定理基本相似，此处略去。

欧拉定理与费马小定理有微妙的关系：若是这里的$m$是一个素数，则$\phi (m)=m-1$，由此获得费马小定理。说明费马小定理实际上能够当作欧拉定理的一个特例。

与费马小定理相似，欧拉定理也有另一种表现形式：

$a^{\phi (m)+1}\equiv a\;(mod\;m)$

这里没有要求$a$与$m$互质的条件。

10、模反元素

若是两个正整数$a$和$m$互质，那么必定能够找到整数$b$，使得 $ab-1$ 被$m$整除，或者说$ab$被$m$除的余数是1。

$ab\equiv1\;(mod\;m)$

则此时$b$就是$a$的模反元素。

实际上这里至关于求解同余方程$ax\equiv 1\;(mod\;m)$，当$gcd(a,m)=1$时，一定存在一个整数解，所以模反元素一定存在，此解便是$a$的模反元素。

从欧拉定理的角度

$a^{\phi (m)}=a\times a^{\phi (m)-1}\equiv 1\;(mod\;m)$

也能够证实模反元素是存在的。

更进一步，若是$p$是素数，由集合$Z_{p}=\left \{ 0,1,2,...p-1 \right \}$和二元运算模$p$的算术运算构成一个有限交换群G。G中每个元素都有乘法逆元，此乘法逆元就是这里的模反元素。

11、本原根

本原根一般与幂模有关，观察以下例子：

$3^{1}\;mod\;7=3\\3^{2}\;mod\;7=2\\3^{3}\;mod\;7=6\\3^{4}\;mod\;7=4\\3^{5}\;mod\;7=5\\3^{6}\;mod\;7=1\\...$

能够发现3的各幂次模$n$可以获得一个循环的序列$\left \{ 3,2,6,4,5,1 \right \}$，这个序列恰好对应着小于等于7且与7互质的整数集合。这并不是一个偶然规律，2或者3的各次幂模5，2或者6或者7或者8的各次幂模11都可以获得一样的规律。

固然也并非老是这样，例如

$2^{1}\;mod\;7=2\\2^{2}\;mod\;7=4\\2^{3}\;mod\;7=1\\2^{4}\;mod\;7=2\\...$

更通常的，考虑$p$为素数，$gcd(a,p)=1$且$a\leqslant p-1$，以下序列

$a\;mod\;p,a^{2}\;mod\;p,a^{3}\;mod\;p,...,a^{p-3}\;mod\;p,a^{p-2}\;mod\;p,a^{p-1}\;mod\;p$

若是$a^{p-1}\;mod\;p=1$，那么能够证实上述序列值必然各不相同（证实能够用反证法，不存在$a^{i}\equiv a^{j}\;(mod\;p)$的状况）。由于这里模$p$运算的结果总会映射到集合$Z_{p}=\left \{ 1,2,3,...,p-2,p-1 \right \}$，这个集合中的每一个元素与$p$互质。也便是说不考虑次序重排，上述序列值对应了集合$Z_{p}$的值。

这时称$a$是$p$的本原根或者生成元。

并不是全部的整数都存在本原根，事实上只有$1,4,p^{\alpha},2p^{\alpha}$才有本原根，其中$p$是任意奇素数，可见素数必定存在本原根。

(原根定理)：每一个素数$p$都有本原根，并且恰好有$\phi (p-1)$个模$p$的本原根。

另外还有一些值得挖掘的规律，不难发现，对于$a^{k}\equiv1\;(mod\;p)$，这样的$k$可能不止一个，好比：

$2^{3}\equiv 1\;(mod\;p)\\2^{6}\equiv 1\;(mod\;p)$

取最小的$k$称为$a$模$p$的阶：$ord_{p}(a)$，例如$ord_{7}(2)=3$。

不难发现，$1\leqslant ord_{p}(a)\leqslant p-1$且老是整除$p-1$（从费马小定理的角度思考能够容易得出结论）。

12、离散对数问题

离散对数的问题很好理解，与算术对数相对，只是在算术对数的基础上增长了模运算。

对于$y=g^{x}\;mod\;p$，若是已知$x,g,p$求$y$是比较容易的求解的；可是反过来，已知$y,g,p$求$x$是很困难的，所以这里能够当作一个单向函数。

Diffie-Hellman密钥协商原理正是基于这样的离散对数问题而设计。而椭圆曲线加密是基于定义在椭圆曲线上的特殊加法运算规则下的离散对数问题而设计，二者达到的目的是一致的，都是利用某一个方向上的计算困难程度保证加密算法的机密性。

十3、References

一、数论概述

二、算法导论.第三一章.数论算法

三、密码编码学与网络安全原理与实践

完！

转载请注明原文出处：http://www.cnblogs.com/qcblog/p/8976017.html