MD5的全称是Message-Digest Algorithm 5,在90年代初由MIT的计算机科学实验室和RSA Data Security Inc发明,经MD二、MD3和MD4发展而来。
Message-Digest泛指字节串(Message)的Hash变换,就是把一个任意长度的字节串变换成必定长的大整数。请注意我使用了“字节串”而不是“字符串”这个词,是由于这种变换只与字节的值有关,与字符集或编码方式无关。
MD5将任意长度的“字节串”变换成一个128bit的大整数,而且它是一个不可逆的字符串变换算法,换句话说就是,即便你看到源程序和算法描述,也没法将一个MD5的值变换回原始的字符串,从数学原理上说,是由于原始的字符串有无穷多个,这有点象不存在反函数的数学函数。
MD5的典型应用是对一段Message(字节串)产生fingerprint(指纹),以防止被“篡改”。举个例子,你将一段话写在一个叫readme.txt文件中,并对这个readme.txt产生一个MD5的值并记录在案,而后你能够传播这个文件给别人,别人若是修改了文件中的任何内容,你对这个文件从新计算MD5时就会发现。若是再有一个第三方的认证机构,用MD5还能够防止文件做者的“抵赖”,这就是所谓的数字签名应用。
MD5还普遍用于加密和解密技术上,在不少操做系统中,用户的密码是以MD5值(或相似的其它算法)的方式保存的,用户Login的时候,系统是把用户输入的密码计算成MD5值,而后再去和系统中保存的MD5值进行比较,而系统并不“知道”用户的密码是什么。
一些黑客破获这种密码的方法是一种被称为“跑字典”的方法。有两种方法获得字典,一种是平常搜集的用作密码的字符串表,另外一种是用排列组合方法生成的,先用MD5程序计算出这些字典项的MD5值,而后再用目标的MD5值在这个字典中检索。
即便假设密码的最大长度为8,同时密码只能是字母和数字,共26+26+10=62个字符,排列组合出的字典的项数则是P(62,1)+P(62,2)….+P(62,8),那也已是一个很天文的数字了,存储这个字典就须要TB级的磁盘组,并且这种方法还有一个前提,就是能得到目标帐户的密码MD5值的状况下才能够。
在不少电子商务和社区应用中,管理用户的Account是一种最经常使用的基本功能,尽管不少Application Server提供了这些基本组件,但不少应用开发者为了管理的更大的灵活性仍是喜欢采用关系数据库来管理用户,懒惰的作法是用户的密码每每使用明文或简单的变换后直接保存在数据库中,所以这些用户的密码对软件开发者或系统管理员来讲能够说毫无保密可言,本文的目的是介绍MD5的Java Bean的实现,同时给出用MD5来处理用户的Account密码的例子,这种方法使得管理员和程序设计者都没法看到用户的密码,尽管他们能够初始化它们。但重要的一点是对于用户密码设置习惯的保护。 算法