微博短连接的生成算法(Java 版本) html
最近看到微博的短连接真是很火啊,新浪、腾讯、搜狐等微博网站都加入了短连接的功能。之因此要是使用短连接,主要是由于微博只容许发140 字,若是连接地址太长的话,那么发送的字数将大大减小。短连接的主要职责就是把原始连接很长的地址压缩成只有6 个字母的短连接地址,当咱们点击这6 个字母的连接后,咱们又能够跳转到原始连接地址。 算法
开始觉得短连接是按照某种算法把原始连接压缩为短连接,再根据算法从短连接反算成原始连接的。后来尝试了下压缩算法(gzip 压缩算法),发现对于url 这种字符串越是压缩,长度就越长。经过对压缩算法的一些了解,发现靠压缩算法来实现这个功能不太靠谱。 数据库
后来在网上找到一个生成算法,该算法主要使用MD5 算法对原始连接进行加密(这里使用的MD5 加密后的字符串长度为32 位),而后对加密后的字符串进行处理以获得短连接的地址。原始的算法是C# 版本的,这里我把该算法修改为Java 版本的. 算法的具体代码以下,代码中有注释: 数组
1、 代码 网站
package com.csdn.shorturl; 加密 public class ShortUrlGenerator { url
/** spa * @param args htm */ blog public static void main(String[] args) { // 长链接: http://tech.sina.com.cn/i/2011-03-23/11285321288.shtml // 新浪解析后的短连接为: http://t.cn/h1jGSC String sLongUrl = "http://tech.sina.com.cn/i/2011-03-23/11285321288.shtml" ; // 3BD768E58042156E54626860E241E999 String[] aResult = shortUrl (sLongUrl); // 打印出结果 for ( int i = 0; i < aResult. length ; i++) { System. out .println( "[" + i + "]:::" + aResult[i]); } }
public static String[] shortUrl(String url) { // 能够自定义生成 MD5 加密字符传前的混合 KEY String key = "wuguowei" ; // 要使用生成 URL 的字符 String[] chars = new String[] { "a" , "b" , "c" , "d" , "e" , "f" , "g" , "h" , "i" , "j" , "k" , "l" , "m" , "n" , "o" , "p" , "q" , "r" , "s" , "t" , "u" , "v" , "w" , "x" , "y" , "z" , "0" , "1" , "2" , "3" , "4" , "5" , "6" , "7" , "8" , "9" , "A" , "B" , "C" , "D" , "E" , "F" , "G" , "H" , "I" , "J" , "K" , "L" , "M" , "N" , "O" , "P" , "Q" , "R" , "S" , "T" , "U" , "V" , "W" , "X" , "Y" , "Z"
}; // 对传入网址进行 MD5 加密 String sMD5EncryptResult = ( new CMyEncrypt()).getMD5OfStr(key + url); String hex = sMD5EncryptResult;
String[] resUrl = new String[4]; for ( int i = 0; i < 4; i++) {
// 把加密字符按照 8 位一组 16 进制与 0x3FFFFFFF 进行位与运算 String sTempSubString = hex.substring(i * 8, i * 8 + 8);
// 这里须要使用 long 型来转换,由于 Inteper .parseInt() 只能处理 31 位 , 首位为符号位 , 若是不用 long ,则会越界 long lHexLong = 0x3FFFFFFF & Long.parseLong (sTempSubString, 16); String outChars = "" ; for ( int j = 0; j < 6; j++) { // 把获得的值与 0x0000003D 进行位与运算,取得字符数组 chars 索引 long index = 0x0000003D & lHexLong; // 把取得的字符相加 outChars += chars[( int ) index]; // 每次循环按位右移 5 位 lHexLong = lHexLong >> 5; } // 把字符串存入对应索引的输出数组 resUrl[i] = outChars; } return resUrl; } }
|
2、 输出结果
执行上面代码的结果以下,会产生4 组6 位字符串,任意一组均可以做为当前字符串的短连接地址。
[0]:::7nUFJn [1]:::f6Zzy2 [2]:::j6jmQb [3]:::2eAjea |
3、 跳转原理
当咱们生成短连接以后,只须要在表中(数据库或者NoSql )存储原始连接与短连接的映射关系便可。当咱们访问短连接时,只须要从映射关系中找到原始连接,便可跳转到原始连接。