最近在玩node.js,用http客户端获取的html不少都是gbk或gb2312编码的,网上找了下,都说要使用iconv,想一想太麻烦,在维基百科找了下,找到了unicode-gbk编码映射,以及unicode-utf8的算法,因而将映射表当下来搞了个编码转换的工具,代码也不多,不到100行html
获取:node
npm install encoding_convertor
使用:算法
var ec = require('encoding_convertor'); ec.convert(src, 'gbk', function(err, result){ console.log(result); }); //src: gbk编码的buffer, 第二个参数是要转换的编码,回调函数 result: utf-8编码的字符串
如今已经内置了gbk的编码映射表,若是想支持其它的编码能够去维基百科搞,不过格式必定要是otherencoding:unicode\nnpm
gbk映射来源:ICU:UNICODE-GBK table函数
unicode-utf8算法来源:utf-8编码 维基百科工具