(2008-09-18 15:19:58)php
转载▼html
标签: php编程unicode编码解码it |
分类: IT技术 |
在前面的文章中我用.NET实现了UNICODE的解码,使用JAVA实现了UNICODE的编码,在JAVA中的实现最简单,在.NET中的实现也比较 容易。而如今,使用PHP语言也一样遇到这个问题,对UNICODE编码的内容进行处理,因而又得用PHP写一个UNICODE的编码和解码程序。此次彻 底点,把编码和解码的程序都一块儿写出来,分享给你们。至于UNICODE编码的原理和做用,在前面的文章中已经介绍过。
C#中将UNICODE编码后的字符转换为汉字
保护JAVA源文件,将ASC2编码的字符串转换为UNICODE编码
UNICODE编码在PHP中使用UCS-2编码,以前还真是没有发现,一直还觉得是UTF-8就好了。贴出代码:
//将内容进行UNICODE编码,编码后的内容格式:YOKA\u738b (原始:YOKA王)
function unicode_encode($name)
{
$name = iconv('UTF-8', 'UCS-2', $name);
$len = strlen($name);
$str = '';
for ($i = 0; $i < $len - 1; $i = $i + 2)
{
$c = $name[$i];
$c2 = $name[$i + 1];
if (ord($c) > 0)
{ // 两个字节的文字
$str .= '\u'.base_convert(ord($c), 10, 16).base_convert(ord($c2), 10, 16);
}
else
{
$str .= $c2;
}
}
return $str;
}
// 将UNICODE编码后的内容进行解码,编码后的内容格式:YOKA\u738b (原始:YOKA王)
function unicode_decode($name)
{
// 转换编码,将Unicode编码转换成能够浏览的utf-8编码
$pattern = '/([\w]+)|(\\\u([\w]{4}))/i';
preg_match_all($pattern, $name, $matches);
if (!empty($matches))
{
$name = '';
for ($j = 0; $j < count($matches[0]); $j++)
{
$str = $matches[0][$j];
if (strpos($str, '\\u') === 0)
{
$code = base_convert(substr($str, 2, 2), 16, 10);
$code2 = base_convert(substr($str, 4), 16, 10);
$c = chr($code).chr($code2);
$c = iconv('UCS-2', 'UTF-8', $c);
$name .= $c;
}
else
{
$name .= $str;
}
}
}
return $name;
}
测试用例:
echo '<h3>YOKA\u738b -> '.unicode_decode('YOKA\u738b').'</h3>';
$name = 'YOKA王';
echo '<h3>'.unicode_encode($name).'</h3>';
还要说一句:新浪博客的编辑器把/ ** * /全都给过滤了 编程