php 编码转换 乱码解决

转http://blog.csdn.net/u013372487/article/details/52528535php

iconv详解:
iconv — 字符串按要求的字符编码转换
iconv有bug ,碰到一些生僻字就会没法转换,固然了配置第二个参数时,能够稍微弥补一下默认缺陷,不至于没法转换是截断,用法以下
iconv(“UTF-8″,”GB2312//IGNORE”,$data) ;
这样碰到生僻字转换失败时,它就会忽略失败,继续转换下面的内容。数组

iconv
string iconv ( string $in_charset , string $out_charset , string $str ) 第一个参数:内容原的编码 第二个参数:目标编码 第三个参数:要转的字符串 函数返回字符串 <?php $instr = ‘测试’; // GBK转UTF-8 $outstr = iconv(‘GBK’,'UTF-8′,$instr); ?>

 

返回值
返回转换后的字符串, 或者在失败时返回 FALSE。函数

mb_convert_encoding详解:
为了确保转换的成功率,咱们能够用另外一个转换函数
mb_convert_encoding,这个函数效率不是很高,另外这个函数还能够省略第三个参数,自动识别内容编码,不过最好不要用,影响效率,还须要注意的时,mb_convert_encoding和iconv参数顺序不同,必定要注意。post

附两个函数简单的用法:测试

mb_convert_encoding
string mb_convert_encoding ( string $str , string $to_encoding [, mixed $from_encoding ] ) 第一个参数:要处理的字符串 第二个参数:目标编码 第三个参数:内容原编码,它能够是一个 array 也能够是逗号分隔的枚举列表 <?php $instr = '测试'; // GBK转UTF-8 $outstr = mb_convert_encoding($instr,'UTF-8','GBK',); $str = mb_convert_encoding($instr, "UCS-2LE", "JIS, eucjp-win, sjis-win"); ?>

 

我的建议碰到转码问题时采用mb_convert_encoding比较保险。ui

mb_convert_variablesthis

mb_convert_variables — 转换一个或多个变量的字符编码编码

mb_convert_variables ( $to_encoding , $from_encoding , &$vars [, mixed &$... ] )

 

将变量 vars 的编码从 from_encoding 转换成编码 to_encoding。spa

mb_convert_variables() 会拼接变量数组或对象中的字符串来检测编码,由于短字符串的检测每每会失败。所以,不能在一个数组或对象中混合使用编码。

 

to_encoding  将 string 转换成这个编码。 from_encoding 能够指定为一个 array 或者逗号分隔的 string,它将尝试根据 from-coding 来检测编码。 当省略了 from_encoding,将使用 detect_order。 vars 是要转换的变量的引用。 参数能够接受 String、Array 和 Object 的类型。 mb_convert_variables() 假设全部的参数都具备一样的编码。 额外的 vars。

 

返回值 :
成功时返回转换前的字符编码,失败时返回 FALSE。

 

实例:
<?php /* 转换变量 $post一、$post2 编码为内部(internal)编码 */ $interenc = mb_internal_encoding(); $inputenc = mb_convert_variables($interenc, "ASCII,UTF-8,SJIS-win", $post1, $post2); ?>

 

mb_internal_encoding
mb_internal_encoding — 设置/获取内部字符编码.net

mixed mb_internal_encoding ([ string $encoding = mb_internal_encoding() ] )

 

参数 :
encoding 字符编码名称使用于 HTTP 输入字符编码转换、HTTP 输出字符编码转换、mbstring 模块系列函数字符编码转换的默认编码。 
返回值 :
若是设置了 encoding,则成功时返回 TRUE, 或者在失败时返回 FALSE。 In this case, the character encoding for multibyte regex is NOT changed. 若是省略了 encoding,则返回当前的字符编码名称。

 

<?php /* 设置内部字符编码为 UTF-8 */ mb_internal_encoding("UTF-8"); /* 显示当前的内部字符编码*/ echo mb_internal_encoding(); ?>

 

mb_detect_encoding详解:

mb_detect_encoding — 检测字符的编码

string mb_detect_encoding ( string $str [, mixed $encoding_list = mb_detect_order() [, bool $strict = false ]] )

检测字符串 str 的编码。

参数 
str    待检查的字符串。
encoding_list   是一个字符编码列表。 编码顺序能够由数组或者逗号分隔的列表字符串指定。
若是省略了 encoding_list 将会使用 detect_order。
strict strict 指定了是否严格地检测编码。 默认是 FALSE。 返回值 检测到的字符编码,或者没法检测指定字符串的编码时返回 FALSE。

 

字符串编码未知的状况下对字符串进行编码:
一、不管字符串编码是什么,均转换为gbk

function getSafeStr($str){ $s1 = iconv('utf-8','gbk//IGNORE',$str); $s0 = iconv('gbk','utf-8//IGNORE',$s1); if($s0 == $str){ return $s1; }else{ return $str; } }

 

二、不管字符串编码是什么,均转换为utf-8

function getSafeStr($str){ $s1 = iconv('gbk','utf-8//IGNORE',$str); $s0 = iconv('utf-8','gbk//IGNORE',$s1); if($s0 == $str){ return $s1; }else{ return $str; } }

 

获取字符串编码方法:

function getcode($str) { $s1 = iconv('utf-8','gbk//IGNORE',$str); $s0 = iconv('gbk','utf-8//IGNORE',$s1); if($s0 == $str){ return 'utf-8'; }else{ return 'gbk'; } }
相关文章
相关标签/搜索