这篇文章主要介绍了将编码从GB2312转成UTF-8的方法汇总(从前台、程序、数据库),须要的朋友能够参考下php
一个网站若是须要国际化,就须要将编码从GB2312转成UTF-8,其中有不少的问题须要注意,若是没有转换完全,将会有不少的编码问题出现!
主要有五个方面:
一..HTML页面转UTF-8编码问题
二.PHP页面转UTF-8编码问题
三.MYSQL数据库使用UTF-8编码的问题
四.JS相关的UTF-8编码问题
五.FLASH相关的UTF-8编码问题html
一.HTML页面转UTF-8编码问题mysql
1.在后,之间有中文字符的话,显示的标题有多是乱码!
2.html文件编码问题:
点击编辑器的菜单:“文件”->“另存为”,能够看到当前文件的编码,确保文件编码为:UTF-8,若是是ANSI,须要将编码改为:UTF-8。
3.HTML文件头BOM问题:
将文件从其余的编码转换成UTF-8编码时,有时候会在文件的最开始加上一个BOM标签,在个BOM标签可能会致使浏览器在显示中文的时候出现乱码。
删除这个BOM标签的方法:
1.能够用Dreamweaver打开文件,并从新保存,便可以去除BOM标签!
2.能够用EditPlus打开文件,并在菜单“首选项”->“文件”->"UTF-8标识",设置为:“老是删除签名”,而后保存文件,便可以去除BOM标签!
4.WEB服务器UTF-8编码问题:
若是你按以上所列的步骤作了,仍是有中文乱码问题,请检查你的所使用的WEB服务器的编码问题
若是你使用的是Apache,请将配置文件里的:charset 设成:utf-8(这里仅列出方法,具体格式请参考apache的配置文件)。
若是你使用的是Nginx,请将nginx.conf里的:charset 设成 utf-8,具体找到 "charset gb2312;"或者相似的语句,改为:"charset utf-8;”。nginx
二.PHP页面转UTF-8编码问题sql
1.在代码开始出加入一行:
header("Content-Type: text/html;charset=utf-8");
2.PHP文件编码问题
点击编辑器的菜单:“文件”->“另存为”,能够看到当前文件的编码,确保文件编码为:UTF-8,若是是ANSI,须要将编码改为:UTF-8。
3.PHP文件头BOM问题:
PHP文件必定不能够有BOM标签,不然,会出现session不能使用的状况,并有相似的提示:
Warning: session_start() [function.session-start]: Cannot send session cache limiter - headers already sent
这是由于,在执行session_start() 的时候,整个页面不能有输出,可是当因为前PHP页面存在BOM标签,PHP把这个BOM标签当成是输出了,因此就出错了!
因此PHP页面必定要删除BOM标签
删除这个BOM标签的方法:
1.能够用Dreamweaver打开文件,并从新保存,便可以去除BOM标签!
2.能够用EditPlus打开文件,并在菜单“首选项”->“文件”->"UTF-8标识",设置为:“老是删除签名”,而后保存文件,便可以去除BOM标签!
4.PHP以附件形式保存文件的时候,UTF-8编码问题:
PHP以附件形式保存文件,文件名必须是GB2312编码,不然,若是文件名中有中文的话,将是显示乱码:
若是你的PHP自己是UTF-8编码格式的文件,须要将文件名变量由UTF-8转成GB2312:
iconv("UTF-8", "GB2312", "$filename");
5.截断显示文章标题时,出现乱码或者“?”问号的问题:
通常文章标题很长的时候,会显示一部分标题,会对文章标题进行截断,因为一个UTF-8编码格式的中文字符会占用3个字符宽度,截取标题的时候,有时会只截取到一个中文字符的1个字符或2字符宽度,没截取完整,将出现乱码或“?”问号的状况,用下面的函数截取标题,就不会有问题:数据库
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
|
function
get_brief_str(
$str
,
$max_length
)
{
echo
strlen
(
$str
) ."
";
if
(
strlen
(
$str
) >
$max_length
)
{
$check_num
= 0;
for
(
$i
=0;
$i
<
$max_length
;
$i
++)
{
if
(ord(
$str
[
$i
]) > 128)
$check_num
++;
}
if
(
$check_num
% 3 == 0)
$str
=
substr
(
$str
, 0,
$max_length
).
"..."
;
else
if
(
$check_num
% 3 == 1)
$str
=
substr
(
$str
, 0,
$max_length
+ 2).
"..."
;
else
if
(
$check_num
% 3 == 2)
$str
=
substr
(
$str
, 0,
$max_length
+ 1).
"..."
;
}
return
$str
;
}
|
三.MYSQL数据库使用UTF-8编码的问题
1.用phpmyadmin建立数据库和数据表
建立数据库的时候,请将“整理”设置为:“utf8_general_ci”或执行语句:apache
CREATE DATABASE `dbname` DEFAULT CHARACTER SET utf8 COLLATE utf8_general_ci;浏览器
建立数据表的时候:若是是该字段是存放中文的话,则须要将“整理”设置为:“utf8_general_ci”,
若是该字段是存放英文或数字的话,默认就能够了。
相应的SQL语句,例如:服务器
1
2
3
4
5
|
CREATE
TABLE
`test` (
`id`
INT
NOT
NULL
,
`
name
`
VARCHAR
( 10 )
CHARACTER
SET
utf8
COLLATE
utf8_general_ci
NOT
NULL
,
PRIMARY
KEY
( `id` )
) ENGINE = MYISAM ;
|
2.用PHP读写数据库
在链接数据库以后:cookie
$connection = mysql_connect($host_name, $host_user, $host_pass);
加入两行:
mysql_query("set character set 'utf8'");//读库
mysql_query("set names 'utf8'");//写库
就能够正常的读写MYSQL数据库了。
四.JS相关的UTF-8编码问题
1.JS读Cookie的中文乱码问题
PHP写cookie的时候须要将中文字符进行escape编码,不然JS读到cookie中的中文字符将是乱码。
但php自己没有escape函数,咱们新写一个escape函数:
1
2
3
4
5
6
7
8
9
10
11
12
13
|
function
escape(
$str
)
{
preg_match_all(
"/[\x80-\xff].|[\x01-\x7f]+/"
,
$str
,
$r
);
$ar
=
$r
[0];
foreach
(
$ar
as
$k
=>
$v
)
{
if
(ord(
$v
[0]) < 128)
$ar
[
$k
] = rawurlencode(
$v
);
else
$ar
[
$k
] =
"%u"
.bin2hex(iconv(
"UTF-8"
,
"UCS-2"
,
$v
));
}
return
join(
""
,
$ar
);
}
|
JS读cookie的时候,用unescape解码,而后就解决cookie中有中文乱码的问题了。
2.外部JS文件UTF-8编码问题
当一个HTML页面或则PHP页面包含一个外部的JS文件时,若是HTML页面或则PHP页面是UTF-8编码格式的文件,外部的JS文件一样要转成UTF-8的文件,不然将出现,没有包含不成功,调用函数时没有反应的状况。
点击编辑器的菜单:“文件”->“另存为”,能够看到当前文件的编码,确保文件编码为:UTF-8,若是是ANSI,须要将编码改为:UTF-8。
五.FLASH相关的UTF-8编码问题
FLASH内部对全部字符串,默认都是以UTF-8处理
1.FLASH读文普通本文件(txt,html)
要将文本文件的编码存为UTF-8
点击编辑器的菜单:“文件”->“另存为”,能够看到当前文件的编码,确保文件编码为:UTF-8,若是是ANSI,须要将编码改为:UTF-8。
2.FLASH读XML文件
要将XML文件的编码存为UTF-8
点击编辑器的菜单:“文件”->“另存为”,能够看到当前文件的编码,确保文件编码为:UTF-8,若是是ANSI,须要将编码改为:UTF-8。
在XML第1行写:
<?xml version="1.0" encoding="utf-8"?>
3.FLASH读PHP返回数据
若是PHP编码自己是UTF-8的,直接echo就能够了。
若是PHP编码自己是GB2312的,能够将PHP转存成UTF-8编码格式的文件,直接echo就能够了
若是PHP编码自己是GB2312的,并且不容许改文件的编码格式,用下面的语句将字符串转换成UTF-8的编码格式
$new_str = iconv("GB2312", "UTF-8", "$str");
再echo就能够了
4.FLASH读数据库(MYSQL)的数据
FLASH要经过PHP读取数据库中的数据,PHP自己的编码不重要,关键是若是数据库的编码是GB2312的话,须要用下面的语句将字符串转换成UTF-8的编码格式。
$new_str = iconv("GB2312", "UTF-8", "$str");
5.FLASH经过PHP写数据
一句话,FLASH传过来的字符串是UTF-8格式的,要转换成相应的编码格式,再操做(写文件、写数据库、直接显示等等),仍是用iconv函数转换。
6.FLASH使用本地编码(理论上不推荐使用)
若是想让FLASH不使用UTF-8编码,而是使用本地编码。对于中国大陆地区而言,本地编码是GB2312或GBK
AS程序内,能够添加如下代码:
System.useCodepage = true;
那么FLASH内全部字符都是使用GB2312的编码了,全部导入到FLASH或者从FLASH导出的数据,都应该作相应的编码转换。
由于使用本地编码,会形成使用繁体中文地区的用户产生乱码,因此不推荐使用。
原文:http://www.jb51.net/article/74777.htm
干货:
header("Content-Type:text/html;charset=utf-8"); $keyworld="这里是UTF8字符"; $keyworld=iconv("utf-8","gb2312",$keyworld); $url = "http://www.baidu.com/wd=$keyworld"; $html = file_get_contents($url); //这里是gbk字符$html = iconv("gb2312", "utf-8//IGNORE",$html); //转化echo $html;