[perl]Wide character in print报错

用perl写文本处理程序,或者写服务器端脚本的时候,经常会遇到“Wide character in print” 的<p>警告或者错误。<p> 这是由于在程序中处理中文等宽字符时,perl不能识别要处理的内容。<p> 首先要知道perl只能处理两种编码:ascii码和utf-8。ascii码是不多的,像中文、日文、韩文等字符<p>要想能被perl处理,只能用 utf-8编码方式。字符串在perl内部的存储格式以下图:<p>服务器

当flag是1的时候,perl就会把那个字符串当作utf-8编码的字符来处理;若是是0,perl就不能认知字<p>符串中除了 ascii码以外的字符,这个时候,就会报出“Wide character in print”的警告或者<p>错误。<p> 举个例子,你要程序中处理‘当历史成为历史’这个字符串,若是你的程序文件是utf-8编码的话,<p>通常状况下直接处理就好了,由于这 时字符串的utf8-flag是打开的。若是你的程序文件是<p>gb2312的话,那么你就须要把那个字符串的utf8-flag打开。可是,通常还会有这样 的问题,<p>由于这个字符串是gb2312编码的,因此你要作两件事情:将字符串的编码转为utf-8和打开<p>utf8-flag。<p> use Encode;<p> use strict;<p> my $str = "当历史成为历史";<p> Encode::_utf8_on($str);<p> print $str. "\n";<p> Encode::_utf8_off($str);<p> print $str. "\n";<p> 将上面的这段程序存到文件里,试图运行的时候就会报错:Wide character in print at test.pl line <p>6。这就是由于utf8-flag被关闭,perl不能识别字符串。<p> 固然,在每一个处理宽字符的地方加上Encode::_utf8_on函数确实是个解决办法。可是通常来讲,在<p>每一个地方都加上这样的函 数,既在编写程序的时候麻烦,维护的时候更麻烦。<p> 这里还有一个更好的办法:在程序文件的头部加上如下内容<p> use utf8;<p> binmode(STDIN, ':encoding(utf8)');<p> binmode(STDOUT, ':encoding(utf8)');<p> binmode(STDERR, ':encoding(utf8)');<p>ide

相关文章
相关标签/搜索