[perl]Wide character in print报错

时间 2019-11-21

标签 perl wide character print 报错栏目 Perl 繁體版

原文原文链接

用perl写文本处理程序，或者写服务器端脚本的时候，经常会遇到“Wide character in print” 的警告或者错误。 这是由于在程序中处理中文等宽字符时，perl不能识别要处理的内容。 首先要知道perl只能处理两种编码：ascii码和utf-8。ascii码是不多的，像中文、日文、韩文等字符要想能被perl处理，只能用 utf-8编码方式。字符串在perl内部的存储格式以下图：服务器

当flag是1的时候，perl就会把那个字符串当作utf-8编码的字符来处理；若是是0，perl就不能认知字符串中除了 ascii码以外的字符，这个时候，就会报出“Wide character in print”的警告或者错误。 举个例子，你要程序中处理‘当历史成为历史’这个字符串，若是你的程序文件是utf-8编码的话，通常状况下直接处理就好了，由于这时字符串的utf8-flag是打开的。若是你的程序文件是gb2312的话，那么你就须要把那个字符串的utf8-flag打开。可是，通常还会有这样的问题，由于这个字符串是gb2312编码的，因此你要作两件事情：将字符串的编码转为utf-8和打开utf8-flag。 use Encode; use strict; my $str = "当历史成为历史"; Encode::_utf8_on($str); print $str. "\n"; Encode::_utf8_off($str); print $str. "\n"; 将上面的这段程序存到文件里，试图运行的时候就会报错：Wide character in print at test.pl line 6。这就是由于utf8-flag被关闭，perl不能识别字符串。 固然，在每一个处理宽字符的地方加上Encode::_utf8_on函数确实是个解决办法。可是通常来讲，在每一个地方都加上这样的函数，既在编写程序的时候麻烦，维护的时候更麻烦。 这里还有一个更好的办法：在程序文件的头部加上如下内容 use utf8; binmode(STDIN, ':encoding(utf8)'); binmode(STDOUT, ':encoding(utf8)'); binmode(STDERR, ':encoding(utf8)');ide