Linux下iconv转换字符集

在windows下编辑好了SQL执行脚本,可是传到linux上执行时报错,显示有不识别的字符。这须要进行字符集的转换。我通常是用iconv进行字符的边编码转换。可是此次执行时报出以下错误:iconv: 未知 2 处的非法输入序列linux

上网找到以下说明资料:windows

编码转换的时候,若是你的源格式设定为 GB2312 的话,并且在转换成 UTF-8 的时候,发现程序会报“illegal input sequence at position xxxx”的错误。这是因为你以前的作的假定有问题。GB2312 是国标里面一个最小也是最先的中文编码标准。其中,只涵盖了 6,763 个汉字。因此你须要转换的文件的原始的格式可能并非 GB2312 编码。这个时候,你能够用 GB18030 作为源格式来进行转换。GB18030 是最新的国家标准,包含了 27,564 个汉字,并且向下兼容 GB2312 和 GBK。ide

假定的字符集指定,上述状况还能够在iconv中加入 -c 选项,忽略无效的字符,也可转换成功。编码

附iconv的用法:code

iconv命令用于转换指定文件的编码,默认输出到标准输出设备,亦可指定输出文件。utf-8

用法:iconv [选项...] [文件...]input

有以下选项可用:it

输入/输出格式规范:io

-f, --from-code=名称 原始文本编码class

-t, --to-code=名称 输出编码

信息:

-l, --list 列举全部已知的字符集

输出控制:

-c 从输出中忽略无效的字符

-o, --output=FILE 输出文件

-s, --silent 关闭警告

--verbose 打印进度信息

--help 给出该系统求助列表

--usage 给出简要的用法信息

-V, --version 打印程序版本号

例子:

iconv -f utf-8 -t gb2312 aaa.txt >bbb.txt

这个命令读取aaa.txt文件,从utf-8编码转换为gb2312编码,其输出定向到bbb.txt文件。

相关文章
相关标签/搜索