linux 下中文文件乱码问题解决

常常遇到:windows下经过xftp上传到linux服务器中的中文名文件出现乱码的状况。linux

业务场景:有一个公共的下载目录,里面可能会有中文名的文件,在web端显示的时候出现乱码,致使下载出错的问题。web

首先保证linux的env设置了LANG=en_US.UTF-8 windows

一、能够尝试在使用xftp上传问价你的时候,指定上传过程当中的编码。如图:服务器

通常来讲,这样修改会解决乱码的问题。app

但若是在Shell中(或经过http访问),还是乱码……工具

二、使用convmv 或 iconv测试

仍然乱码的缘由在于,Windows 的文件名中文编码默认为GBK,压缩或者上传后,文件名还会是GBK编码,而Linux中默认文件名编码为UTF8,因为编码不一致因此致使了文件名乱码的问题,解决这个问题须要对文件名进行转码。编码

convmv和 iconv 都是linux下的更改文件编码方式的工具。code

安装blog

使用root用户安装

#安装iconv
yum install iconv

#convmv
yum install convmv

转化文件编码

使用root用户执行命令

#iconv
iconv -f gbk -t utf-8 -o outfile  infile

-f为原来的编码方式,-t 为输出文件的编码方式, -o表示输出文件名,这利用outfile表示,最后跟上要更改编码方式的文件名sourcefile。

#convmv 转化命令 最后面跟文件目录
convmv -f gbk -t utf-8 -r --notest /u01/appinstall/

就是将/u01/appinstall/目录下原来文件名是gbk编码方式的所有改成utf-8格式的。这里 -f  后面为原来的编码方式,-t 后面是要更改成的编码方式, -r 表示这个目录下面的全部文件, –notest 表示立刻执行,而不是仅仅测试而已。

convmv经常使用命令

-r 递归处理子文件夹

–notest 真正进行操做,默认状况下是不对文件进行真实操做

–list 显示全部支持的编码

–unescap 能够作一下转义,好比把%20变成空格

-i 交互模式(询问每个转换,防止误操做)

文本内容转换 iconv

文件名转换 convmv

相关文章
相关标签/搜索