bom头怎么去除

原文:http://my.oschina.net/xianggao/blog/79694html



什么是bom头?shell


在utf-8编码文件中BOM在文件头部,占用三个字节,用来标示该文件属于utf-8编码,如今已经有不少软件识别bom头,可是还有些不能识别bom头,好比PHP就不能识别bom头,这也是用记事本编辑utf-8编码后执行就会出错的缘由了。其实UTF-8 的BOM对UFT-8没有做用,是为了支援UTF-16,UTF-32才加上的BOM,BOM签名的意思就是告诉编辑器当前文件采用何种编码,方便编辑器识别,可是BOM虽然在编辑器中不显示,可是会产生输出,就像多了一个空行。浏览器


相似WINDOWS自带的记事本等软件,在保存一个以UTF-8编码的文件时,会在文件开始的地方插入三个不可见的字符(0xEF 0xBB 0xBF,即BOM)。它是一串隐藏的字符,用于让记事本等编辑器识别这个文件是否以UTF-8编码。对于通常的文件,这样并不会产生什么麻烦。但对于 PHP来讲,BOM是个***烦。PHP并不会忽略BOM,因此在读取、包含或者引用这些文件时,会把BOM做为该文件开头正文的一部分。根据嵌入式语言的特色,这串字符将被直接执行(显示)出来。由此形成即便页面的 top padding 设置为0,也没法让整个网页紧贴浏览器顶部,由于在html一开头有这3个字符呢!最大的麻烦还不是这个。受COOKIE送出机制的限制,在这些文件开头已经有BOM的文件中,COOKIE没法送出(由于在COOKIE送出前PHP已经送出了文件头),因此登入和登出功能失效。一切依赖COOKIE、SESSION实现的功能所有无效。所以,在编辑、更改任何文本文件时,请务必使用不会乱加BOM的编辑器。Linux下的编辑器应该都没有这个问题。WINDOWS下,请勿使用记事本等编辑器。推荐的编辑器是: Editplus 2.12版本以上; EmEditor; UltraEdit(须要取消‘添加BOM’的相关选项); Dreamweaver(须要取消‘添加BOM’的相关选项) 等。对于已经添加了BOM的文件,要取消的话,能够用以上编辑器另存一次。(Editplus须要先另存为gb,再另存为UTF-8。)编辑器


去掉bom头的办法,简单的是下面两种:ide


一、editplus去BOM头的方法工具


编辑器调整为UTF8编码格式后,保存的文件前面会多出一串隐藏的字符(也便是BOM),用于编辑器识别这个文件是不是以UTF8编码。编码


运行Editplus,点击工具,选择首选项,选中文件,UTF-8标识选择 老是删除签名,spa


而后对PHP文件编辑和保存后的PHP文件就是不带BOM的了。.net


二、ultraedit去除bom头办法code


打开文件后,另存为选项的编码格式里选择(utf-8 无bom头),肯定就ok了。


三、能够用vi 杜撰几个,相关命令以下:

#设置UTF-8编码
:set fileencoding=utf-8
#添加BOM
:set bomb
#删除BOM
:set nobomb
#查询BOM
:set bomb?

四、shell命令删除

grep -r -I -l $'^\xEF\xBB\xBF' yaowan.properties.bak | xargs sed -i 's/^\xEF\xBB\xBF//g'

相关文章
相关标签/搜索