换行符的话题 -- clwu

 最近不一样的开发同事因为在代码文件中采用的 换行符 不一样,而致使了在git merge代码阶段diff操做时增长了额外的人工判断成本,php

以下图git

 回顾一下 换行符 的几种标准,来源历史就不说了,能够百度一下。spa

打开任何一个IDE都能看到相似的Code Style设置,Mac(\r) 这种机已经不生产了。unix

BUT 还有一种 “换行符”,留在文末补充中说。code

先上一张  ASCII 表,后面分析问题要用到:man asciiblog

回来讲一下咱们遇到的问题,初看起来像 图一,就是多了个^M,ci

但仔细看一下二进制格式(经过xxd能够看到二进制下的状况),就看出是能够分红两种状况的开发

状况一:就是不一样换行符的问题it

L3有^M,但L4没有^Mclass

这种状况下 相似dos2unix 或者tr 命令就能够处理了

状况二:不止是不一样换行符,还多了一个\r (0x0D)

这种状况下 惟有用sed处理了。

 

最后,咱们统一为Unix换行符(\n),写个脚本把全部的\r(0x0D)都删除了(无论是状况一仍是状况二),再推回git。

find . -type f -name "*.php" ! -path "./.*" -exec sed -i 's/\x0D//g' {} \;

 

修正原有的代码文件问题后,统一 一下 git 的配置:

#提交时转换为LF,检出时转换为CRLF
git config --global core.autocrlf true 
#拒绝提交包含混合换行符的文件
git config --global core.safecrlf true   

 

================= 补充 =================

不知道你们有没有看到 ASCII 表上第一个 NUL 字符,常见的用法是 find -print0 ... | xargs -0 .... 、perl -0 ....

伪换行符一个。

相关文章
相关标签/搜索