转自:http://www.cnblogs.com/dartagnan/archive/2010/12/14/2003499.htmlhtml
“回车”(carriage return)VS “换行”(line feed)
在计算机尚未出现以前,有一种叫作电传打字机(Teletype Model 33)的玩意,每秒钟能够打10个字符。可是它有一个问题,就是打完一行换行的时候,要用去0.2秒,正好能够打两个字符。要是在这0.2秒里面,又有新的字符传过来,那么这个字符将丢失。
因而,研制人员想了个办法解决这个问题,就是在每行后面加两个表示结束的字符。一个叫作“回车”,告诉打字机把打印头定位在左边界;另外一个叫作“换行”,告诉打字机把纸向下移一行。
这就是“换行”和“回车”的来历,从它们的英语名字上也能够看出一二。
后来,计算机发明了,这两个概念也就被般到了计算机上。那时,存储器很贵,一些科学家认为在每行结尾加两个字符太浪费了,加一个就能够。因而,就出现了分歧。
Unix系统里,每行结尾只有“<换行>”,即“\n”;Windows系统里面,每行结尾是“<换行><回车>”,即“\n\r”;Mac系统里,每行结尾是“<回车>”。一个直接后果是,Unix/Mac系统下的文件在Windows里打开的话,全部文字会变成一行;而Windows里的文件在Unix/Mac下打开的话,在每行的结尾可能会多出一个^M符号。
c语言编程时(windows系统)
\r 就是return 回到 本行 行首 这就会把这一行之前的输出 覆盖掉
如:
int main() {
cout << "hahaha" << "\r" << "xixi" ;
}
最后只显示 xixi 而 hahaha 背覆盖了
\n 是回车+换行 把光标 先移到 行首 而后换到下一行 也就是 下一行的行首拉
int main() {
cout << "hahaha" << "\n" << "xixi" ;
}
linux
所谓回车、换行这些控制符,都是从之前的电传打字机的控制命令继承下来的。回车就是打印头复位,换行就是走纸。Dos/Windows和Unix/Linux对回车、换行的理解差异就在于Dos/Windows认为0d=0d0a=0a,而Unix/Linux坚持沿用电传打字机的工做方式(这个实际上是比较正确的)。编程
因此在回车换行在Linux中是"0d",在Windows中是"0d0a".咱们能够经过下面的程序测试一下:windows
上面的红色字体估计是原做者笔误,linux的换行符是\n,Ascii码是0a,而不是0d。至于要测试的话,可使用od -t x1 文件名去查看。app
而\r在linux下的vi看到的是蓝色的^M,是使用ctrl+m+v输出的,能够在命令模式中使用编辑器
:%s/^M//g删除,或者使用dos2unix去掉。工具
#define MAX_LENGTH 15536
#include
#include
using namespace std;
string delEnter(const string src) // 过滤掉串中的回车换行符
{
string des;
for(int i = 0; i < src.length(); i++)
{
char tempChar = src[i];
if( tempChar!=10 && tempChar!=13)
des.append(1,tempChar);
}
return des;
}测试
int main()
{
char html[MAX_LENGTH] = "";
FILE *fp = fopen("Linux.txt", "rb"); //FILE *fp = fopen("Windows.txt", "rb");
char buf[16384];
while (fgets(buf, 16384, fp))
strcat(html, buf);
strcat(html,"\0");
string s(html);
cout << "string is: " << s << endl;;
cout << "The size of string is: " << s.length() << endl;
cout << "after del string is: " << delEnter(s) << endl;
cout << "The size of string is: " << delEnter(s).length() << endl;字体
fclose(fp);
return 0;
}spa
程序中文件Linux.txt是从Linux系统中copy过来的。
咱们能够经过这个程序观察到,经过过滤掉回车换行符,Linux文件中的字符数的减小等于其行数,而
Windows中等于其行数的两倍。但有一个问题要注意,程序中行:
FILE *fp = fopen("Linux.txt", "rb");
不能写成:
FILE *fp = fopen("Linux.txt", "r");
后者默认的文件打开方式是文本方式,这时系统自动对文本进行了转换,就不能获得上述的结论。
不过你们能够在Windows下用工具HexWorkShop,在Linux下用命令hexdump直接观察具体的二进制代码,更为直接。
原文地址:http://noding.bokee.com/3867119.html
关于回车和换行的历史。
Dos和windows采用回车+换行CR/LF表示下一行,
而UNIX/Linux采用换行符LF表示下一行,
苹果机(MAC OS系统)则采用回车符CR表示下一行.
CR用符号'\r'表示, 十进制ASCII代码是13, 十六进制代码为0x0D;
LF使用'\n'符号表示, ASCII代码是10, 十六制为0x0A. 因此Windows平台上换行在文本文件中是使用 0d 0a 两个字节表示, 而UNIX和苹果平台上换行则是使用0a或0d一个字节表示.
通常操做系统上的运行库会自动决定文本文件的换行格式. 如一个程序在windows上运行就生成CR/LF换行格式的文本文件,而在Linux上运行就生成LF格式换行的文本文件. 在一个平台上使用另外一种换行符的文件文件可能会带来意想不到的问题, 特别是在编辑程序代码时. 有时候代码在编辑器中显示正常, 但在编辑时却会由于换行符问题而出错. 不少文本/代码编辑器带有换行符转换功能, 使用这个功能能够将文本文件中的换行符在不一样格式单互换.
在不一样平台间使用FTP软件传送文件时, 在ascii文本模式传输模式下, 一些FTP客户端程序会自动对换行格式进行转换. 通过这种传输的文件字节数可能会发生变化. 若是你不想ftp修改原文件, 可使用bin模式(二进制模式)传输文本.