c++中头文件与实现文件的关系

时间 2019-11-08

标签 c++ 中头文件实现关系栏目 C&C++ 繁體版

原文原文链接

转自：http://xiangyanglai.blog.163.com/blog/static/2047252022012715103338279/linux

关于二者之前的关系,要从N年之前提及了~ long long ago,once aupon a time .......程序员

那是一个被遗忘的年代,在编译器只认识.c(.cpp))文件，而不知道.h是何物的年代。编程

那时的人们写了不少的.c(.cpp)文件，渐渐地，人们发如今不少.c(.cpp)文件中的声明语句就是相同的，但他们却不得不一个字一个字地重复地将这些内容敲入每一个.c(.cpp)文件。但更为恐怖的是，当其中一个声明有变动时，就须要检查全部的.c(.cpp)文件，并修改其中的声明,啊~简直是世界末日降临!
终于，有人（或许是一些人）再不能忍受这样的折磨，他（们）将重复的部分提取出来，放在一个新文件里,而后在须要的.c(.cpp)文件中敲入#include XXXX这样的语句。这样即便某个声明发生了变动，也再不须要处处寻找与修改了---世界仍是那么美好！
由于这个新文件，常常被放在.c(.cpp)文件的头部，因此就给它起名叫作“头文件”，扩展名是.h.
今后，编译器（实际上是预处理器）就知道世上除了.c(.cpp)文件，还有个.h的文件，以及一个叫作#include命令。windows

虽而后来又发生不少的变化，可是这样的用法一直延续至今，只是时日久远了，人们便淡忘了当年的原因罢了。
提到了头文件,就说说它的做用吧~
想到了林锐GG写的高质量C/C++编程上头文件的做用的简短描述:
（1）经过头文件来调用库功能。在不少场合，源代码不便（或不许）向用户公布，只要向用户提供头文件和二进制的库便可。用户只须要按照头文件中的接口声明来调用库功能，而没必要关心接口怎么实现的。编译器会从库中提取相应的代码。
（2）头文件能增强类型安全检查。若是某个接口被实现或被使用时，其方式与头文件中的声明不一致，编译器就会指出错误，这一简单的规则能大大减轻程序员调试、改错的负担。数组

预处理是编译器的前驱,做用是把存储在不一样文件里的程序模块集成为一个完整的源程序.
#include自己只是一个简单的文件包含预处理命令,即为把include的后面文件放到这条命令这里,除此以外,没有其它的用处(至少我也样认为).安全

我对乾坤一笑兄的观点,十分赞同,基础的东东必定要弄明白.
我下面就乾坤一笑兄的例子作讲,完备他的一些让人疑惑不解的时候~数据结构

例子:函数

//a.h
void foo();


//a.c
#include "a.h"  //个人问题出来了：这句话是要，仍是不要？
void foo()
{
    return;
}

//main.c
#include "a.h"
int main(int argc, char *argv[])
{
   foo(); 
 　return 0;
}

针对上面的代码，请回答三个问题：
a.c 中的 #include "a.h" 这句话是否是多余的？
1.为何常常见 xx.c 里面 include 对应的 xx.h？
2.若是 a.c 中不写，那么编译器是否是会自动把 .h 文件里面的东西跟同名的 .c 文件绑定在一块儿？
3.第三个问题我给他改了一下:若是 a.c 中不写include<>，那么编译器是否是会自动把 .h 文件里面的东西跟同名的.c文件绑定在一块儿？优化

下面是乾坤一笑的原话:spa

从C编译器角度看，.h和.c皆是浮云，就是更名为.txt、.doc也没有大的分别。换句话说，就是.h和.c没啥必然联系。.h中通常放的是同名.c文件中定义的变量、数组、函数的声明，须要让.c外部使用的声明。这个声明有啥用？只是让须要用这些声明的地方方便引用。由于 #include "xx.h" 这个宏其实际意思就是把当前这一行删掉，把 xx.h 中的内容原封不动的插入在当前行的位置。因为想写这些函数声明的地方很是多（每个调用 xx.c 中函数的地方，都要在使用前声明一会儿），因此用 #include "xx.h" 这个宏就简化了许多行代码——让预处理器本身替换好了。也就是说，xx.h 其实只是让须要写 xx.c 中函数声明的地方调用（能够少写几行字），至于 include 这个 .h 文件是谁，是 .h 仍是 .c，仍是与这个 .h 同名的 .c，都没有任何须然关系。
这样你可能会说：啊？那我平时只想调用 xx.c 中的某个函数，却 include了 xx.h 文件，岂不是宏替换后出现了不少无用的声明？没错，确实引入了不少垃圾，可是它却省了你很多笔墨，而且整个版面也看起来清爽的多。鱼与熊掌不可得兼，就是这个道理。反正多些声明（.h通常只用来放声明，而放不定义，参见拙著 “过马路，左右看”）也无害处，又不会影响编译，何乐而不为呢？
翻回头再看上面的3个问题，很好解答了吧？
它的解答以下:

答：1.不必定。这个例子中显然是多余的。可是若是.c中的函数也须要调用同个.c中的其它函数，那么这个.c每每会include同名的.h，这样就不须要为声明和调用顺序而发愁了（C语言要求使用以前必须声明，而include同名.h通常会放在.c的开头）。有不少工程甚至把这种写法约定为代码规范，以规范出清晰的代码来。
2.答：1中已经回答过了。
3.答：不会。问这个问题的人绝对是概念不清，要不就是想混水摸鱼。很是讨厌的是中国的不少考试出的都是这种烂题，生怕别人有个清楚的概念了，绝对要把考生搞晕。

over!

在此里要明确一点,编译器是按照编译单元进行编译的,所谓的编译单元,是指一个.c文件以及它所include的全部.h文件.最直观的理解就是一个文件,一个工程中能够包含不少文件,其中有一个程序的入口点,即咱们一般所说的main()函数(固然也能够没有这个函数,程序照样能启动,详细见个人 blog中).在没有这个程序入口点的状况下,编译单元只生成目标文件object file(.o文件,windows下叫作.obj).

这个例子中总共包含了二个编译单元,分别是a.c,main.c,按照我所说的,在编译阶段只是生成各自的.o文件.这个阶段不和其它的文件发生任何的关系.
而include这个预处理指令发生在预处理阶段(早先编译阶段,只是编译器的一个前驱处理程序).

.h .c不见得是浮云,脱离了编译器谈这些没有任何的意义,抛开更深层次的这些,好比说,OS如何启动这个文件,PE结构(linux 下为elf)等等
编译器首先要识别这个文件才可能去编译它,这是前提.若是你改了它的扩展名那么你的编译器还能认识它吗~上升到一个更高的层次上看待这个问题,XX兄说的也不错~我想XX兄说的意思就是二者不可由于名字相同就认为二者有什么关系,名字是能够随便的~
二者之间的联系,我在前面说过了,是因为历史的缘由形成的,再加上人的习惯,我想谁也不想多去记那么多文件名吧.(拿我举个例子,一个数
据表若是多于30个字段,我就觉得头大了,如今弄的表有的多达上百个字段,真但愿那位高人研究出什么好的方法来~,也让咱们的世界美好一些~)

乾坤一笑的第三个问题颇有表明性,屡次在网上看到,如今的编译器绝对没有那么智能,并且也没有必须那么作.下面咱们主要聊聊编译器的处理过程.(我想初学者有疑问的正在于此,便是对于编译过程.h .c(.cpp)的变化不太了解,)

下面我说举个简单的例子来聊聊~
例子以下:

//a.h
class   A
{
pubic:
      int   f(int   t);
};

//a.cpp
#include   "a.h"
int   A::f(int   t)
{
    return   t;
}

//main.cpp
#include   "a.h"
void   main()
{
      A   a;
      a.f(3);
}

在预处理阶段,预处理器看到#include "文件名"就把这个文件读进来,好比它编译main.cpp，看到#include "a.h"，它就把a.h的内容读进来，它知道了，有一类A，包含一个成员函数f，这个函数接受一个int型的参数，返回一个int型的值。再往下编译很容易就把A a这行读懂了，它知道是要拿A这个类在栈上生成一个对象。再往下，它知道了下面要调用A的成员函数f了，参数是3，因为它知道这个函数要一个整形数用参数，这个3正好匹配，那就正好把它放到栈上，生成一条调用f(int)函数的指令（通常多是一句call），至于这个f(int)函数到底在哪里，它不知道，它留着空，连接时再解决。它还知道f(int)函数要返回一个int，因此也许它也为这一点作好了准备（在例子中，咱们没用这个返回值，也许它就不处理）。再往下到文件末尾了main.cpp编译好了，生成了main.obj。整个编译过程当中根本就不须要知道a.cpp的内容。
同理，编译器再编译a.cpp，把f()函数编译好，编译a.cpp时，它也不用管别的，把f()编译好就好了。生成了a.obj。
最后一步就是连接的阶段了，连接器把项目中全部.cpp生成的全部.obj连接起来，
在这一步中，它就明确了f(int)函数的实现所在的地址，把main.obj中空着的这个地址位置填上正确的地址。最终生成了可执行文件main.exe。

明白了吗?不明白那就多说几句了,咱们在学编译原理的时候都知道,编译器是分阶段进行的,每个阶段将源程序从一种表示转换成另外一种表示,通常状况下都进行以下顺序:源程序->词法分器->语法分析器->语义分析器->中间代码生成器->代码优化器->代码生成器->目标程序.
其中这中间6项活动都要涉及的两项主要活动是:符号管理器与错误处理器.
归根缘由,这里有一个叫作符号表的东东在里面让你着魔同样不明白,其实符号表是一个数据结构.编译器的基本一项功能就是要记录源程序中使用的标识符并收集与每一个标识符相关的各类属性信息.属性信息代表了该标识符的存储位置/类型/做用域(在那个阶段有效)等信息,通俗的说一下就是,当编译器看到一个符号声明时,例如你的函数名它就会把它放到这个符号表中去登记一下~符号表里存放着你的函数的入口地址,参数个数,返回信息等等一堆东西~而在联接阶段主要是处理工程中的符号表与调用对应处理关系,即咱们一般所说的解引用.
通过前面的,不知明白与否?

最后引用一下XXX兄的结尾三点:搞清楚语法和概念说易也易，说难也难。窍门有三点：1.不要晕着头工做，要抽空多思考思考，多看看书； 2.看书要看好书，问人要问强人。烂书和烂人都会给你一个错误的概念，误导你； 3.勤能补拙是良训，一分辛苦一分才；