高质量C++/C编程指南ios
文件状态c++ [ ] 草稿文件程序员 [√] 正式文件面试 [ ] 更改正式文件算法 |
文件标识:编程 |
|
当前版本:数组 |
1.0安全 |
|
做 者:网络 |
林锐 博士数据结构 |
|
完成日期: |
2001年7月24日 |
版 本 历 史
版本/状态 |
做者 |
参与者 |
起止日期 |
备注 |
V 0.9 草稿文件 |
林锐
|
|
2001-7-1至 2001-7-18 |
林锐起草 |
V 1.0 正式文件 |
林锐
|
|
2001-7-18至 2001-7-24 |
朱洪海审查V 0.9, 林锐修正草稿中的错误 |
|
|
|
|
|
|
|
|
|
|
目 录
3.3 简单的Unix应用程序命名规则................................................................................... 25
7.8 有了malloc/free为何还要new/delete ?.............................................................. 52
第9章 类的构造函数、析构函数与赋值函数................................................................... 69
9.4 示例:类String的构造函数与析构函数...................................................................... 72
9.5 不要轻视拷贝构造函数与赋值函数.............................................................................. 73
9.6 示例:类String的拷贝构造函数与赋值函数............................................................... 73
9.7 偷懒的办法处理拷贝构造函数与赋值函数.................................................................... 75
9.8 如何在派生类中实现类的基本函数.............................................................................. 75
附录C :C++/C试题的答案与评分标准........................................................................... 97
软件质量是被大多数程序员挂在嘴上而不是放在心上的东西!
除了彻底外行和真正的编程高手外,初读本书,你最早的感觉将是惊慌:“哇!我之前捏造的C++/C程序怎么会有那么多的毛病?”
别难过,做者只不过比你早几年、多几回惊慌而已。
请花一两个小时认真阅读这本百页经书,你将会获益匪浅,这是前面N-1个读者的建议。
1、编程老手与高手的误区
自从计算机问世以来,程序设计就成了使人羡慕的职业,程序员在受人宠爱以后容易发展成为毛病特多却常能自我臭美的群体。
现在在Internet上流传的“真正”的程序员听说是这样的:
(1) 真正的程序员没有进度表,只有讨好领导的马屁精才有进度表,真正的程序员会让领导提心吊胆。
(2) 真正的程序员不写使用说明书,用户应当本身去猜测程序的功能。
(3) 真正的程序员几乎不写代码的注释,若是注释很难写,它理所固然也很难读。
(4) 真正的程序员不画流程图,原始人和文盲才会干这事。
(5) 真正的程序员不看参考手册,新手和胆小鬼才会看。
(6) 真正的程序员不写文档也不须要文档,只有看不懂程序的笨蛋才用文档。
(7) 真正的程序员认为本身比用户更明白用户须要什么。
(8) 真正的程序员不接受团队开发的理念,除非他本身是头头。
(9) 真正的程序员的程序不会在第一次就正确运行,可是他们愿意守着机器进行若干个30小时的调试改错。
(10)真正的程序员不会在上午9:00到下午5:00之间工做,若是你看到他在上午9:00工做,这代表他从昨晚一直干到如今。
……
具有上述特征越多,越显得水平高,资格老。因此别奇怪,程序员的不少缺点居然能够被看成优势来欣赏。就象在武侠小说中,那些独来独往、不受约束且带点邪气的高手最使人崇拜。我曾经也这样信奉,而且但愿本身成为那样的“真正”的程序员,结果没有获得好下场。
我从读大学到博士毕业十年来一直勤奋好学,累计编写了数十万行C++/C代码。有这样的苦劳和疲劳,我应该称得上是编程老手了吧?
我开发的软件都与科研相关(集成电路CAD和3D图形学领域),动辄数万行程序,技术复杂,难度颇高。这些软件频频获奖,有一个软件得到首届中国大学生电脑大赛软件展现一等奖。在1995年开发的一套图形软件库到2000年还有人买。罗列出这些“业绩”,能够说明我算得上是编程高手了吧?
惋惜这种我的感受不等于事实。
读博期间我曾用一年时间开发了一个近10万行C++代码的3D图形软件产品,我心里得意表面谦虚地向一位真正的软件高手请教。他虽然从未涉足过3D图形领域,却在几十分钟内指出该软件多处重大设计错误。让人感受那套软件是用纸糊的华丽衣服,扯一下掉一块,戳一下破个洞。我目瞪口呆地意识到这套软件毫无实用价值,一年的心血白化了,而且害死了本身的软件公司。
人的顿悟一般发生在最心痛的时刻,在沮丧和心痛以后,我做了深入检讨,“面壁”半年,从新温习软件设计的基础知识。补修“内功”以后,又以为腰板硬了起来。博士毕业前半年,我曾到微软中国研究院找工做,接受微软公司一位资深软件工程师的面试。他让我写函数strcpy的代码。
太容易了吧?
错!
这么一个小不点的函数,他从三个方面考查:
(1)编程风格;
(2)出错处理;
(3)算法复杂度分析(用于提升性能)。
在大学里历来没有人如此严格地考查过个人程序。我化了半个小时,修改了数次,他还不尽满意,让我回家好好琢磨。我精神抖擞地进“考场”,大汗淋漓地出“考场”。这“高手”当得也太窝囊了。我又好好地检讨了一次。
我把检讨后的心得体会写成文章放在网上传阅,引发了很多软件开发人员的共鸣。我所以有幸和国产大型IT企业如华为、上海贝尔、中兴等公司的同志们普遍交流。你们认为提升质量与生产率是软件工程要解决的核心问题。高质量程序设计是很是重要的环节,毕竟软件是靠编程来实现的。
咱们心目中的老手们和高手们可否编写出高质量的程序来?
不见得都能!
就个人经历与阅从来看,国内大学的计算机教育压根就没有灌输高质量程序设计的观念,教师们和学生们也不多自觉关心软件的质量。勤奋好学的程序员长期在低质量的程序堆中滚爬,吃尽苦头以后才有一些心得体会,长进极慢,我就是一例。
如今国内IT企业拥有学士、硕士、博士文凭的软件开发人员比比皆是,但他们在接受大学教育时就“先天不足”,岂能一到企业就忽然实现质的飞跃。试问有多少软件开发人员对正确性、健壮性、可靠性、效率、易用性、可读性(可理解性)、可扩展性、可复用性、兼容性、可移植性等质量属性了如指掌?而且能在实践中运用自如?。“高质量”可不是干活当心点就能实现的!
咱们有充分的理由疑虑:
(1)编程老手可能会长期用隐含错误的方式编程(习惯成天然),发现毛病后都不肯相信那是真的!
(2)编程高手能够在某一领域写出极有水平的代码,但未必能从全局把握软件质量的方方面面。
事实证实如此。我到上海贝尔工做一年来,陆续面试或测试过近百名“新”“老”程序员的编程技能,质量合格率大约是10%。不多有人可以写出彻底符合质量要求的if语句,不少程序员对指针、内存管理只知其一;不知其二,……。
领导们不敢相信这是真的。我作过现场试验:有一次部门新进14名硕士生,在开欢迎会以前对他们进行“C++/C编程技能”摸底考试。我问你们试题难不难?全部的人都回答不难。结果没有一我的及格,有半数人得零分。竞争对手公司的朋友们也作过试验,一样一败涂地。
真的不是我“心狠手辣”或者要求太高,而是不少软件开发人员对本身的要求不够高。
要知道华为、上海贝尔、中兴等公司的员工素质在国内IT企业中是比较前列的,假若他们的编程质量都如此差的话,咱们怎么敢指望中小公司拿出高质量的软件呢?连程序都编很差,还谈什么振兴民族软件产业,岂不胡扯。
我打算定义编程老手和编程高手,请您别见笑。
定义1:能长期稳定地编写出高质量程序的程序员称为编程老手。
定义2:能长期稳定地编写出高难度、高质量程序的程序员称为编程高手。
根据上述定义,立刻获得第一推论:我既不是高手也算不上是老手。
在写此书前,我阅读了很多程序设计方面的英文著做,越看越羞惭。由于发现本身连编程基本技能都未能全面掌握,顶多算是二流水平,还好意思谈什么老手和高手。但愿和我同样在国内土生土长的程序员朋友们可以作到:
(1)知错就改;
(2)常常温故而知新;
(3)坚持学习,每天向上。
2、本书导读
首先请作附录B的C++/C试题(不要看答案),考查本身的编程质量究竟如何。而后参照答案严格打分。
(1)若是你只得了几十分,请不要声张,也不要太难过。编程质量差每每是因为不良习惯形成的,与人的智力、能力没有多大关系,仍是有药可救的。成绩越差,能够进步的空间就越大,中国不就是在落后中赶超发达资本主义国家吗?只要你能下决心改掉不良的编程习惯,第二次考试就能及格了。
(2)若是你考及格了,代表你的技术基础不错,但愿你能虚心学习、不断进步。若是你尚未找到合适的工做单位,不妨到上海贝尔试一试。
(3)若是你考出85分以上的好成绩,你有义务和资格为你所在的团队做“C++/C编程”培训。但愿你能和咱们多多交流、相互促进。半年前我曾经发现一颗好苗子,就把他挖到咱们小组来。
(4)若是你在没有任何提示的状况下考了满分,但愿你能收我作你的徒弟。
编程考试结束后,请阅读本书的正文。
本书第一章至第六章主要论述C++/C编程风格。难度不高,可是细节比较多。别小看了,提升质量就是要从这些点点滴滴作起。世上不存在最好的编程风格,一切因需求而定。团队开发讲究风格一致,若是制定了你们承认的编程风格,那么全部组员都要遵照。若是读者以为本书的编程风格比较合你的工做,那么就采用它,不要只看不作。人在小时候说话发音不许,写字潦草,若是不改正,总有后悔的时候。编程也是一样道理。
第七章至第十一章是专题论述,技术难度比较高,看书时要积极思考。特别是第七章“内存管理”,读了并不表示懂了,懂了并不表示就能正确使用。有一位同事看了第七章后以为“野指针”写得不错,与我切磋了一把。但是过了两周,他告诉我,他忙了两天追查出一个Bug,想不到又是“野指针”出问题,只好重读第七章。
光看本书对提升编程质量是有限的,建议你们阅读本书的参考文献,那些都是经典名著。
若是你的编程质量已通过关了,不要就此知足。若是你想成为优秀的软件开发人员,建议你阅读并按照CMMI规范作事,让本身的综合水平上升一个台阶。上海贝尔的员工能够向网络应用事业部软件工程研究小组索取CMMI有关资料,最好能参加培训。
3、版权声明
本书的大部份内容取材于做者一年前的书籍手稿(还没有出版),现整理汇编成为上海贝尔网络应用事业部的一个规范化文件,同时做为培训教材。
因为C++/C编程是众所周知的技术,没有秘密可言。编程的好经验应该你们共享,咱们本身也是这么学来的。做者愿意公开本书的电子文档。
版权声明以下:
(1)读者能够任意拷贝、修改本书的内容,但不能够篡改做者及所属单位。
(2)未经做者许可,不得出版或大量印发本书。
(3)若是竞争对手公司的员工获得本书,请勿公开使用,以避免发生纠纷。
预计到2002年7月,咱们将创建切合中国国情的CMMI 3级解决方案。届时,包括本书在内的约1000页规范将严格受控。
欢迎读者对本书提出批评建议。
林锐,2001年7月
每一个C++/C程序一般分为两个文件。一个文件用于保存程序的声明(declaration),称为头文件。另外一个文件用于保存程序的实现(implementation),称为定义(definition)文件。
C++/C程序的头文件以“.h”为后缀,C程序的定义文件以“.c”为后缀,C++程序的定义文件一般以“.cpp”为后缀(也有一些系统以“.cc”或“.cxx”为后缀)。
版权和版本的声明位于头文件和定义文件的开头(参见示例1-1),主要内容有:
(1)版权信息。
(2)文件名称,标识符,摘要。
(3)当前版本号,做者/修改者,完成日期。
(4)版本历史信息。
/* * Copyright (c) 2001,上海贝尔有限公司网络应用事业部 * All rights reserved. * * 文件名称:filename.h * 文件标识:见配置管理计划书 * 摘 要:简要描述本文件的内容 * * 当前版本:1.1 * 做 者:输入做者(或修改者)名字 * 完成日期:2001年7月20日 * * 取代版本:1.0 * 原做者 :输入原做者(或修改者)名字 * 完成日期:2001年5月10日 */
|
示例1-1版权和版本的声明
头文件由三部份内容组成:
(1)头文件开头处的版权和版本声明(参见示例1-1)。
(2)预处理块。
(3)函数和类结构声明等。
假设头文件名称为graphics.h,头文件的结构参见示例1-2。
l 【规则1-2-1】为了防止头文件被重复引用,应当用ifndef/define/endif结构产生预处理块。
l 【规则1-2-2】用 #include <filename.h>格式来引用标准库的头文件(编译器将从标准库目录开始搜索)。
l 【规则1-2-3】用 #include “filename.h”格式来引用非标准库的头文件(编译器将从用户的工做目录开始搜索)。
² 【建议1-2-1】头文件中只存放“声明”而不存放“定义”
在C++ 语法中,类的成员函数能够在声明的同时被定义,而且自动成为内联函数。这虽然会带来书写上的方便,但却形成了风格不一致,弊大于利。建议将成员函数的定义与声明分开,不论该函数体有多么小。
² 【建议1-2-2】不提倡使用全局变量,尽可能不要在头文件中出现象extern int value 这类声明。
// 版权和版本声明见示例1-1,此处省略。
#ifndef GRAPHICS_H // 防止graphics.h被重复引用 #define GRAPHICS_H
#include <math.h> // 引用标准库的头文件 … #include “myheader.h” // 引用非标准库的头文件 … void Function1(…); // 全局函数声明 … class Box // 类结构声明 { … }; #endif |
示例1-2 C++/C头文件的结构
定义文件有三部份内容:
(1) 定义文件开头处的版权和版本声明(参见示例1-1)。
(2) 对一些头文件的引用。
(3) 程序的实现体(包括数据和代码)。
假设定义文件的名称为graphics.cpp,定义文件的结构参见示例1-3。
// 版权和版本声明见示例1-1,此处省略。
#include “graphics.h” // 引用头文件 …
// 全局函数的实现体 void Function1(…) { … }
// 类成员函数的实现体 void Box::Draw(…) { … } |
示例1-3 C++/C定义文件的结构
早期的编程语言如Basic、Fortran没有头文件的概念,C++/C语言的初学者虽然会用使用头文件,但经常不明其理。这里对头文件的做用略做解释:
(1)经过头文件来调用库功能。在不少场合,源代码不便(或不许)向用户公布,只要向用户提供头文件和二进制的库便可。用户只须要按照头文件中的接口声明来调用库功能,而没必要关心接口怎么实现的。编译器会从库中提取相应的代码。
(2)头文件能增强类型安全检查。若是某个接口被实现或被使用时,其方式与头文件中的声明不一致,编译器就会指出错误,这一简单的规则能大大减轻程序员调试、改错的负担。
若是一个软件的头文件数目比较多(如超过十个),一般应将头文件和定义文件分别保存于不一样的目录,以便于维护。
例如可将头文件保存于include目录,将定义文件保存于source目录(能够是多级目录)。
若是某些头文件是私有的,它不会被用户的程序直接引用,则没有必要公开其“声明”。为了增强信息隐藏,这些私有的头文件能够和定义文件存放于同一个目录。
版式虽然不会影响程序的功能,但会影响可读性。程序的版式追求清晰、美观,是程序风格的重要构成因素。
能够把程序的版式比喻为“书法”。好的“书法”可以让人对程序一目了然,看得兴致勃勃。差的程序“书法”如螃蟹爬行,让人看得索然无味,更令维护者烦恼有加。请程序员们学习程序的“书法”,弥补大学计算机教育的漏洞,实在颇有必要。
空行起着分隔程序段落的做用。空行得体(不过多也不过少)将使程序的布局更加清晰。空行不会浪费内存,虽然打印含有空行的程序是会多消耗一些纸张,可是值得。因此不要舍不得用空行。
l 【规则2-1-1】在每一个类声明以后、每一个函数定义结束以后都要加空行。参见示例2-1(a)
l 【规则2-1-2】在一个函数体内,逻揖上密切相关的语句之间不加空行,其它地方应加空行分隔。参见示例2-1(b )
// 空行 void Function1(…) { … } // 空行 void Function2(…) { … } // 空行 void Function3(…) { … }
|
// 空行 while (condition) { statement1; // 空行 if (condition) { statement2; } else { statement3; } // 空行 statement4; } |
示例2-1(a) 函数之间的空行 示例2-1(b) 函数内部的空行
l 【规则2-2-1】一行代码只作一件事情,如只定义一个变量,或只写一条语句。这样的代码容易阅读,而且方便于写注释。
l 【规则2-2-2】if、for、while、do等语句自占一行,执行语句不得紧跟其后。不论执行语句有多少都要加{}。这样能够防止书写失误。
示例2-2(a)为风格良好的代码行,示例2-2(b)为风格不良的代码行。
int width; // 宽度 int height; // 高度 int depth; // 深度 |
int width, height, depth; // 宽度高度深度
|
x = a + b; y = c + d; z = e + f; |
X = a + b; y = c + d; z = e + f;
|
if (width < height) { dosomething(); } |
if (width < height) dosomething(); |
for (initialization; condition; update) { dosomething(); } // 空行 other();
|
for (initialization; condition; update) dosomething(); other();
|
示例2-2(a) 风格良好的代码行 示例2-2(b)风格不良的代码行
² 【建议2-2-1】尽量在定义变量的同时初始化该变量(就近原则)
若是变量的引用处和其定义处相隔比较远,变量的初始化很容易被忘记。若是引用了未被初始化的变量,可能会致使程序错误。本建议能够减小隐患。例如
int width = 10; // 定义并初绐化width
int height = 10; // 定义并初绐化height
int depth = 10; //定义并初绐化depth
l 【规则2-3-1】关键字以后要留空格。象const、virtual、inline、case 等关键字以后至少要留一个空格,不然没法辨析关键字。象if、for、while等关键字以后应留一个空格再跟左括号‘(’,以突出关键字。
l 【规则2-3-2】函数名以后不要留空格,紧跟左括号‘(’,以与关键字区别。
l 【规则2-3-3】‘(’向后紧跟,‘)’、‘,’、‘;’向前紧跟,紧跟处不留空格。
l 【规则2-3-4】‘,’以后要留空格,如Function(x, y, z)。若是‘;’不是一行的结束符号,其后要留空格,如for (initialization; condition; update)。
l 【规则2-3-5】赋值操做符、比较操做符、算术操做符、逻辑操做符、位域操做符,如“=”、“+=” “>=”、“<=”、“+”、“*”、“%”、“&&”、“||”、“<<”,“^”等二元操做符的先后应当加空格。
l 【规则2-3-6】一元操做符如“!”、“~”、“++”、“--”、“&”(地址运算符)等先后不加空格。
l 【规则2-3-7】象“[]”、“.”、“->”这类操做符先后不加空格。
² 【建议2-3-1】对于表达式比较长的for语句和if语句,为了紧凑起见能够适当地去掉一些空格,如for (i=0; i<10; i++)和if ((a<=b) && (c<=d))
void Func1(int x, int y, int z); // 良好的风格 void Func1 (int x,int y,int z); // 不良的风格 |
if (year >= 2000) // 良好的风格 if(year>=2000) // 不良的风格 if ((a>=b) && (c<=d)) // 良好的风格 if(a>=b&&c<=d) // 不良的风格 |
for (i=0; i<10; i++) // 良好的风格 for(i=0;i<10;i++) // 不良的风格 for (i = 0; I < 10; i ++) // 过多的空格 |
x = a < b ? a : b; // 良好的风格 x=a<b?a:b; // 很差的风格 |
int *x = &y; // 良好的风格 int * x = & y; // 不良的风格 |
array[5] = 0; // 不要写成 array [ 5 ] = 0; a.Function(); // 不要写成 a . Function(); b->Function(); // 不要写成 b -> Function();
|
示例2-3 代码行内的空格
l 【规则2-4-1】程序的分界符‘{’和‘}’应独占一行而且位于同一列,同时与引用它们的语句左对齐。
l 【规则2-4-2】{ }以内的代码块在‘{’右边数格处左对齐。
示例2-4(a)为风格良好的对齐,示例2-4(b)为风格不良的对齐。
void Function(int x) { … // program code } |
void Function(int x){ … // program code }
|
if (condition) { … // program code } else { … // program code } |
if (condition){ … // program code } else { … // program code } |
for (initialization; condition; update) { … // program code } |
for (initialization; condition; update){ … // program code } |
While (condition) { … // program code } |
while (condition){ … // program code } |
若是出现嵌套的{},则使用缩进对齐,如: { … { … } … } |
|
示例2-4(a) 风格良好的对齐 示例2-4(b) 风格不良的对齐
l 【规则2-5-1】代码行最大长度宜控制在70至80个字符之内。代码行不要过长,不然眼睛看不过来,也不便于打印。
l 【规则2-5-2】长表达式要在低优先级操做符处拆分红新行,操做符放在新行之首(以便突出操做符)。拆分出的新行要进行适当的缩进,使排版整齐,语句可读。
if ((very_longer_variable1 >= very_longer_variable12) && (very_longer_variable3 <= very_longer_variable14) && (very_longer_variable5 <= very_longer_variable16)) { dosomething(); } |
virtual CMatrix CMultiplyMatrix (CMatrix leftMatrix, CMatrix rightMatrix);
|
for (very_longer_initialization; very_longer_condition; very_longer_update) { dosomething(); } |
示例2-5 长行的拆分
修饰符* 和 & 应该靠近数据类型仍是该靠近变量名,是个有争议的活题。
若将修饰符 * 靠近数据类型,例如:int* x; 从语义上讲此写法比较直观,即x是int 类型的指针。
上述写法的弊端是容易引发误解,例如:int* x, y; 此处y容易被误解为指针变量。虽然将x和y分行定义能够避免误解,但并非人人都愿意这样作。
l 【规则2-6-1】应当将修饰符 * 和 &紧靠变量名
例如:
char *name;
int *x, y; // 此处y不会被误解为指针
C语言的注释符为“/*…*/”。C++语言中,程序块的注释常采用“/*…*/”,行注释通常采用“//…”。注释一般用于:
(1)版本、版权声明;
(2)函数接口说明;
(3)重要的代码行或段落提示。
虽然注释有助于理解代码,但注意不可过多地使用注释。参见示例2-6。
l 【规则2-7-1】注释是对代码的“提示”,而不是文档。程序中的注释不可喧宾夺主,注释太多了会让人眼花缭乱。注释的花样要少。
l 【规则2-7-2】若是代码原本就是清楚的,则没必要加注释。不然画蛇添足,使人厌烦。例如
i++; //i 加 1,多余的注释
l 【规则2-7-3】边写代码边注释,修改代码同时修改相应的注释,以保证注释与代码的一致性。再也不有用的注释要删除。
l 【规则2-7-4】注释应当准确、易懂,防止注释有二义性。错误的注释不但无益反而有害。
l 【规则2-7-5】尽可能避免在注释中使用缩写,特别是不经常使用缩写。
l 【规则2-7-6】注释的位置应与被描述的代码相邻,能够放在代码的上方或右方,不可放在下方。
l 【规则2-7-8】当代码比较长,特别是有多重嵌套时,应当在一些段落的结束处加注释,便于阅读。
/* * 函数介绍: * 输入参数: * 输出参数: * 返回值 : */ void Function(float x, float y, float z) { … } |
if (…) { … while (…) { … } // end of while … } // end of if |
示例2-6 程序的注释
类能够将数据和函数封装在一块儿,其中函数表示了类的行为(或称服务)。类提供关键字public、protected和private,分别用于声明哪些数据和函数是公有的、受保护的或者是私有的。这样能够达到信息隐藏的目的,即让类仅仅公开必需要让外界知道的内容,而隐藏其它一切内容。咱们不能够滥用类的封装功能,不要把它当成火锅,什么东西都往里扔。
类的版式主要有两种方式:
(1)将private类型的数据写在前面,而将public类型的函数写在后面,如示例8-3(a)。采用这种版式的程序员主张类的设计“以数据为中心”,重点关注类的内部结构。
(2)将public类型的函数写在前面,而将private类型的数据写在后面,如示例8.3(b)采用这种版式的程序员主张类的设计“以行为为中心”,重点关注的是类应该提供什么样的接口(或服务)。
不少C++教课书受到BiarneStroustrup第一本著做的影响,不知不觉地采用了“以数据为中心”的书写方式,并不见得有多少道理。
我建议读者采用“以行为为中心”的书写方式,即首先考虑类应该提供什么样的函数。这是不少人的经验——“这样作不只让本身在设计类时思路清晰,并且方便别人阅读。由于用户最关心的是接口,谁愿意先看到一堆私有数据成员!”
class A { private: int i, j; float x, y; … public: void Func1(void); void Func2(void); … } |
class A { public: void Func1(void); void Func2(void); … private: int i, j; float x, y; … } |
示例8.3(a) 以数据为中心版式 示例8.3(b) 以行为为中心的版式
比较著名的命名规则当推Microsoft公司的“匈牙利”法,该命名规则的主要思想是“在变量和函数名中加入前缀以增进人们对程序的理解”。例如全部的字符变量均以ch为前缀,如果指针变量则追加前缀p。若是一个变量由ppch开头,则代表它是指向字符指针的指针。
“匈牙利”法最大的缺点是烦琐,例如
int i, j, k;
float x, y, z;
假若采用“匈牙利”命名规则,则应当写成
int iI, iJ, ik; //前缀 i表示int类型
float fX, fY, fZ; //前缀 f表示float类型
如此烦琐的程序会让绝大多数程序员没法忍受。
据考察,没有一种命名规则可让全部的程序员赞同,程序设计教科书通常都不指定命名规则。命名规则对软件产品而言并非“成败悠关”的事,咱们不要化太多精力试图发明世界上最好的命名规则,而应当制定一种令大多数项目成员满意的命名规则,并在项目中贯彻实施。
本节论述的共性规则是被大多数程序员采纳的,咱们应当在遵循这些共性规则的前提下,再扩充特定的规则,如3.2节。
l 【规则3-1-1】标识符应当直观且能够拼读,可望文知意,没必要进行“解码”。
标识符最好采用英文单词或其组合,便于记忆和阅读。切忌使用汉语拼音来命名。程序中的英文单词通常不会太复杂,用词应当准确。例如不要把CurrentValue写成NowValue。
l 【规则3-1-2】标识符的长度应当符合“min-length &&max-information”原则。
几十年前老ANSI C规定名字不许超过6个字符,现今的C++/C再也不有此限制。通常来讲,长名字能更好地表达含义,因此函数名、变量名、类名长达十几个字符不足为怪。那么名字是否越长约好?不见得! 例如变量名maxval就比maxValueUntilOverflow好用。单字符的名字也是有用的,常见的如i,j,k,m,n,x,y,z等,它们一般可用做函数内的局部变量。
l 【规则3-1-3】命名规则尽可能与所采用的操做系统或开发工具的风格保持一致。
例如Windows应用程序的标识符一般采用“大小写”混排的方式,如AddChild。而Unix应用程序的标识符一般采用“小写加下划线”的方式,如add_child。别把这两类风格混在一块儿用。
l 【规则3-1-4】程序中不要出现仅靠大小写区分的类似的标识符。
例如:
int x, X; // 变量x 与 X 容易混淆
void foo(int x); // 函数foo 与FOO容易混淆
void FOO(float x);
l 【规则3-1-5】程序中不要出现标识符彻底相同的局部变量和全局变量,尽管二者的做用域不一样而不会发生语法错误,但会令人误解。
l 【规则3-1-6】变量的名字应当使用“名词”或者“形容词+名词”。
例如:
float value;
float oldValue;
float newValue;
l 【规则3-1-7】全局函数的名字应当使用“动词”或者“动词+名词”(动宾词组)。类的成员函数应当只使用“动词”,被省略掉的名词就是对象自己。
例如:
DrawBox(); // 全局函数
box->Draw(); // 类的成员函数
l 【规则3-1-8】用正确的反义词组命名具备互斥意义的变量或相反动做的函数等。
例如:
int minValue;
int maxValue;
int SetValue(…);
int GetValue(…);
² 【建议3-1-1】尽可能避免名字中出现数字编号,如Value1,Value2等,除非逻辑上的确须要编号。这是为了防止程序员偷懒,不愿为命名动脑筋而致使产生无心义的名字(由于用数字编号最省事)。
做者对“匈牙利”命名规则作了合理的简化,下述的命名规则简单易用,比较适合于Windows应用软件的开发。
l 【规则3-2-1】类名和函数名用大写字母开头的单词组合而成。
例如:
classNode; // 类名
classLeafNode; // 类名
void Draw(void); // 函数名
void SetValue(int value); // 函数名
l 【规则3-2-2】变量和参数用小写字母开头的单词组合而成。
例如:
BOOLflag;
int drawMode;
l 【规则3-2-3】常量全用大写的字母,用下划线分割单词。
例如:
constint MAX = 100;
constint MAX_LENGTH = 100;
l 【规则3-2-4】静态变量加前缀s_(表示static)。
例如:
void Init(…)
{
static int s_initValue; // 静态变量
…
}
l 【规则3-2-5】若是不得已须要全局变量,则使全局变量加前缀g_(表示global)。
例如:
intg_howManyPeople; // 全局变量
intg_howMuchMoney; // 全局变量
l 【规则3-2-6】类的数据成员加前缀m_(表示member),这样能够避免数据成员与成员函数的参数同名。
例如:
voidObject::SetValue(int width, int height)
{
m_width = width;
m_height = height;
}
l 【规则3-2-7】为了防止某一软件库中的一些标识符和其它软件库中的冲突,能够为各类标识符加上能反映软件性质的前缀。例如三维图形标准OpenGL的全部库函数均以gl开头,全部常量(或宏定义)均以GL开头。
读者可能怀疑:连if、for、while、goto、switch这样简单的东西也要探讨编程风格,是否是小题大作?
我真的发觉不少程序员用隐含错误的方式写表达式和基本语句,我本身也犯过相似的错误。
表达式和语句都属于C++/C的短语结构语法。它们看似简单,但使用时隐患比较多。本章概括了正确使用表达式和语句的一些规则与建议。
C++/C语言的运算符有数十个,运算符的优先级与结合律如表4-1所示。注意一元运算符 + - * 的优先级高于对应的二元运算符。
优先级 |
运算符 |
结合律 |
从
高
到
低
排
列 |
( ) [ ] -> . |
从左至右 |
! ~ ++ -- (类型) sizeof + - * & |
从右至左
|
|
* / % |
从左至右 |
|
+ - |
从左至右 |
|
<< >> |
从左至右 |
|
< <= > >= |
从左至右 |
|
== != |
从左至右 |
|
& |
从左至右 |
|
^ |
从左至右 |
|
| |
从左至右 |
|
&& |
从左至右 |
|
|| |
从右至左 |
|
?: |
从右至左 |
|
= += -= *= /= %= &= ^= |= <<= >>= |
从左至右 |
表4-1 运算符的优先级与结合律
l 【规则4-1-1】若是代码行中的运算符比较多,用括号肯定表达式的操做顺序,避免使用默认的优先级。
因为将表4-1熟记是比较困难的,为了防止产生歧义并提升可读性,应当用括号肯定表达式的操做顺序。例如:
word = (high<< 8) | low
if ((a | b)&& (a & c))
如 a = b = c = 0这样的表达式称为复合表达式。容许复合表达式存在的理由是:(1)书写简洁;(2)能够提升编译效率。但要防止滥用复合表达式。
l 【规则4-2-1】不要编写太复杂的复合表达式。
例如:
i = a >= b && c < d &&c + f <= g + h ; // 复合表达式过于复杂
l 【规则4-2-2】不要有多用途的复合表达式。
例如:
d = (a = b + c) + r ;
该表达式既求a值又求d值。应该拆分为两个独立的语句:
a = b + c;
d = a + r;
l 【规则4-2-3】不要把程序中的复合表达式与“真正的数学表达式”混淆。
例如:
if (a < b < c) // a < b < c是数学表达式而不是程序表达式
并不表示
if ((a<b) && (b<c))
而是成了使人费解的
if ( (a<b)<c )
if语句是C++/C语言中最简单、最经常使用的语句,然而不少程序员用隐含错误的方式写if语句。本节以“与零值比较”为例,展开讨论。
4.3.1 布尔变量与零值比较
l 【规则4-3-1】不可将布尔变量直接与TRUE、FALSE或者一、0进行比较。
根据布尔类型的语义,零值为“假”(记为FALSE),任何非零值都是“真”(记为TRUE)。TRUE的值到底是什么并无统一的标准。例如Visual C++ 将TRUE定义为1,而Visual Basic则将TRUE定义为-1。
假设布尔变量名字为flag,它与零值比较的标准if语句以下:
if (flag) // 表示flag为真
if (!flag) // 表示flag为假
其它的用法都属于不良风格,例如:
if (flag== TRUE)
if (flag== 1 )
if (flag== FALSE)
if (flag== 0)
4.3.2 整型变量与零值比较
l 【规则4-3-2】应当将整型变量用“==”或“!=”直接与0比较。
假设整型变量的名字为value,它与零值比较的标准if语句以下:
if (value == 0)
if (value != 0)
不可模仿布尔变量的风格而写成
if (value) // 会让人误解value是布尔变量
if (!value)
4.3.3 浮点变量与零值比较
l 【规则4-3-3】不可将浮点变量用“==”或“!=”与任何数字比较。
千万要留意,不管是float仍是double类型的变量,都有精度限制。因此必定要避免将浮点变量用“==”或“!=”与数字比较,应该设法转化成“>=”或“<=”形式。
假设浮点变量的名字为x,应当将
if (x == 0.0) //隐含错误的比较
转化为
if ((x>=-EPSINON) &&(x<=EPSINON))
其中EPSINON是容许的偏差(即精度)。
4.3.4 指针变量与零值比较
l 【规则4-3-4】应当将指针变量用“==”或“!=”与NULL比较。
指针变量的零值是“空”(记为NULL)。尽管NULL的值与0相同,可是二者意义不一样。假设指针变量的名字为p,它与零值比较的标准if语句以下:
if(p == NULL) // p与NULL显式比较,强调p是指针变量
if(p != NULL)
不要写成
if(p == 0) // 容易让人误解p是整型变量
if(p != 0)
或者
if (p) // 容易让人误解p是布尔变量
if (!p)
4.3.5 对if语句的补充说明
有时候咱们可能会看到if (NULL == p) 这样古怪的格式。不是程序写错了,是程序员为了防止将 if (p == NULL) 误写成 if (p = NULL),而有意把p和NULL颠倒。编译器认为 if (p= NULL) 是合法的,可是会指出 if (NULL = p)是错误的,由于NULL不能被赋值。
程序中有时会遇到if/else/return的组合,应该将以下不良风格的程序
if(condition)
return x;
returny;
改写为
if(condition)
{
return x;
}
else
{
return y;
}
或者改写成更加简练的
return (condition ? x : y);
C++/C循环语句中,for语句使用频率最高,while语句其次,do语句不多用。本节重点论述循环体的效率。提升循环体效率的基本办法是下降循环体的复杂性。
l 【建议4-4-1】在多重循环中,若是有可能,应当将最长的循环放在最内层,最短的循环放在最外层,以减小CPU跨切循环层的次数。例如示例4-4(b)的效率比示例4-4(a)的高。
for (row=0; row<100; row++) { for ( col=0; col<5; col++ ) { sum = sum + a[row][col]; } } |
for (col=0; col<5; col++ ) { for (row=0; row<100; row++) { sum = sum + a[row][col]; } } |
示例4-4(a) 低效率:长循环在最外层 示例4-4(b) 高效率:长循环在最内层
l 【建议4-4-2】若是循环体内存在逻辑判断,而且循环次数很大,宜将逻辑判断移到循环体的外面。示例4-4(c)的程序比示例4-4(d)多执行了N-1次逻辑判断。而且因为前者老要进行逻辑判断,打断了循环“流水线”做业,使得编译器不能对循环进行优化处理,下降了效率。若是N很是大,最好采用示例4-4(d)的写法,能够提升效率。若是N很是小,二者效率差异并不明显,采用示例4-4(c)的写法比较好,由于程序更加简洁。
for (i=0; i<N; i++) { if (condition) DoSomething(); else DoOtherthing(); } |
if (condition) { for (i=0; i<N; i++) DoSomething(); } else { for (i=0; i<N; i++) DoOtherthing(); } |
表4-4(c) 效率低但程序简洁 表4-4(d) 效率高但程序不简洁
l 【规则4-5-1】不可在for 循环体内修改循环变量,防止for循环失去控制。
l 【建议4-5-1】建议for语句的循环控制变量的取值采用“半开半闭区间”写法。
示例4-5(a)中的x值属于半开半闭区间“0=< x < N”,起点到终点的间隔为N,循环次数为N。
示例4-5(b)中的x值属于闭区间“0 =<x <= N-1”,起点到终点的间隔为N-1,循环次数为N。
相比之下,示例4-5(a)的写法更加直观,尽管二者的功能是相同的。
for (int x=0; x<N; x++) { … } |
for (int x=0; x<=N-1; x++) { … } |
示例4-5(a) 循环变量属于半开半闭区间 示例4-5(b) 循环变量属于闭区间
有了if语句为何还要switch语句?
switch是多分支选择语句,而if语句只有两个分支可供选择。虽然能够用嵌套的if语句来实现多分支选择,但那样的程序冗长难读。这是switch语句存在的理由。
switch语句的基本格式是:
switch (variable)
{
case value1 : …
break;
case value2 : …
break;
…
default : …
break;
}
l 【规则4-6-1】每一个case语句的结尾不要忘了加break,不然将致使多个分支重叠(除非有意使多个分支重叠)。
l 【规则4-6-2】不要忘记最后那个default分支。即便程序真的不须要default处理,也应该保留语句 default : break; 这样作并不是画蛇添足,而是为了防止别人误觉得你忘了default处理。
自从提倡结构化设计以来,goto就成了有争议的语句。首先,因为goto语句能够灵活跳转,若是不加限制,它的确会破坏结构化设计风格。其次,goto语句常常带来错误或隐患。它可能跳过了某些对象的构造、变量的初始化、重要的计算等语句,例如:
goto state;
String s1, s2; // 被goto跳过
int sum = 0; //被goto跳过
…
state:
…
若是编译器不能发觉此类错误,每用一次goto语句均可能留下隐患。
不少人建议废除C++/C的goto语句,以绝后患。但实事求是地说,错误是程序员本身形成的,不是goto的过错。goto 语句至少有一处可显神通,它能从多重循环体中咻地一会儿跳到外面,用不着写不少次的break语句; 例如
{ …
{ …
{ …
goto error;
}
}
}
error:
…
就象楼房着火了,来不及从楼梯一级一级往下走,可从窗口跳出火坑。因此咱们主张少用、慎用goto语句,而不是禁用。
常量是一种标识符,它的值在运行期间恒定不变。C语言用 #define来定义常量(称为宏常量)。C++ 语言除了 #define外还能够用const来定义常量(称为const常量)。
若是不使用常量,直接在程序中填写数字或字符串,将会有什么麻烦?
(1) 程序的可读性(可理解性)变差。程序员本身会忘记那些数字或字符串是什么意思,用户则更加不知它们从何处来、表示什么。
(2) 在程序的不少地方输入一样的数字或字符串,难保不发生书写错误。
(3) 若是要修改数字或字符串,则会在不少地方改动,既麻烦又容易出错。
l 【规则5-1-1】 尽可能使用含义直观的常量来表示那些将在程序中屡次出现的数字或字符串。
例如:
#define MAX 100 /* C语言的宏常量 */
const int MAX =100; // C++ 语言的const常量
const float PI =3.14159; // C++ 语言的const常量
C++ 语言能够用const来定义常量,也能够用 #define来定义常量。可是前者比后者有更多的优势:
(1) const常量有数据类型,而宏常量没有数据类型。编译器能够对前者进行类型安全检查。而对后者只进行字符替换,没有类型安全检查,而且在字符替换可能会产生意料不到的错误(边际效应)。
(2) 有些集成化的调试工具能够对const常量进行调试,可是不能对宏常量进行调试。
l 【规则5-2-1】在C++程序中只使用const常量而不使用宏常量,即const常量彻底取代宏常量。
l 【规则5-3-1】须要对外公开的常量放在头文件中,不须要对外公开的常量放在定义文件的头部。为便于管理,能够把不一样模块的常量集中存放在一个公共的头文件中。
l 【规则5-3-2】若是某一常量与其它常量密切相关,应在定义中包含这种关系,而不该给出一些孤立的值。
例如:
const float RADIUS = 100;
const float DIAMETER = RADIUS * 2;
有时咱们但愿某些常量只在类中有效。因为#define定义的宏常量是全局的,不能达到目的,因而想固然地以为应该用const修饰数据成员来实现。const数据成员的确是存在的,但其含义却不是咱们所指望的。const数据成员只在某个对象生存期内是常量,而对于整个类而言倒是可变的,由于类能够建立多个对象,不一样的对象其const数据成员的值能够不一样。
不能在类声明中初始化const数据成员。如下用法是错误的,由于类的对象未被建立时,编译器不知道SIZE的值是什么。
class A
{…
constint SIZE = 100; // 错误,企图在类声明中初始化const数据成员
intarray[SIZE]; // 错误,未知的SIZE
};
const数据成员的初始化只能在类构造函数的初始化表中进行,例如
class A
{…
A(intsize); //构造函数
constint SIZE ;
};
A::A(int size) : SIZE(size) // 构造函数的初始化表
{
…
}
A a(100); // 对象 a 的SIZE值为100
A b(200); // 对象 b 的SIZE值为200
怎样才能创建在整个类中都恒定的常量呢?别期望const数据成员了,应该用类中的枚举常量来实现。例如
class A
{…
enum{ SIZE1 = 100, SIZE2 = 200}; // 枚举常量
intarray1[SIZE1];
intarray2[SIZE2];
};
枚举常量不会占用对象的存储空间,它们在编译时被所有求值。枚举常量的缺点是:它的隐含数据类型是整数,其最大值有限,且不能表示浮点数(如PI=3.14159)。
函数是C++/C程序的基本功能单元,其重要性不言而喻。函数设计的细微缺点很容易致使该函数被错用,因此光使函数的功能正确是不够的。本章重点论述函数的接口设计和内部实现的一些规则。
函数接口的两个要素是参数和返回值。C语言中,函数的参数和返回值的传递方式有两种:值传递(pass by value)和指针传递(pass by pointer)。C++ 语言中多了引用传递(passby reference)。因为引用传递的性质象指针传递,而使用方式却象值传递,初学者经常疑惑不解,容易引发混乱,请先阅读6.6节“引用与指针的比较”。
l 【规则6-1-1】参数的书写要完整,不要贪图省事只写参数的类型而省略参数名字。若是函数没有参数,则用void填充。
例如:
void SetValue(int width, int height); // 良好的风格
void SetValue(int, int); // 不良的风格
float GetValue(void); // 良好的风格
float GetValue(); // 不良的风格
l 【规则6-1-2】参数命名要恰当,顺序要合理。
例如编写字符串拷贝函数StringCopy,它有两个参数。若是把参数名字起为str1和str2,例如
void StringCopy(char *str1, char *str2);
那么咱们很难搞清楚到底是把str1拷贝到str2中,仍是恰好倒过来。
能够把参数名字起得更有意义,如叫strSource和strDestination。这样从名字上就能够看出应该把strSource拷贝到strDestination。
还有一个问题,这两个参数那一个该在前那一个该在后?参数的顺序要遵循程序员的习惯。通常地,应将目的参数放在前面,源参数放在后面。
若是将函数声明为:
void StringCopy(char *strSource, char*strDestination);
别人在使用时可能会不假思索地写成以下形式:
char str[20];
StringCopy(str, “Hello World”); // 参数顺序颠倒
l 【规则6-1-3】若是参数是指针,且仅做输入用,则应在类型前加const,以防止该指针在函数体内被意外修改。
例如:
void StringCopy(char *strDestination,const char *strSource);
l 【规则6-1-4】若是输入参数以值传递的方式传递对象,则宜改用“const &”方式来传递,这样能够省去临时对象的构造和析构过程,从而提升效率。
² 【建议6-1-1】避免函数有太多的参数,参数个数尽可能控制在5个之内。若是参数太多,在使用时容易将参数类型或顺序搞错。
² 【建议6-1-2】尽可能不要使用类型和数目不肯定的参数。
C标准库函数printf是采用不肯定参数的典型表明,其原型为:
int printf(const chat *format[, argument]…);
这种风格的函数在编译时丧失了严格的类型安全检查。
l 【规则6-2-1】不要省略返回值的类型。
C语言中,凡不加类型说明的函数,一概自动按整型处理。这样作不会有什么好处,却容易被误解为void类型。
C++语言有很严格的类型安全检查,不容许上述状况发生。因为C++程序能够调用C函数,为了不混乱,规定任何C++/ C函数都必须有类型。若是函数没有返回值,那么应声明为void类型。
l 【规则6-2-2】函数名字与返回值类型在语义上不可冲突。
违反这条规则的典型表明是C标准库函数getchar。
例如:
char c;
c = getchar();
if (c == EOF)
…
按照getchar名字的意思,将变量c声明为char类型是很天然的事情。但不幸的是getchar的确不是char类型,而是int类型,其原型以下:
intgetchar(void);
因为c是char类型,取值范围是[-128,127],若是宏EOF的值在char的取值范围以外,那么if语句将老是失败,这种“危险”人们通常哪里料获得!致使本例错误的责任并不在用户,是函数getchar误导了使用者。
l 【规则6-2-3】不要将正常值和错误标志混在一块儿返回。正常值用输出参数得到,而错误标志用return语句返回。
回顾上例,C标准库函数的设计者为何要将getchar声明为使人迷糊的int类型呢?他会那么傻吗?
在正常状况下,getchar的确返回单个字符。但若是getchar碰到文件结束标志或发生读错误,它必须返回一个标志EOF。为了区别于正常的字符,只好将EOF定义为负数(一般为负1)。所以函数getchar就成了int类型。
咱们在实际工做中,常常会碰到上述使人为难的问题。为了不出现误解,咱们应该将正常值和错误标志分开。即:正常值用输出参数得到,而错误标志用return语句返回。
函数getchar能够改写成 BOOL GetChar(char *c);
虽然gechar比GetChar灵活,例如 putchar(getchar());可是若是getchar用错了,它的灵活性又有什么用呢?
² 【建议6-2-1】有时候函数本来不须要返回值,但为了增长灵活性如支持链式表达,能够附加返回值。
例如字符串拷贝函数strcpy的原型:
char *strcpy(char *strDest,const char *strSrc);
strcpy函数将strSrc拷贝至输出参数strDest中,同时函数的返回值又是strDest。这样作并不是画蛇添足,能够得到以下灵活性:
charstr[20];
int length = strlen( strcpy(str, “Hello World”));
² 【建议6-2-2】若是函数的返回值是一个对象,有些场合用“引用传递”替换“值传递”能够提升效率。而有些场合只能用“值传递”而不能用“引用传递”,不然会出错。
例如:
class String
{…
// 赋值函数
String& operate=(const String &other);
// 相加函数,若是没有friend修饰则只许有一个右侧参数
friend String operate+( const String &s1, const String &s2);
private:
char*m_data;
}
String的赋值函数operate = 的实现以下:
String &String::operate=(const String &other)
{
if(this == &other)
return *this;
deletem_data;
m_data= new char[strlen(other.data)+1];
strcpy(m_data,other.data);
return*this; // 返回的是 *this的引用,无需拷贝过程
}
对于赋值函数,应当用“引用传递”的方式返回String对象。若是用“值传递”的方式,虽然功能仍然正确,但因为return语句要把 *this拷贝到保存返回值的外部存储单元之中,增长了没必要要的开销,下降了赋值函数的效率。例如:
Stringa,b,c;
…
a = b; //若是用“值传递”,将产生一次 *this 拷贝
a = b= c; // 若是用“值传递”,将产生两次 *this 拷贝
String的相加函数operate + 的实现以下:
String operate+(const String &s1, const String&s2)
{
Stringtemp;
deletetemp.data; // temp.data是仅含‘\0’的字符串
temp.data = new char[strlen(s1.data) +strlen(s2.data) +1];
strcpy(temp.data, s1.data);
strcat(temp.data, s2.data);
return temp;
}
对于相加函数,应当用“值传递”的方式返回String对象。若是改用“引用传递”,那么函数返回值是一个指向局部对象temp的“引用”。因为temp在函数结束时被自动销毁,将致使返回的“引用”无效。例如:
c = a + b;
此时 a + b 并不返回指望值,c什么也得不到,流下了隐患。
不一样功能的函数其内部实现各不相同,看起来彷佛没法就“内部实现”达成一致的观点。但根据经验,咱们能够在函数体的“入口处”和“出口处”从严把关,从而提升函数的质量。
l 【规则6-3-1】在函数体的“入口处”,对参数的有效性进行检查。
不少程序错误是由非法参数引发的,咱们应该充分理解并正确使用“断言”(assert)来防止此类错误。详见6.5节“使用断言”。
l 【规则6-3-2】在函数体的“出口处”,对return语句的正确性和效率进行检查。
若是函数有返回值,那么函数的“出口处”是return语句。咱们不要轻视return语句。若是return语句写得很差,函数要么出错,要么效率低下。
注意事项以下:
(1)return语句不可返回指向“栈内存”的“指针”或者“引用”,由于该内存在函数体结束时被自动销毁。例如
char * Func(void)
{
charstr[] = “helloworld”; // str的内存位于栈上
…
returnstr; //将致使错误
}
(2)要搞清楚返回的到底是“值”、“指针”仍是“引用”。
(3)若是函数返回值是一个对象,要考虑return语句的效率。例如
return String(s1 + s2);
这是临时对象的语法,表示“建立一个临时对象并返回它”。不要觉得它与“先建立一个局部对象temp并返回它的结果”是等价的,如
String temp(s1 + s2);
return temp;
实质否则,上述代码将发生三件事。首先,temp对象被建立,同时完成初始化;而后拷贝构造函数把temp拷贝到保存返回值的外部存储单元中;最后,temp在函数结束时被销毁(调用析构函数)。然而“建立一个临时对象并返回它”的过程是不一样的,编译器直接把临时对象建立并初始化在外部存储单元中,省去了拷贝和析构的化费,提升了效率。
相似地,咱们不要将
return int(x + y); // 建立一个临时变量并返回它
写成
int temp = x + y;
return temp;
因为内部数据类型如int,float,double的变量不存在构造函数与析构函数,虽然该“临时变量的语法”不会提升多少效率,可是程序更加简洁易读。
² 【建议6-4-1】函数的功能要单一,不要设计多用途的函数。
² 【建议6-4-2】函数体的规模要小,尽可能控制在50行代码以内。
² 【建议6-4-3】尽可能避免函数带有“记忆”功能。相同的输入应当产生相同的输出。
带有“记忆”功能的函数,其行为多是不可预测的,由于它的行为可能取决于某种“记忆状态”。这样的函数既不易理解又不利于测试和维护。在C/C++语言中,函数的static局部变量是函数的“记忆”存储器。建议尽可能少用static局部变量,除非必需。
² 【建议6-4-4】不只要检查输入参数的有效性,还要检查经过其它途径进入函数体内的变量的有效性,例如全局变量、文件句柄等。
² 【建议6-4-5】用于出错处理的返回值必定要清楚,让使用者不容易忽视或误解错误状况。
程序通常分为Debug版本和Release版本,Debug版本用于内部调试,Release版本发行给用户使用。
断言assert是仅在Debug版本起做用的宏,它用于检查“不该该”发生的状况。示例6-5是一个内存复制函数。在运行过程当中,若是assert的参数为假,那么程序就会停止(通常地还会出现提示对话,说明在什么地方引起了assert)。
void *memcpy(void *pvTo, const void *pvFrom, size_t size) { assert((pvTo != NULL) && (pvFrom != NULL)); // 使用断言 byte *pbTo = (byte *) pvTo; // 防止改变pvTo的地址 byte *pbFrom = (byte *) pvFrom; // 防止改变pvFrom的地址 while(size -- > 0 ) *pbTo ++ = *pbFrom ++ ; return pvTo; } |
示例6-5 复制不重叠的内存块
assert不是一个仓促拼凑起来的宏。为了避免在程序的Debug版本和Release版本引发差异,assert不该该产生任何反作用。因此assert不是函数,而是宏。程序员能够把assert当作一个在任何系统状态下均可以安全使用的无害测试手段。若是程序在assert处终止了,并非说含有该assert的函数有错误,而是调用者出了差错,assert能够帮助咱们找到发生错误的缘由。
不多有比跟踪到程序的断言,殊不知道该断言的做用更让人沮丧的事了。你化了不少时间,不是为了排除错误,而只是为了弄清楚这个错误究竟是什么。有的时候,程序员偶尔还会设计出有错误的断言。因此若是搞不清楚断言检查的是什么,就很难判断错误是出如今程序中,仍是出如今断言中。幸运的是这个问题很好解决,只要加上清晰的注释便可。这本是显而易见的事情,但是不多有程序员这样作。这比如一我的在森林里,看到树上钉着一块“危险”的大牌子。但危险究竟是什么?树要倒?有废井?有野兽?除非告诉人们“危险”是什么,不然这个警告牌难以起到积极有效的做用。难以理解的断言经常被程序员忽略,甚至被删除。[Maguire, p8-p30]
l 【规则6-5-1】使用断言捕捉不该该发生的非法状况。不要混淆非法状况与错误状况之间的区别,后者是必然存在的而且是必定要做出处理的。
l 【规则6-5-2】在函数的入口处,使用断言检查参数的有效性(合法性)。
l 【建议6-5-1】在编写函数时,要进行反复的考查,而且自问:“我打算作哪些假定?”一旦肯定了的假定,就要使用断言对假定进行检查。
l 【建议6-5-2】通常教科书都鼓励程序员们进行防错设计,但要记住这种编程风格可能会隐瞒错误。当进行防错设计时,若是“不可能发生”的事情的确发生了,则要使用断言进行报警。
引用是C++中的概念,初学者容易把引用和指针混淆一块儿。一下程序中,n是m的一个引用(reference),m是被引用物(referent)。
intm;
int&n = m;
n至关于m的别名(绰号),对n的任何操做就是对m的操做。例若有人名叫王小毛,他的绰号是“三毛”。说“三毛”怎么怎么的,其实就是对王小毛说三道四。因此n既不是m的拷贝,也不是指向m的指针,其实n就是m它本身。
引用的一些规则以下:
(1)引用被建立的同时必须被初始化(指针则能够在任什么时候候被初始化)。
(2)不能有NULL引用,引用必须与合法的存储单元关联(指针则能够是NULL)。
(3)一旦引用被初始化,就不能改变引用的关系(指针则能够随时改变所指的对象)。
如下示例程序中,k被初始化为i的引用。语句k = j并不能将k修改为为j的引用,只是把k的值改变成为6。因为k是i的引用,因此i的值也变成了6。
inti = 5;
intj = 6;
int&k = i;
k =j; // k和i的值都变成了6;
上面的程序看起来象在玩文字游戏,没有体现出引用的价值。引用的主要功能是传递函数的参数和返回值。C++语言中,函数的参数和返回值的传递方式有三种:值传递、指针传递和引用传递。
如下是“值传递”的示例程序。因为Func1函数体内的x是外部变量n的一份拷贝,改变x的值不会影响n, 因此n的值仍然是0。
voidFunc1(int x)
{
x = x + 10;
}
…
int n = 0;
Func1(n);
cout<< “n = ” << n << endl; //n = 0
如下是“指针传递”的示例程序。因为Func2函数体内的x是指向外部变量n的指针,改变该指针的内容将致使n的值改变,因此n的值成为10。
voidFunc2(int *x)
{
(* x) = (* x) + 10;
}
…
int n = 0;
Func2(&n);
cout<< “n = ” << n << endl; // n = 10
如下是“引用传递”的示例程序。因为Func3函数体内的x是外部变量n的引用,x和n是同一个东西,改变x等于改变n,因此n的值成为10。
voidFunc3(int &x)
{
x = x + 10;
}
…
int n = 0;
Func3(n);
cout<< “n = ” << n << endl; // n = 10
对比上述三个示例程序,会发现“引用传递”的性质象“指针传递”,而书写方式象“值传递”。实际上“引用”能够作的任何事情“指针”也都可以作,为何还要“引用”这东西?
答案是“用适当的工具作恰如其分的工做”。
指针可以毫无约束地操做内存中的如何东西,尽管指针功能强大,可是很是危险。就象一把刀,它能够用来砍树、裁纸、修指甲、理发等等,谁敢这样用?
若是的确只须要借用一下某个对象的“别名”,那么就用“引用”,而不要用“指针”,以避免发生意外。好比说,某人须要一份证实,原本在文件上盖上公章的印子就好了,若是把取公章的钥匙交给他,那么他就得到了不应有的权利。
欢迎进入内存这片雷区。伟大的Bill Gates 曾经失言:
640Kought to be enough for everybody
— Bill Gates 1981
程序员们常常编写内存管理程序,每每提心吊胆。若是不想触雷,惟一的解决办法就是发现全部潜伏的地雷而且排除它们,躲是躲不了的。本章的内容比通常教科书的要深刻得多,读者需细心阅读,作到真正地通晓内存管理。
内存分配方式有三种:
(1) 从静态存储区域分配。内存在程序编译的时候就已经分配好,这块内存在程序的整个运行期间都存在。例如全局变量,static变量。
(2) 在栈上建立。在执行函数时,函数内局部变量的存储单元均可以在栈上建立,函数执行结束时这些存储单元自动被释放。栈内存分配运算内置于处理器的指令集中,效率很高,可是分配的内存容量有限。
(3) 从堆上分配,亦称动态内存分配。程序在运行的时候用malloc或new申请任意多少的内存,程序员本身负责在什么时候用free或delete释放内存。动态内存的生存期由咱们决定,使用很是灵活,但问题也最多。
发生内存错误是件很是麻烦的事情。编译器不能自动发现这些错误,一般是在程序运行时才能捕捉到。而这些错误大多没有明显的症状,时隐时现,增长了改错的难度。有时用户怒气冲冲地把你找来,程序却没有发生任何问题,你一走,错误又发做了。
常见的内存错误及其对策以下:
u 内存分配未成功,却使用了它。
编程新手常犯这种错误,由于他们没有意识到内存分配会不成功。经常使用解决办法是,在使用内存以前检查指针是否为NULL。若是指针p是函数的参数,那么在函数的入口处用assert(p!=NULL)进行检查。若是是用malloc或new来申请内存,应该用if(p==NULL)或if(p!=NULL)进行防错处理。
u 内存分配虽然成功,可是还没有初始化就引用它。
犯这种错误主要有两个原由:一是没有初始化的观念;二是误觉得内存的缺省初值全为零,致使引用初值错误(例如数组)。
内存的缺省初值到底是什么并无统一的标准,尽管有些时候为零值,咱们宁肯信其无不可信其有。因此不管用何种方式建立数组,都别忘了赋初值,即使是赋零值也不可省略,不要嫌麻烦。
u 内存分配成功而且已经初始化,但操做越过了内存的边界。
例如在使用数组时常常发生下标“多1”或者“少1”的操做。特别是在for循环语句中,循环次数很容易搞错,致使数组操做越界。
u 忘记了释放内存,形成内存泄露。
含有这种错误的函数每被调用一次就丢失一块内存。刚开始时系统的内存充足,你看不到错误。终有一次程序忽然死掉,系统出现提示:内存耗尽。
动态内存的申请与释放必须配对,程序中malloc与free的使用次数必定要相同,不然确定有错误(new/delete同理)。
u 释放了内存却继续使用它。
有三种状况:
(1)程序中的对象调用关系过于复杂,实在难以搞清楚某个对象到底是否已经释放了内存,此时应该从新设计数据结构,从根本上解决对象管理的混乱局面。
(2)函数的return语句写错了,注意不要返回指向“栈内存”的“指针”或者“引用”,由于该内存在函数体结束时被自动销毁。
(3)使用free或delete释放了内存后,没有将指针设置为NULL。致使产生“野指针”。
l 【规则7-2-1】用malloc或new申请内存以后,应该当即检查指针值是否为NULL。防止使用指针值为NULL的内存。
l 【规则7-2-2】不要忘记为数组和动态内存赋初值。防止将未被初始化的内存做为右值使用。
l 【规则7-2-3】避免数组或指针的下标越界,特别要小心发生“多1”或者“少1”操做。
l 【规则7-2-4】动态内存的申请与释放必须配对,防止内存泄漏。
l 【规则7-2-5】用free或delete释放了内存以后,当即将指针设置为NULL,防止产生“野指针”。
C++/C程序中,指针和数组在很多地方能够相互替换着用,让人产生一种错觉,觉得二者是等价的。
数组要么在静态存储区被建立(如全局数组),要么在栈上被建立。数组名对应着(而不是指向)一块内存,其地址与容量在生命期内保持不变,只有数组的内容能够改变。
指针能够随时指向任意类型的内存块,它的特征是“可变”,因此咱们经常使用指针来操做动态内存。指针远比数组灵活,但也更危险。
下面以字符串为例比较指针与数组的特性。
7.3.1 修改内容
示例7-3-1中,字符数组a的容量是6个字符,其内容为hello\0。a的内容能够改变,如a[0]=‘X’。指针p指向常量字符串“world”(位于静态存储区,内容为world\0),常量字符串的内容是不能够被修改的。从语法上看,编译器并不以为语句p[0]=‘X’有什么不妥,可是该语句企图修改常量字符串的内容而致使运行错误。
char a[] = “hello”; a[0] = ‘X’; cout << a << endl; char *p = “world”; // 注意p指向常量字符串 p[0] = ‘X’; // 编译器不能发现该错误 cout << p << endl; |
示例7-3-1 修改数组和指针的内容
7.3.2 内容复制与比较
不能对数组名进行直接复制与比较。示例7-3-2中,若想把数组a的内容复制给数组b,不能用语句 b = a ,不然将产生编译错误。应该用标准库函数strcpy进行复制。同理,比较b和a的内容是否相同,不能用if(b==a) 来判断,应该用标准库函数strcmp进行比较。
语句p = a 并不能把a的内容复制指针p,而是把a的地址赋给了p。要想复制a的内容,能够先用库函数malloc为p申请一块容量为strlen(a)+1个字符的内存,再用strcpy进行字符串复制。同理,语句if(p==a) 比较的不是内容而是地址,应该用库函数strcmp来比较。
// 数组… char a[] = "hello"; char b[10]; strcpy(b, a); // 不能用 b = a; if(strcmp(b, a) == 0) // 不能用 if (b == a) … |
// 指针… int len = strlen(a); char *p = (char *)malloc(sizeof(char)*(len+1)); strcpy(p,a); // 不要用 p = a; if(strcmp(p, a) == 0) // 不要用 if (p == a) … |
示例7-3-2 数组和指针的内容复制与比较
7.3.3 计算内存容量
用运算符sizeof能够计算出数组的容量(字节数)。示例7-3-3(a)中,sizeof(a)的值是12(注意别忘了’\0’)。指针p指向a,可是sizeof(p)的值倒是4。这是由于sizeof(p)获得的是一个指针变量的字节数,至关于sizeof(char*),而不是p所指的内存容量。C++/C语言没有办法知道指针所指的内存容量,除非在申请内存时记住它。
注意当数组做为函数的参数进行传递时,该数组自动退化为同类型的指针。示例7-3-3(b)中,不论数组a的容量是多少,sizeof(a)始终等于sizeof(char *)。
char a[] = "hello world"; char *p = a; cout<< sizeof(a) << endl; // 12字节 cout<< sizeof(p) << endl; // 4字节 |
示例7-3-3(a) 计算数组和指针的内存容量
void Func(char a[100]) { cout<< sizeof(a) << endl; // 4字节而不是100字节 } |
示例7-3-3(b) 数组退化为指针
若是函数的参数是一个指针,不要期望用该指针去申请动态内存。示例7-4-1中,Test函数的语句GetMemory(str, 200)并无使str得到指望的内存,str依旧是NULL,为何?
void GetMemory(char *p, int num) { p = (char *)malloc(sizeof(char) * num); } |
void Test(void) { char *str = NULL; GetMemory(str, 100); // str 仍然为 NULL strcpy(str, "hello"); // 运行错误 } |
示例7-4-1 试图用指针参数申请动态内存
毛病出在函数GetMemory中。编译器老是要为函数的每一个参数制做临时副本,指针参数p的副本是 _p,编译器使 _p = p。若是函数体内的程序修改了_p的内容,就致使参数p的内容做相应的修改。这就是指针能够用做输出参数的缘由。在本例中,_p申请了新的内存,只是把_p所指的内存地址改变了,可是p丝毫未变。因此函数GetMemory并不能输出任何东西。事实上,每执行一次GetMemory就会泄露一块内存,由于没有用free释放内存。
若是非得要用指针参数去申请内存,那么应该改用“指向指针的指针”,见示例7-4-2。
void GetMemory2(char **p, int num) { *p = (char *)malloc(sizeof(char) * num); } |
void Test2(void) { char *str = NULL; GetMemory2(&str, 100); // 注意参数是 &str,而不是str strcpy(str, "hello"); cout<< str << endl; free(str); } |
示例7-4-2用指向指针的指针申请动态内存
因为“指向指针的指针”这个概念不容易理解,咱们能够用函数返回值来传递动态内存。这种方法更加简单,见示例7-4-3。
char *GetMemory3(int num) { char *p = (char *)malloc(sizeof(char) * num); return p; } |
void Test3(void) { char *str = NULL; str = GetMemory3(100); strcpy(str, "hello"); cout<< str << endl; free(str); } |
示例7-4-3 用函数返回值来传递动态内存
用函数返回值来传递动态内存这种方法虽然好用,可是经常有人把return语句用错了。这里强调不要用return语句返回指向“栈内存”的指针,由于该内存在函数结束时自动消亡,见示例7-4-4。
char *GetString(void) { char p[] = "hello world"; return p; // 编译器将提出警告 } |
void Test4(void) { char *str = NULL; str = GetString(); // str 的内容是垃圾 cout<< str << endl; } |
示例7-4-4 return语句返回指向“栈内存”的指针
用调试器逐步跟踪Test4,发现执行str = GetString语句后str再也不是NULL指针,可是str的内容不是“hello world”而是垃圾。
若是把示例7-4-4改写成示例7-4-5,会怎么样?
char *GetString2(void) { char *p = "hello world"; return p; } |
void Test5(void) { char *str = NULL; str = GetString2(); cout<< str << endl; } |
示例7-4-5 return语句返回常量字符串
函数Test5运行虽然不会出错,可是函数GetString2的设计概念倒是错误的。由于GetString2内的“hello world”是常量字符串,位于静态存储区,它在程序生命期内恒定不变。不管何时调用GetString2,它返回的始终是同一个“只读”的内存块。
别看free和delete的名字恶狠狠的(尤为是delete),它们只是把指针所指的内存给释放掉,但并无把指针自己干掉。
用调试器跟踪示例7-5,发现指针p被free之后其地址仍然不变(非NULL),只是该地址对应的内存是垃圾,p成了“野指针”。若是此时不把p设置为NULL,会让人误觉得p是个合法的指针。
若是程序比较长,咱们有时记不住p所指的内存是否已经被释放,在继续使用p以前,一般会用语句if (p != NULL)进行防错处理。很遗憾,此时if语句起不到防错做用,由于即使p不是NULL指针,它也不指向合法的内存块。
char *p = (char *) malloc(100); strcpy(p, “hello”); free(p); // p 所指的内存被释放,可是p所指的地址仍然不变 … if(p != NULL) // 没有起到防错做用 { strcpy(p, “world”); // 出错 } |
示例7-5 p成为野指针
函数体内的局部变量在函数结束时自动消亡。不少人误觉得示例7-6是正确的。理由是p是局部的指针变量,它消亡的时候会让它所指的动态内存一块儿完蛋。这是错觉!
void Func(void) { char *p = (char *) malloc(100); // 动态内存会自动释放吗? } |
示例7-6 试图让动态内存自动释放
咱们发现指针有一些“似是而非”的特征:
(1)指针消亡了,并不表示它所指的内存会被自动释放。
(2)内存被释放了,并不表示指针会消亡或者成了NULL指针。
这代表释放内存并非一件能够草率对待的事。也许有人不服气,必定要找出能够草率行事的理由:
若是程序终止了运行,一切指针都会消亡,动态内存会被操做系统回收。既然如此,在程序临终前,就能够没必要释放内存、没必要将指针设置为NULL了。终于能够偷懒而不会发生错误了吧?
想得美。若是别人把那段程序取出来用到其它地方怎么办?
“野指针”不是NULL指针,是指向“垃圾”内存的指针。人们通常不会错用NULL指针,由于用if语句很容易判断。可是“野指针”是很危险的,if语句对它不起做用。
“野指针”的成因主要有两种:
(1)指针变量没有被初始化。任何指针变量刚被建立时不会自动成为NULL指针,它的缺省值是随机的,它会乱指一气。因此,指针变量在建立的同时应当被初始化,要么将指针设置为NULL,要么让它指向合法的内存。例如
char *p = NULL;
char *str = (char*) malloc(100);
(2)指针p被free或者delete以后,没有置为NULL,让人误觉得p是个合法的指针。参见7.5节。
(3)指针操做超越了变量的做用范围。这种状况让人防不胜防,示例程序以下:
class A
{
public:
void Func(void){ cout << “Func of class A” << endl;}
};
void Test(void)
{
A *p;
{
A a;
p = &a; //注意 a 的生命期
}
p->Func(); // p是“野指针”
}
函数Test在执行语句p->Func()时,对象a已经消失,而p是指向a的,因此p就成了“野指针”。但奇怪的是我运行这个程序时竟然没有出错,这可能与编译器有关。
malloc与free是C++/C语言的标准库函数,new/delete是C++的运算符。它们均可用于申请动态内存和释放内存。
对于非内部数据类型的对象而言,光用maloc/free没法知足动态对象的要求。对象在建立的同时要自动执行构造函数,对象在消亡以前要自动执行析构函数。因为malloc/free是库函数而不是运算符,不在编译器控制权限以内,不可以把执行构造函数和析构函数的任务强加于malloc/free。
所以C++语言须要一个能完成动态内存分配和初始化工做的运算符new,以及一个能完成清理与释放内存工做的运算符delete。注意new/delete不是库函数。
咱们先看一看malloc/free和new/delete如何实现对象的动态内存管理,见示例7-8。
class Obj { public : Obj(void){ cout << “Initialization” << endl; } ~Obj(void){ cout << “Destroy” << endl; } void Initialize(void){ cout << “Initialization” << endl; } void Destroy(void){ cout << “Destroy” << endl; } }; |
void UseMallocFree(void) { Obj *a = (obj *)malloc(sizeof(obj)); // 申请动态内存 a->Initialize(); // 初始化 //… a->Destroy(); // 清除工做 free(a); // 释放内存 } |
void UseNewDelete(void) { Obj *a = new Obj; // 申请动态内存而且初始化 //… delete a; // 清除而且释放内存 } |
示例7-8 用malloc/free和new/delete如何实现对象的动态内存管理
类Obj的函数Initialize模拟了构造函数的功能,函数Destroy模拟了析构函数的功能。函数UseMallocFree中,因为malloc/free不能执行构造函数与析构函数,必须调用成员函数Initialize和Destroy来完成初始化与清除工做。函数UseNewDelete则简单得多。
因此咱们不要企图用malloc/free来完成动态对象的内存管理,应该用new/delete。因为内部数据类型的“对象”没有构造与析构的过程,对它们而言malloc/free和new/delete是等价的。
既然new/delete的功能彻底覆盖了malloc/free,为何C++不把malloc/free淘汰出局呢?这是由于C++程序常常要调用C函数,而C程序只能用malloc/free管理动态内存。
若是用free释放“new建立的动态对象”,那么该对象因没法执行析构函数而可能致使程序出错。若是用delete释放“malloc申请的动态内存”,理论上讲程序不会出错,可是该程序的可读性不好。因此new/delete必须配对使用,malloc/free也同样。
若是在申请动态内存时找不到足够大的内存块,malloc和new将返回NULL指针,宣告内存申请失败。一般有三种方式处理“内存耗尽”问题。
(1)判断指针是否为NULL,若是是则立刻用return语句终止本函数。例如:
void Func(void)
{
A *a = new A;
if(a== NULL)
{
return;
}
…
}
(2)判断指针是否为NULL,若是是则立刻用exit(1)终止整个程序的运行。例如:
void Func(void)
{
A *a = new A;
if(a== NULL)
{
cout << “Memory Exhausted” << endl;
exit(1);
}
…
}
(3)为new和malloc设置异常处理函数。例如VisualC++能够用_set_new_hander函数为new设置用户本身定义的异常处理函数,也可让malloc享用与new相同的异常处理函数。详细内容请参考C++使用手册。
上述(1)(2)方式使用最广泛。若是一个函数内有多处须要申请动态内存,那么方式(1)就显得力不从心(释放内存很麻烦),应该用方式(2)来处理。
不少人不忍心用exit(1),问:“不编写出错处理程序,让操做系统本身解决行不行?”
不行。若是发生“内存耗尽”这样的事情,通常说来应用程序已经无药可救。若是不用exit(1) 把坏程序杀死,它可能会害死操做系统。道理如同:若是不把歹徒击毙,歹徒在老死以前会犯下更多的罪。
有一个很重要的现象要告诉你们。对于32位以上的应用程序而言,不管怎样使用malloc与new,几乎不可能致使“内存耗尽”。我在Windows 98下用Visual C++编写了测试程序,见示例7-9。这个程序会无休止地运行下去,根本不会终止。由于32位操做系统支持“虚存”,内存用完了,自动用硬盘空间顶替。我只听到硬盘嘎吱嘎吱地响,Window 98已经累得对键盘、鼠标毫无反应。
我能够得出这么一个结论:对于32位以上的应用程序,“内存耗尽”错误处理程序毫无用处。这下可把Unix和Windows程序员们乐坏了:反正错误处理程序不起做用,我就不写了,省了不少麻烦。
我不想误导读者,必须强调:不加错误处理将致使程序的质量不好,千万不可因小失大。
void main(void) { float *p = NULL; while(TRUE) { p = new float[1000000]; cout << “eat memory” << endl; if(p==NULL) exit(1); } } |
示例7-9试图耗尽操做系统的内存
函数malloc的原型以下:
void * malloc(size_t size);
用malloc申请一块长度为length的整数类型的内存,程序以下:
int *p = (int *) malloc(sizeof(int) * length);
咱们应当把注意力集中在两个要素上:“类型转换”和“sizeof”。
u malloc返回值的类型是void *,因此在调用malloc时要显式地进行类型转换,将void * 转换成所须要的指针类型。
u malloc函数自己并不识别要申请的内存是什么类型,它只关心内存的总字节数。咱们一般记不住int, float等数据类型的变量的确切字节数。例如int变量在16位系统下是2个字节,在32位下是4个字节;而float变量在16位系统下是4个字节,在32位下也是4个字节。最好用如下程序做一次测试:
cout << sizeof(char) <<endl;
cout << sizeof(int) <<endl;
cout << sizeof(unsigned int)<< endl;
cout << sizeof(long) <<endl;
cout << sizeof(unsigned long)<< endl;
cout << sizeof(float)<< endl;
cout << sizeof(double)<< endl;
cout <<sizeof(void *) << endl;
在malloc的“()”中使用sizeof运算符是良好的风格,但要小心有时咱们会昏了头,写出 p = malloc(sizeof(p))这样的程序来。
u 函数free的原型以下:
voidfree( void * memblock );
为何free函数不象malloc函数那样复杂呢?这是由于指针p的类型以及它所指的内存的容量事先都是知道的,语句free(p)能正确地释放内存。若是p是NULL指针,那么free对p不管操做多少次都不会出问题。若是p不是NULL指针,那么free对p连续操做两次就会致使程序运行错误。
运算符new使用起来要比函数malloc简单得多,例如:
int *p1 = (int *)malloc(sizeof(int) * length);
int *p2 = new int[length];
这是由于new内置了sizeof、类型转换和类型安全检查功能。对于非内部数据类型的对象而言,new在建立动态对象的同时完成了初始化工做。若是对象有多个构造函数,那么new的语句也能够有多种形式。例如
class Obj
{
public :
Obj(void); // 无参数的构造函数
Obj(int x); // 带一个参数的构造函数
…
}
void Test(void)
{
Obj *a = new Obj;
Obj *b = new Obj(1); // 初值为1
…
delete a;
delete b;
}
若是用new建立对象数组,那么只能使用对象的无参数构造函数。例如
Obj *objects = new Obj[100]; // 建立100个动态对象
不能写成
Obj *objects = new Obj[100](1);// 建立100个动态对象的同时赋初值1
在用delete释放对象数组时,留意不要丢了符号‘[]’。例如
delete []objects; // 正确的用法
delete objects; // 错误的用法
后者至关于delete objects[0],漏掉了另外99个对象。
我认识很多技术不错的C++/C程序员,不多有人能拍拍胸脯说通晓指针与内存管理(包括我本身)。我最初学习C语言时特别怕指针,致使我开发第一个应用软件(约1万行C代码)时没有使用一个指针,全用数组来顶替指针,实在蠢笨得过度。躲避指针不是办法,后来我改写了这个软件,代码量缩小到原先的一半。
个人经验教训是:
(1)越是怕指针,就越要使用指针。不会正确使用指针,确定算不上是合格的程序员。
(2)必须养成“使用调试器逐步跟踪程序”的习惯,只有这样才能发现问题的本质。
对比于C语言的函数,C++增长了重载(overloaded)、内联(inline)、const和virtual四种新机制。其中重载和内联机制既可用于全局函数也可用于类的成员函数,const与virtual机制仅用于类的成员函数。
重载和内联确定有其好处才会被C++语言采纳,可是不能够当成免费的午饭而滥用。本章将探究重载和内联的优势与局限性,说明什么状况下应该采用、不应采用以及要警戒错用。
8.1.1 重载的起源
天然语言中,一个词能够有许多不一样的含义,即该词被重载了。人们能够经过上下文来判断该词究竟是哪一种含义。“词的重载”能够使语言更加简练。例如“吃饭”的含义十分普遍,人们没有必要每次非得说清楚具体吃什么不可。别迂腐得象孔已己,说茴香豆的茴字有四种写法。
在C++程序中,能够将语义、功能类似的几个函数用同一个名字表示,即函数重载。这样便于记忆,提升了函数的易用性,这是C++语言采用重载机制的一个理由。例如示例8-1-1中的函数EatBeef,EatFish,EatChicken能够用同一个函数名Eat表示,用不一样类型的参数加以区别。
void EatBeef(…); // 能够改成 void Eat(Beef …); void EatFish(…); // 能够改成 void Eat(Fish …); void EatChicken(…); // 能够改成 void Eat(Chicken …);
|
示例8-1-1 重载函数Eat
C++语言采用重载机制的另外一个理由是:类的构造函数须要重载机制。由于C++规定构造函数与类同名(请参见第9章),构造函数只能有一个名字。若是想用几种不一样的方法建立对象该怎么办?别无选择,只能用重载机制来实现。因此类能够有多个同名的构造函数。
8.1.2 重载是如何实现的?
几个同名的重载函数仍然是不一样的函数,它们是如何区分的呢?咱们天然想到函数接口的两个要素:参数与返回值。
若是同名函数的参数不一样(包括类型、顺序不一样),那么容易区别出它们是不一样的函数。
若是同名函数仅仅是返回值类型不一样,有时能够区分,有时却不能。例如:
void Function(void);
int Function(void);
上述两个函数,第一个没有返回值,第二个的返回值是int类型。若是这样调用函数:
int x= Function ();
则能够判断出Function是第二个函数。问题是在C++/C程序中,咱们能够忽略函数的返回值。在这种状况下,编译器和程序员都不知道哪一个Function函数被调用。
因此只能靠参数而不能靠返回值类型的不一样来区分重载函数。编译器根据参数为每一个重载函数产生不一样的内部标识符。例如编译器为示例8-1-1中的三个Eat函数产生象_eat_beef、_eat_fish、_eat_chicken之类的内部标识符(不一样的编译器可能产生不一样风格的内部标识符)。
若是C++程序要调用已经被编译后的C函数,该怎么办?
假设某个C函数的声明以下:
void foo(int x, int y);
该函数被C编译器编译后在库中的名字为_foo,而C++编译器则会产生像_foo_int_int之类的名字用来支持函数重载和类型安全链接。因为编译后的名字不一样,C++程序不能直接调用C函数。C++提供了一个C链接交换指定符号extern“C”来解决这个问题。例如:
extern “C”
{
void foo(int x,int y);
… // 其它函数
}
或者写成
extern “C”
{
#include“myheader.h”
… // 其它C头文件
}
这就告诉C++编译译器,函数foo是个C链接,应该到库中找名字_foo而不是找_foo_int_int。C++编译器开发商已经对C标准库的头文件做了extern“C”处理,因此咱们能够用#include 直接引用这些头文件。
注意并非两个函数的名字相同就能构成重载。全局函数和类的成员函数同名不算重载,由于函数的做用域不一样。例如:
void Print(…); // 全局函数
class A
{…
voidPrint(…); // 成员函数
}
不论两个Print函数的参数是否不一样,若是类的某个成员函数要调用全局函数Print,为了与成员函数Print区别,全局函数被调用时应加‘::’标志。如
::Print(…); //表示Print是全局函数而非成员函数
8.1.3 小心隐式类型转换致使重载函数产生二义性
示例8-1-3中,第一个output函数的参数是int类型,第二个output函数的参数是float类型。因为数字自己没有类型,将数字看成参数时将自动进行类型转换(称为隐式类型转换)。语句output(0.5)将产生编译错误,由于编译器不知道该将0.5转换成int仍是float类型的参数。隐式类型转换在不少地方能够简化程序的书写,可是也可能留下隐患。
# include <iostream.h> void output( int x); // 函数声明 void output( float x); // 函数声明
void output( int x) { cout << " output int " << x << endl ; }
void output( float x) { cout << " output float " << x << endl ; }
void main(void) { int x = 1; float y = 1.0; output(x); // output int 1 output(y); // output float 1 output(1); // output int 1 // output(0.5); // error! ambiguous call, 由于自动类型转换 output(int(0.5)); // output int 0 output(float(0.5)); // output float 0.5 } |
示例8-1-3 隐式类型转换致使重载函数产生二义性
成员函数的重载、覆盖(override)与隐藏很容易混淆,C++程序员必需要搞清楚概念,不然错误将防不胜防。
8.2.1 重载与覆盖
成员函数被重载的特征:
(1)相同的范围(在同一个类中);
(2)函数名字相同;
(3)参数不一样;
(4)virtual关键字无关紧要。
覆盖是指派生类函数覆盖基类函数,特征是:
(1)不一样的范围(分别位于派生类与基类);
(2)函数名字相同;
(3)参数相同;
(4)基类函数必须有virtual关键字。
示例8-2-1中,函数Base::f(int)与Base::f(float)相互重载,而Base::g(void)被Derived::g(void)覆盖。
#include <iostream.h> class Base { public: void f(int x){ cout << "Base::f(int) " << x << endl; } void f(float x){ cout << "Base::f(float) " << x << endl; } virtual void g(void){ cout << "Base::g(void)" << endl;} };
|
class Derived : public Base { public: virtual void g(void){ cout << "Derived::g(void)" << endl;} };
|
void main(void) { Derived d; Base *pb = &d; pb->f(42); // Base::f(int) 42 pb->f(3.14f); // Base::f(float) 3.14 pb->g(); // Derived::g(void) } |
示例8-2-1成员函数的重载和覆盖
8.2.2 使人迷惑的隐藏规则
原本仅仅区别重载与覆盖并不算困难,可是C++的隐藏规则使问题复杂性陡然增长。这里“隐藏”是指派生类的函数屏蔽了与其同名的基类函数,规则以下:
(1)若是派生类的函数与基类的函数同名,可是参数不一样。此时,不论有无virtual关键字,基类的函数将被隐藏(注意别与重载混淆)。
(2)若是派生类的函数与基类的函数同名,而且参数也相同,可是基类函数没有virtual关键字。此时,基类的函数被隐藏(注意别与覆盖混淆)。
示例程序8-2-2(a)中:
(1)函数Derived::f(float)覆盖了Base::f(float)。
(2)函数Derived::g(int)隐藏了Base::g(float),而不是重载。
(3)函数Derived::h(float)隐藏了Base::h(float),而不是覆盖。
#include <iostream.h> class Base { public: virtual void f(float x){ cout << "Base::f(float) " << x << endl; } void g(float x){ cout << "Base::g(float) " << x << endl; } void h(float x){ cout << "Base::h(float) " << x << endl; } }; |
class Derived : public Base { public: virtual void f(float x){ cout << "Derived::f(float) " << x << endl; } void g(int x){ cout << "Derived::g(int) " << x << endl; } void h(float x){ cout << "Derived::h(float) " << x << endl; } }; |
示例8-2-2(a)成员函数的重载、覆盖和隐藏
据做者考察,不少C++程序员没有意识到有“隐藏”这回事。因为认识不够深入,“隐藏”的发生可谓神出鬼没,经常产生使人迷惑的结果。
示例8-2-2(b)中,bp和dp指向同一地址,按理说运行结果应该是相同的,可事实并不是这样。
void main(void) { Derived d; Base *pb = &d; Derived *pd = &d; // Good : behavior depends solely on type of the object pb->f(3.14f); // Derived::f(float) 3.14 pd->f(3.14f); // Derived::f(float) 3.14
// Bad : behavior depends on type of the pointer pb->g(3.14f); // Base::g(float) 3.14 pd->g(3.14f); // Derived::g(int) 3 (surprise!)
// Bad : behavior depends on type of the pointer pb->h(3.14f); // Base::h(float) 3.14 (surprise!) pd->h(3.14f); // Derived::h(float) 3.14 } |
示例8-2-2(b) 重载、覆盖和隐藏的比较
8.2.3 摆脱隐藏
隐藏规则引发了很多麻烦。示例8-2-3程序中,语句pd->f(10)的本意是想调用函数Base::f(int),可是Base::f(int)不幸被Derived::f(char *)隐藏了。因为数字10不能被隐式地转化为字符串,因此在编译时出错。
class Base { public: void f(int x); }; |
class Derived : public Base { public: void f(char *str); }; |
void Test(void) { Derived *pd = new Derived; pd->f(10); // error } |
示例8-2-3 因为隐藏而致使错误
从示例8-2-3看来,隐藏规则彷佛很愚蠢。可是隐藏规则至少有两个存在的理由:
u 写语句pd->f(10)的人可能真的想调用Derived::f(char *)函数,只是他误将参数写错了。有了隐藏规则,编译器就能够明确指出错误,这未必不是好事。不然,编译器会静悄悄地将错就错,程序员将很难发现这个错误,流下祸根。
u 假如类Derived有多个基类(多重继承),有时搞不清楚哪些基类定义了函数f。若是没有隐藏规则,那么pd->f(10)可能会调用一个出乎意料的基类函数f。尽管隐藏规则看起来不怎么有道理,但它的确能消灭这些意外。
示例8-2-3中,若是语句pd->f(10)必定要调用函数Base::f(int),那么将类Derived修改成以下便可。
class Derived : public Base
{
public:
void f(char *str);
void f(int x) { Base::f(x); }
};
有一些参数的值在每次函数调用时都相同,书写这样的语句会令人厌烦。C++语言采用参数的缺省值使书写变得简洁(在编译时,缺省值由编译器自动插入)。
参数缺省值的使用规则:
l 【规则8-3-1】参数缺省值只能出如今函数的声明中,而不能出如今定义体中。
例如:
void Foo(int x=0, int y=0); // 正确,缺省值出如今函数的声明中
void Foo(int x=0, int y=0) // 错误,缺省值出如今函数的定义体中
{
…
}
为何会这样?我想是有两个缘由:一是函数的实现(定义)原本就与参数是否有缺省值无关,因此没有必要让缺省值出如今函数的定义体中。二是参数的缺省值可能会改动,显然修改函数的声明比修改函数的定义要方便。
l 【规则8-3-2】 若是函数有多个参数,参数只能从后向前挨个儿缺省,不然将致使函数调用语句怪模怪样。
正确的示例以下:
void Foo(int x, int y=0, int z=0);
错误的示例以下:
void Foo(int x=0, int y, int z=0);
要注意,使用参数的缺省值并无赋予函数新的功能,仅仅是使书写变得简洁一些。它可能会提升函数的易用性,可是也可能会下降函数的可理解性。因此咱们只能适当地使用参数的缺省值,要防止使用不当产生负面效果。示例8-3-2中,不合理地使用参数的缺省值将致使重载函数output产生二义性。
#include <iostream.h> void output( int x); void output( int x, float y=0.0);
|
void output( int x) { cout << " output int " << x << endl ; }
|
void output( int x, float y) { cout << " output int " << x << " and float " < < y << endl ; }
|
void main(void) { int x=1; float y=0.5; // output(x); // error! ambiguous call output(x,y); // output int 1 and float 0.5 }
|
示例8-3-2 参数的缺省值将致使重载函数产生二义性
8.4.1 概念
在C++语言中,能够用关键字operator加上运算符来表示函数,叫作运算符重载。例如两个复数相加函数:
Complex Add(const Complex &a, constComplex &b);
能够用运算符重载来表示:
Complex operator +(const Complex &a,const Complex &b);
运算符与普通函数在调用时的不一样之处是:对于普通函数,参数出如今圆括号内;而对于运算符,参数出如今其左、右侧。例如
Complex a, b, c;
…
c = Add(a, b); // 用普通函数
c = a + b; // 用运算符 +
若是运算符被重载为全局函数,那么只有一个参数的运算符叫作一元运算符,有两个参数的运算符叫作二元运算符。
若是运算符被重载为类的成员函数,那么一元运算符没有参数,二元运算符只有一个右侧参数,由于对象本身成了左侧参数。
从语法上讲,运算符既能够定义为全局函数,也能够定义为成员函数。文献[Murray , p44-p47]对此问题做了较多的阐述,并总结了表8-4-1的规则。
运算符 |
规则 |
全部的一元运算符 |
建议重载为成员函数 |
= () [] -> |
只能重载为成员函数 |
+= -= /= *= &= |= ~= %= >>= <<= |
建议重载为成员函数 |
全部其它运算符 |
建议重载为全局函数 |
表8-4-1 运算符的重载规则
因为C++语言支持函数重载,才能将运算符当成函数来用,C语言就不行。咱们要以日常心来对待运算符重载:
(1)不要过度担忧本身不会用,它的本质仍然是程序员们熟悉的函数。
(2)不要过度热心地使用,若是它不能使代码变得更加易读易写,那就别用,不然会自找麻烦。
8.4.2 不能被重载的运算符
在C++运算符集合中,有一些运算符是不容许被重载的。这种限制是出于安全方面的考虑,可防止错误和混乱。
(1)不能改变C++内部数据类型(如int,float等)的运算符。
(2)不能重载‘.’,由于‘.’在类中对任何成员都有意义,已经成为标准用法。
(3)不能重载目前C++运算符集合中没有的符号,如#,@,$等。缘由有两点,一是难以理解,二是难以肯定优先级。
(4)对已经存在的运算符进行重载时,不能改变优先级规则,不然将引发混乱。
8.5.1 用内联取代宏代码
C++ 语言支持函数内联,其目的是为了提升函数的执行效率(速度)。
在C程序中,能够用宏代码提升执行效率。宏代码自己不是函数,但使用起来象函数。预处理器用复制宏代码的方式代替函数调用,省去了参数压栈、生成汇编语言的CALL调用、返回参数、执行return等过程,从而提升了速度。使用宏代码最大的缺点是容易出错,预处理器在复制宏代码时经常产生意想不到的边际效应。例如
#define MAX(a, b) (a) > (b) ? (a) : (b)
语句
result = MAX(i, j) + 2 ;
将被预处理器解释为
result = (i) > (j) ? (i) : (j) + 2 ;
因为运算符‘+’比运算符‘:’的优先级高,因此上述语句并不等价于指望的
result = ( (i) > (j) ? (i) : (j) ) + 2 ;
若是把宏代码改写为
#define MAX(a, b) ( (a) > (b) ? (a) : (b) )
则能够解决由优先级引发的错误。可是即便使用修改后的宏代码也不是万无一失的,例如语句
result = MAX(i++, j);
将被预处理器解释为
result = (i++) > (j) ? (i++) : (j);
对于C++ 而言,使用宏代码还有另外一种缺点:没法操做类的私有数据成员。
让咱们看看C++ 的“函数内联”是如何工做的。对于任何内联函数,编译器在符号表里放入函数的声明(包括名字、参数类型、返回值类型)。若是编译器没有发现内联函数存在错误,那么该函数的代码也被放入符号表里。在调用一个内联函数时,编译器首先检查调用是否正确(进行类型安全检查,或者进行自动类型转换,固然对全部的函数都同样)。若是正确,内联函数的代码就会直接替换函数调用,因而省去了函数调用的开销。这个过程与预处理有显著的不一样,由于预处理器不能进行类型安全检查,或者进行自动类型转换。假如内联函数是成员函数,对象的地址(this)会被放在合适的地方,这也是预处理器办不到的。
C++ 语言的函数内联机制既具有宏代码的效率,又增长了安全性,并且能够自由操做类的数据成员。因此在C++ 程序中,应该用内联函数取代全部宏代码,“断言assert”恐怕是惟一的例外。assert是仅在Debug版本起做用的宏,它用于检查“不该该”发生的状况。为了避免在程序的Debug版本和Release版本引发差异,assert不该该产生任何反作用。若是assert是函数,因为函数调用会引发内存、代码的变更,那么将致使Debug版本与Release版本存在差别。因此assert不是函数,而是宏。(参见6.5节“使用断言”)
8.5.2 内联函数的编程风格
关键字inline必须与函数定义体放在一块儿才能使函数成为内联,仅将inline放在函数声明前面不起任何做用。以下风格的函数Foo不能成为内联函数:
inline void Foo(int x, int y); // inline仅与函数声明放在一块儿
void Foo(int x, int y)
{
…
}
而以下风格的函数Foo则成为内联函数:
void Foo(int x, int y);
inline void Foo(int x, int y) // inline与函数定义体放在一块儿
{
…
}
因此说,inline是一种“用于实现的关键字”,而不是一种“用于声明的关键字”。通常地,用户能够阅读函数的声明,可是看不到函数的定义。尽管在大多数教科书中内联函数的声明、定义体前面都加了inline关键字,但我认为inline不该该出如今函数的声明中。这个细节虽然不会影响函数的功能,可是体现了高质量C++/C程序设计风格的一个基本原则:声明与定义不可混为一谈,用户没有必要、也不该该知道函数是否须要内联。
定义在类声明之中的成员函数将自动地成为内联函数,例如
class A
{
public:
voidFoo(int x, int y) { … } // 自动地成为内联函数
}
将成员函数的定义体放在类声明之中虽然能带来书写上的方便,但不是一种良好的编程风格,上例应该改为:
// 头文件
class A
{
public:
voidFoo(int x, int y);
}
// 定义文件
inline void A::Foo(int x, int y)
{
…
}
8.5.3 慎用内联
内联能提升函数的执行效率,为何不把全部的函数都定义成内联函数?
若是全部的函数都是内联函数,还用得着“内联”这个关键字吗?
内联是以代码膨胀(复制)为代价,仅仅省去了函数调用的开销,从而提升函数的执行效率。若是执行函数体内代码的时间,相比于函数调用的开销较大,那么效率的收获会不多。另外一方面,每一处内联函数的调用都要复制代码,将使程序的总代码量增大,消耗更多的内存空间。如下状况不宜使用内联:
(1)若是函数体内的代码比较长,使用内联将致使内存消耗代价较高。
(2)若是函数体内出现循环,那么执行函数体内代码的时间要比函数调用的开销大。
类的构造函数和析构函数容易让人误解成使用内联更有效。要小心构造函数和析构函数可能会隐藏一些行为,如“偷偷地”执行了基类或成员对象的构造函数和析构函数。因此不要随便地将构造函数和析构函数的定义体放在类声明中。
一个好的编译器将会根据函数的定义体,自动地取消不值得的内联(这进一步说明了inline不该该出如今函数的声明中)。
C++ 语言中的重载、内联、缺省参数、隐式转换等机制展示了不少优势,可是这些优势的背后都隐藏着一些隐患。正如人们的饮食,少食和暴食都不可取,应当恰到好处。咱们要辨证地看待C++的新机制,应该恰如其分地使用它们。虽然这会使咱们编程时多费一些心思,少了一些痛快,但这才是编程的艺术。
构造函数、析构函数与赋值函数是每一个类最基本的函数。它们太普通以至让人容易麻痹大意,其实这些貌似简单的函数就象没有顶盖的下水道那样危险。
每一个类只有一个析构函数和一个赋值函数,但能够有多个构造函数(包含一个拷贝构造函数,其它的称为普通构造函数)。对于任意一个类A,若是不想编写上述函数,C++编译器将自动为A产生四个缺省的函数,如
A(void); // 缺省的无参数构造函数
A(const A &a); // 缺省的拷贝构造函数
~A(void); // 缺省的析构函数
A & operate=(const A &a); // 缺省的赋值函数
这不由让人疑惑,既然能自动生成函数,为何还要程序员编写?
缘由以下:
(1)若是使用“缺省的无参数构造函数”和“缺省的析构函数”,等于放弃了自主“初始化”和“清除”的机会,C++发明人Stroustrup的好心好意白费了。
(2)“缺省的拷贝构造函数”和“缺省的赋值函数”均采用“位拷贝”而非“值拷贝”的方式来实现,假若类中含有指针变量,这两个函数注定将出错。
对于那些没有吃够苦头的C++程序员,若是他说编写构造函数、析构函数与赋值函数很容易,能够不用动脑筋,代表他的认识还比较肤浅,水平有待于提升。
本章以类String的设计与实现为例,深刻阐述被不少教科书忽视了的道理。String的结构以下:
class String
{
public:
String(const char *str = NULL); // 普通构造函数
String(const String &other); // 拷贝构造函数
~ String(void); // 析构函数
String & operate =(const String&other); // 赋值函数
private:
char *m_data; // 用于保存字符串
};
做为比C更先进的语言,C++提供了更好的机制来加强程序的安全性。C++编译器具备严格的类型安全检查功能,它几乎能找出程序中全部的语法问题,这的确帮了程序员的大忙。可是程序经过了编译检查并不表示错误已经不存在了,在“错误”的你们庭里,“语法错误”的地位只能算是小弟弟。级别高的错误一般隐藏得很深,就象狡猾的罪犯,想逮住他可不容易。
根据经验,很多难以察觉的程序错误是因为变量没有被正确初始化或清除形成的,而初始化和清除工做很容易被人遗忘。Stroustrup在设计C++语言时充分考虑了这个问题并很好地予以解决:把对象的初始化工做放在构造函数中,把清除工做放在析构函数中。当对象被建立时,构造函数被自动执行。当对象消亡时,析构函数被自动执行。这下就不用担忧忘了对象的初始化和清除工做。
构造函数与析构函数的名字不能随便起,必须让编译器认得出才能够被自动执行。Stroustrup的命名方法既简单又合理:让构造函数、析构函数与类同名,因为析构函数的目的与构造函数的相反,就加前缀‘~’以示区别。
除了名字外,构造函数与析构函数的另外一个特别之处是没有返回值类型,这与返回值类型为void的函数不一样。构造函数与析构函数的使命很是明确,就象出生与死亡,光溜溜地来光溜溜地去。若是它们有返回值类型,那么编译器将不知所措。为了防止节外生枝,干脆规定没有返回值类型。(以上典故参考了文献[Eekel, p55-p56])
构造函数有个特殊的初始化方式叫“初始化表达式表”(简称初始化表)。初始化表位于函数参数表以后,却在函数体 {} 以前。这说明该表里的初始化工做发生在函数体内的任何代码被执行以前。
构造函数初始化表的使用规则:
u 若是类存在继承关系,派生类必须在其初始化表里调用基类的构造函数。
例如
class A
{…
A(int x); // A的构造函数
};
class B : public A
{…
B(int x, int y);// B的构造函数
};
B::B(int x, int y)
: A(x) // 在初始化表里调用A的构造函数
{
…
}
u 类的const常量只能在初始化表里被初始化,由于它不能在函数体内用赋值的方式来初始化(参见5.4节)。
u 类的数据成员的初始化能够采用初始化表或函数体内赋值两种方式,这两种方式的效率不彻底相同。
非内部数据类型的成员对象应当采用第一种方式初始化,以获取更高的效率。例如
class A
{…
A(void); // 无参数构造函数
A(const A &other); // 拷贝构造函数
A & operate =( const A &other); // 赋值函数
};
classB
{
public:
B(const A &a); // B的构造函数
private:
A m_a; // 成员对象
};
示例9-2(a)中,类B的构造函数在其初始化表里调用了类A的拷贝构造函数,从而将成员对象m_a初始化。
示例9-2 (b)中,类B的构造函数在函数体内用赋值的方式将成员对象m_a初始化。咱们看到的只是一条赋值语句,但实际上B的构造函数干了两件事:先暗地里建立m_a对象(调用了A的无参数构造函数),再调用类A的赋值函数,将参数a赋给m_a。
B::B(const A &a) : m_a(a) { … } |
B::B(const A &a) { m_a = a; … } |
示例9-2(a) 成员对象在初始化表中被初始化 示例9-2(b) 成员对象在函数体内被初始化
对于内部数据类型的数据成员而言,两种初始化方式的效率几乎没有区别,但后者的程序版式彷佛更清晰些。若类F的声明以下:
class F
{
public:
F(int x, int y); // 构造函数
private:
int m_x, m_y;
int m_i, m_j;
}
示例9-2(c)中F的构造函数采用了第一种初始化方式,示例9-2(d)中F的构造函数采用了第二种初始化方式。
F::F(int x, int y) : m_x(x), m_y(y) { m_i = 0; m_j = 0; } |
F::F(int x, int y) { m_x = x; m_y = y; m_i = 0; m_j = 0; } |
示例9-2(c) 数据成员在初始化表中被初始化 示例9-2(d) 数据成员在函数体内被初始化
构造从类层次的最根处开始,在每一层中,首先调用基类的构造函数,而后调用成员对象的构造函数。析构则严格按照与构造相反的次序执行,该次序是惟一的,不然编译器将没法自动执行析构过程。
一个有趣的现象是,成员对象初始化的次序彻底不受它们在初始化表中次序的影响,只由成员对象在类中声明的次序决定。这是由于类的声明是惟一的,而类的构造函数能够有多个,所以会有多个不一样次序的初始化表。若是成员对象按照初始化表的次序进行构造,这将致使析构函数没法获得惟一的逆序。[Eckel, p260-261]
//String的普通构造函数
String::String(constchar *str)
{
if(str==NULL)
{
m_data= new char[1];
*m_data= ‘\0’;
}
else
{
intlength = strlen(str);
m_data= new char[length+1];
strcpy(m_data,str);
}
}
// String的析构函数
String::~String(void)
{
delete [] m_data;
// 因为m_data是内部数据类型,也能够写成 delete m_data;
}
因为并不是全部的对象都会使用拷贝构造函数和赋值函数,程序员可能对这两个函数有些轻视。请先记住如下的警告,在阅读正文时就会多心:
u 本章开头讲过,若是不主动编写拷贝构造函数和赋值函数,编译器将以“位拷贝”的方式自动生成缺省的函数。假若类中含有指针变量,那么这两个缺省的函数就隐含了错误。以类String的两个对象a,b为例,假设a.m_data的内容为“hello”,b.m_data的内容为“world”。
现将a赋给b,缺省赋值函数的“位拷贝”意味着执行b.m_data = a.m_data。这将形成三个错误:一是b.m_data原有的内存没被释放,形成内存泄露;二是b.m_data和a.m_data指向同一块内存,a或b任何一方变更都会影响另外一方;三是在对象被析构时,m_data被释放了两次。
u 拷贝构造函数和赋值函数很是容易混淆,常致使错写、错用。拷贝构造函数是在对象被建立时调用的,而赋值函数只能被已经存在了的对象调用。如下程序中,第三个语句和第四个语句很类似,你分得清楚哪一个调用了拷贝构造函数,哪一个调用了赋值函数吗?
String a(“hello”);
String b(“world”);
String c = a; //调用了拷贝构造函数,最好写成 c(a);
c = b; // 调用了赋值函数
本例中第三个语句的风格较差,宜改写成Stringc(a) 以区别于第四个语句。
// 拷贝构造函数
String::String(constString &other)
{
// 容许操做other的私有成员m_data
int length = strlen(other.m_data);
m_data = new char[length+1];
strcpy(m_data, other.m_data);
}
// 赋值函数
String &String::operate =(const String &other)
{
// (1) 检查自赋值
if(this == &other)
return*this;
// (2) 释放原有的内存资源
delete [] m_data;
// (3)分配新的内存资源,并复制内容
int length = strlen(other.m_data);
m_data = new char[length+1];
strcpy(m_data, other.m_data);
// (4)返回本对象的引用
return *this;
}
类String拷贝构造函数与普通构造函数(参见9.4节)的区别是:在函数入口处无需与NULL进行比较,这是由于“引用”不多是NULL,而“指针”能够为NULL。
类String的赋值函数比构造函数复杂得多,分四步实现:
(1)第一步,检查自赋值。你可能会认为画蛇添足,难道有人会愚蠢到写出 a = a 这样的自赋值语句!的确不会。可是间接的自赋值仍有可能出现,例如
// 内容自赋值 b = a; … c = b; … a = c; |
// 地址自赋值 b = &a; … a = *b; |
也许有人会说:“即便出现自赋值,我也能够不理睬,大不了化点时间让对象复制本身而已,反正不会出错!”
他真的说错了。看看第二步的delete,自杀后还能复制本身吗?因此,若是发现自赋值,应该立刻终止函数。注意不要将检查自赋值的if语句
if(this ==&other)
错写成为
if( *this == other)
(2)第二步,用delete释放原有的内存资源。若是如今不释放,之后就没机会了,将形成内存泄露。
(3)第三步,分配新的内存资源,并复制字符串。注意函数strlen返回的是有效字符串长度,不包含结束符‘\0’。函数strcpy则连‘\0’一块儿复制。
(4)第四步,返回本对象的引用,目的是为了实现象 a = b = c 这样的链式表达。注意不要将 return *this 错写成 return this 。那么可否写成return other 呢?效果不是同样吗?
不能够!由于咱们不知道参数other的生命期。有可能other是个临时对象,在赋值结束后它立刻消失,那么return other返回的将是垃圾。
若是咱们实在不想编写拷贝构造函数和赋值函数,又不容许别人使用编译器生成的缺省函数,怎么办?
偷懒的办法是:只需将拷贝构造函数和赋值函数声明为私有函数,不用编写代码。
例如:
class A
{ …
private:
A(const A &a); // 私有的拷贝构造函数
A & operate =(const A &a); // 私有的赋值函数
};
若是有人试图编写以下程序:
A b(a); //调用了私有的拷贝构造函数
b = a; // 调用了私有的赋值函数
编译器将指出错误,由于外界不能够操做A的私有函数。
基类的构造函数、析构函数、赋值函数都不能被派生类继承。若是类之间存在继承关系,在编写上述基本函数时应注意如下事项:
u 派生类的构造函数应在其初始化表里调用基类的构造函数。
u 基类与派生类的析构函数应该为虚(即加virtual关键字)。例如
#include <iostream.h>
class Base
{
public:
virtual ~Base() { cout<<"~Base" << endl ; }
};
class Derived :public Base
{
public:
virtual ~Derived() { cout<<"~Derived" << endl ; }
};
void main(void)
{
Base * pB = new Derived; // upcast
delete pB;
}
输出结果为:
~Derived
~Base
若是析构函数不为虚,那么输出结果为
~Base
u 在编写派生类的赋值函数时,注意不要忘记对基类的数据成员从新赋值。例如:
classBase
{
public:
…
Base & operate =(const Base &other); // 类Base的赋值函数
private:
int m_i, m_j, m_k;
};
classDerived : public Base
{
public:
…
Derived & operate =(const Derived&other); // 类Derived的赋值函数
private:
int m_x, m_y, m_z;
};
Derived& Derived::operate =(const Derived &other)
{
//(1)检查自赋值
if(this == &other)
return*this;
//(2)对基类的数据成员从新赋值
Base::operate =(other); // 由于不能直接操做私有数据成员
//(3)对派生类的数据成员赋值
m_x = other.m_x;
m_y = other.m_y;
m_z = other.m_z;
//(4)返回本对象的引用
return *this;
}
有些C++程序设计书籍称构造函数、析构函数和赋值函数是类的“Big-Three”,它们的确是任何类最重要的函数,不容轻视。
也许你认为本章的内容已经够多了,学会了就能平安无事,我不能做这个保证。若是你但愿吃透“Big-Three”,请好好阅读参考文献[Cline] [Meyers] [Murry]。
对象(Object)是类(Class)的一个实例(Instance)。若是将对象比做房子,那么类就是房子的设计图纸。因此面向对象设计的重点是类的设计,而不是对象的设计。
对于C++程序而言,设计孤立的类是比较容易的,难的是正确设计基类及其派生类。本章仅仅论述“继承”(Inheritance)和“组合”(Composition)的概念。
注意,当前面向对象技术的应用热点是COM和CORBA,这些内容超出了C++教材的范畴,请阅读COM和CORBA相关论著。
若是A是基类,B是A的派生类,那么B将继承A的数据和函数。例如:
classA
{
public:
void Func1(void);
void Func2(void);
};
class B : publicA
{
public:
void Func3(void);
void Func4(void);
};
main()
{
B b;
b.Func1(); // B从A继承了函数Func1
b.Func2(); // B从A继承了函数Func2
b.Func3();
b.Func4();
}
这个简单的示例程序说明了一个事实:C++的“继承”特性能够提升程序的可复用性。正由于“继承”太有用、太容易用,才要防止乱用“继承”。咱们应当给“继承”立一些使用规则。
l 【规则10-1-1】若是类A和类B绝不相关,不能够为了使B的功能更多些而让B继承A的功能和属性。不要以为“白吃白不吃”,让一个好端端的健壮青年平白无故地吃人参补身体。
l 【规则10-1-2】若在逻辑上B是A的“一种”(a kind of ),则容许B继承A的功能和属性。例如男人(Man)是人(Human)的一种,男孩(Boy)是男人的一种。那么类Man能够从类Human派生,类Boy能够从类Man派生。
class Human
{
…
};
class Man : public Human
{
…
};
class Boy : public Man
{
…
};
u 注意事项
【规则10-1-2】看起来很简单,可是实际应用时可能会有意外,继承的概念在程序世界与现实世界并不彻底相同。
例如从生物学角度讲,鸵鸟(Ostrich)是鸟(Bird)的一种,按理说类Ostrich应该能够从类Bird派生。可是鸵鸟不能飞,那么Ostrich::Fly是什么东西?
class Bird
{
public:
virtual void Fly(void);
…
};
class Ostrich : public Bird
{
…
};
例如从数学角度讲,圆(Circle)是一种特殊的椭圆(Ellipse),按理说类Circle应该能够从类Ellipse派生。可是椭圆有长轴和短轴,若是圆继承了椭圆的长轴和短轴,岂非多此一举?
因此更加严格的继承规则应当是:若在逻辑上B是A的“一种”,而且A的全部功能和属性对B而言都有意义,则容许B继承A的功能和属性。
l 【规则10-2-1】若在逻辑上A是B的“一部分”(a part of),则不容许B从A派生,而是要用A和其它东西组合出B。
例如眼(Eye)、鼻(Nose)、口(Mouth)、耳(Ear)是头(Head)的一部分,因此类Head应该由类Eye、Nose、Mouth、Ear组合而成,不是派生而成。如示例10-2-1所示。
class Eye { void Look(void); }; |
class Nose { void Smell(void); }; |
class Mouth { void Eat(void); }; |
class Ear { void Listen(void); }; |
// 正确的设计,虽然代码冗长。 class Head { public: void Look(void) { m_eye.Look(); } void Smell(void) { m_nose.Smell(); } void Eat(void) { m_mouth.Eat(); } void Listen(void) { m_ear.Listen(); } private: Eye m_eye; Nose m_nose; Mouth m_mouth; Ear m_ear; }; |
示例10-2-1 Head由Eye、Nose、Mouth、Ear组合而成
若是容许Head从Eye、Nose、Mouth、Ear派生而成,那么Head将自动具备Look、 Smell、Eat、Listen这些功能。示例10-2-2十分简短而且运行正确,可是这种设计方法倒是不对的。
// 功能正确而且代码简洁,可是设计方法不对。 class Head : public Eye, public Nose, public Mouth, public Ear { }; |
示例10-2-2 Head从Eye、Nose、Mouth、Ear派生而成
一只公鸡使劲地追打一只刚下了蛋的母鸡,你知道为何吗?
由于母鸡下了鸭蛋。
不少程序员经不起“继承”的诱惑而犯下设计错误。“运行正确”的程序不见得是高质量的程序,此处就是一个例证。
看到const关键字,C++程序员首先想到的多是const常量。这可不是良好的条件反射。若是只知道用const定义常量,那么至关于把火药仅用于制做鞭炮。const更大的魅力是它能够修饰函数的参数、返回值,甚至函数的定义体。
const是constant的缩写,“恒定不变”的意思。被const修饰的东西都受到强制保护,能够预防意外的变更,能提升程序的健壮性。因此不少C++程序设计书籍建议:“Useconst whenever you need”。
11.1.1 用const修饰函数的参数
若是参数做输出用,不论它是什么数据类型,也不论它采用“指针传递”仍是“引用传递”,都不能加const修饰,不然该参数将失去输出功能。
const只能修饰输入参数:
u 若是输入参数采用“指针传递”,那么加const修饰能够防止意外地改动该指针,起到保护做用。
例如StringCopy函数:
voidStringCopy(char *strDestination, const char *strSource);
其中strSource是输入参数,strDestination是输出参数。给strSource加上const修饰后,若是函数体内的语句试图改动strSource的内容,编译器将指出错误。
u 若是输入参数采用“值传递”,因为函数将自动产生临时变量用于复制该参数,该输入参数原本就无需保护,因此不要加const修饰。
例如不要将函数void Func1(int x) 写成void Func1(const int x)。同理不要将函数void Func2(A a) 写成void Func2(const A a)。其中A为用户自定义的数据类型。
u 对于非内部数据类型的参数而言,象void Func(A a) 这样声明的函数注定效率比较底。由于函数体内将产生A类型的临时对象用于复制参数a,而临时对象的构造、复制、析构过程都将消耗时间。
为了提升效率,能够将函数声明改成void Func(A &a),由于“引用传递”仅借用一下参数的别名而已,不须要产生临时对象。可是函数void Func(A &a) 存在一个缺点:“引用传递”有可能改变参数a,这是咱们不指望的。解决这个问题很容易,加const修饰便可,所以函数最终成为void Func(const A &a)。
以此类推,是否应将void Func(int x) 改写为void Func(const int&x),以便提升效率?彻底没有必要,由于内部数据类型的参数不存在构造、析构的过程,而复制也很是快,“值传递”和“引用传递”的效率几乎至关。
问题是如此的缠绵,我只好将“const &”修饰输入参数的用法总结一下,如表11-1-1所示。
对于非内部数据类型的输入参数,应该将“值传递”的方式改成“const引用传递”,目的是提升效率。例如将void Func(A a) 改成void Func(const A &a)。
|
对于内部数据类型的输入参数,不要将“值传递”的方式改成“const引用传递”。不然既达不到提升效率的目的,又下降了函数的可理解性。例如void Func(int x) 不该该改成void Func(const int &x)。
|
表11-1-1 “const&”修饰输入参数的规则
11.1.2 用const修饰函数的返回值
u 若是给以“指针传递”方式的函数返回值加const修饰,那么函数返回值(即指针)的内容不能被修改,该返回值只能被赋给加const修饰的同类型指针。
例如函数
constchar * GetString(void);
以下语句将出现编译错误:
char*str = GetString();
正确的用法是
constchar *str = GetString();
u 若是函数返回值采用“值传递方式”,因为函数会把返回值复制到外部临时的存储单元中,加const修饰没有任何价值。
例如不要把函数int GetInt(void) 写成const int GetInt(void)。
同理不要把函数A GetA(void) 写成const A GetA(void),其中A为用户自定义的数据类型。
若是返回值不是内部数据类型,将函数A GetA(void) 改写为const A & GetA(void)的确能提升效率。但此时千万千万要当心,必定要搞清楚函数到底是想返回一个对象的“拷贝”仍是仅返回“别名”就能够了,不然程序会出错。见6.2节“返回值的规则”。
u 函数返回值采用“引用传递”的场合并很少,这种方式通常只出如今类的赋值函数中,目的是为了实现链式表达。
例如
class A
{…
A& operate = (const A &other); //赋值函数
};
A a, b, c; // a, b, c 为A的对象
…
a = b = c; // 正常的链式赋值
(a = b) = c; // 不正常的链式赋值,但合法
若是将赋值函数的返回值加const修饰,那么该返回值的内容不容许被改动。上例中,语句 a = b = c仍然正确,可是语句 (a = b) = c 则是非法的。
11.1.3 const成员函数
任何不会修改数据成员的函数都应该声明为const类型。若是在编写const成员函数时,不慎修改了数据成员,或者调用了其它非const成员函数,编译器将指出错误,这无疑会提升程序的健壮性。
如下程序中,类stack的成员函数GetCount仅用于计数,从逻辑上讲GetCount应当为const函数。编译器将指出GetCount函数中的错误。
class Stack
{
public:
void Push(int elem);
int Pop(void);
int GetCount(void) const; //const成员函数
private:
int m_num;
int m_data[100];
};
int Stack::GetCount(void) const
{
++m_num; // 编译错误,企图修改数据成员m_num
Pop(); // 编译错误,企图调用非const函数
return m_num;
}
const成员函数的声明看起来怪怪的:const关键字只能放在函数声明的尾部,大概是由于其它地方都已经被占用了。
程序的时间效率是指运行速度,空间效率是指程序占用内存或者外存的情况。
全局效率是指站在整个系统的角度上考虑的效率,局部效率是指站在模块或函数角度上考虑的效率。
l 【规则11-2-1】不要一味地追求程序的效率,应当在知足正确性、可靠性、健壮性、可读性等质量因素的前提下,设法提升程序的效率。
l 【规则11-2-2】以提升程序的全局效率为主,提升局部效率为辅。
l 【规则11-2-3】在优化程序的效率时,应当先找出限制效率的“瓶颈”,不要在可有可无之处优化。
l 【规则11-2-4】先优化数据结构和算法,再优化执行代码。
l 【规则11-2-5】有时候时间效率和空间效率可能对立,此时应当分析那个更重要,做出适当的折衷。例如多花费一些内存来提升性能。
l 【规则11-2-6】不要追求紧凑的代码,由于紧凑的代码并不能产生高效的机器码。
² 【建议11-3-1】小心那些视觉上不易分辨的操做符发生书写错误。
咱们常常会把“==”误写成“=”,象“||”、“&&”、“<=”、“>=”这类符号也很容易发生“丢1”失误。然而编译器却不必定能自动指出这类错误。
² 【建议11-3-2】变量(指针、数组)被建立以后应当及时把它们初始化,以防止把未被初始化的变量当成右值使用。
² 【建议11-3-3】小心变量的初值、缺省值错误,或者精度不够。
² 【建议11-3-4】小心数据类型转换发生错误。尽可能使用显式的数据类型转换(让人们知道发生了什么事),避免让编译器轻悄悄地进行隐式的数据类型转换。
² 【建议11-3-5】小心变量发生上溢或下溢,数组的下标越界。
² 【建议11-3-6】小心忘记编写错误处理程序,小心错误处理程序自己有误。
² 【建议11-3-7】小心文件I/O有错误。
² 【建议11-3-8】避免编写技巧性很高代码。
² 【建议11-3-9】不要设计面面俱到、很是灵活的数据结构。
² 【建议11-3-10】若是原有的代码质量比较好,尽可能复用它。可是不要修补不好劲的代码,应当从新编写。
² 【建议11-3-11】尽可能使用标准库函数,不要“发明”已经存在的库函数。
² 【建议11-3-12】尽可能不要使用与具体硬件或软件环境关系密切的变量。
² 【建议11-3-13】把编译器的选择项设置为最严格状态。
² 【建议11-3-14】若是可能的话,使用PC-Lint、LogiScope等工具进行代码审查。
[Cline] Marshall P. Cline and Greg A. Lomow, C++ FAQs, Addison-Wesley, 1995
[Eckel] Bruce Eckel, Thinking in C++(C++ 编程思想,刘宗田 等译),机械工业出版社,2000
[Maguire] Steve Maguire, Writing Clean Code(编程精粹,姜静波等译),电子工业出版社,1993
[Meyers] Scott Meyers, Effective C++, Addison-Wesley, 1992
[Murry] Robert B. Murry, C++ Strategies and Tactics, Addison-Wesley, 1993
[Summit] Steve Summit, C Programming FAQs, Addison-Wesley, 1996
文件结构 |
||
重要性 |
审查项 |
结论 |
|
头文件和定义文件的名称是否合理? |
|
|
头文件和定义文件的目录结构是否合理? |
|
|
版权和版本声明是否完整? |
|
重要 |
头文件是否使用了 ifndef/define/endif 预处理块? |
|
|
头文件中是否只存放“声明”而不存放“定义” |
|
|
…… |
|
程序的版式 |
||
重要性 |
审查项 |
结论 |
|
空行是否得体? |
|
|
代码行内的空格是否得体? |
|
|
长行拆分是否得体? |
|
|
“{” 和 “}” 是否各占一行而且对齐于同一列? |
|
重要 |
一行代码是否只作一件事?如只定义一个变量,只写一条语句。 |
|
重要 |
If、for、while、do等语句自占一行,不论执行语句多少都要加“{}”。 |
|
重要 |
在定义变量(或参数)时,是否将修饰符 * 和 & 紧靠变量名? |
|
|
注释是否清晰而且必要? |
|
重要 |
注释是否有错误或者可能致使误解? |
|
重要 |
类结构的public, protected, private顺序是否在全部的程序中保持一致? |
|
|
…… |
|
命名规则 |
||
重要性 |
审查项 |
结论 |
重要 |
命名规则是否与所采用的操做系统或开发工具的风格保持一致? |
|
|
标识符是否直观且能够拼读? |
|
|
标识符的长度应当符合“min-length && max-information”原则? |
|
重要 |
程序中是否出现相同的局部变量和所有变量? |
|
|
类名、函数名、变量和参数、常量的书写格式是否遵循必定的规则? |
|
|
静态变量、全局变量、类的成员变量是否加前缀? |
|
|
…… |
|
表达式与基本语句 |
||
重要性 |
审查项 |
结论 |
重要 |
若是代码行中的运算符比较多,是否已经用括号清楚地肯定表达式的操做顺序? |
|
|
是否编写太复杂或者多用途的复合表达式? |
|
重要 |
是否将复合表达式与“真正的数学表达式”混淆? |
|
重要 |
是否用隐含错误的方式写if语句? 例如 (1)将布尔变量直接与TRUE、FALSE或者一、0进行比较。 (2)将浮点变量用“==”或“!=”与任何数字比较。 (3)将指针变量用“==”或“!=”与NULL比较。 |
|
|
若是循环体内存在逻辑判断,而且循环次数很大,是否已经将逻辑判断移到循环体的外面? |
|
重要 |
Case语句的结尾是否忘了加break? |
|
重要 |
是否忘记写switch的default分支? |
|
重要 |
使用goto 语句时是否留下隐患? 例如跳过了某些对象的构造、变量的初始化、重要的计算等。 |
|
|
…… |
|
常量 |
||
重要性 |
审查项 |
结论 |
|
是否使用含义直观的常量来表示那些将在程序中屡次出现的数字或字符串? |
|
|
在C++ 程序中,是否用const常量取代宏常量? |
|
重要 |
若是某一常量与其它常量密切相关,是否在定义中包含了这种关系? |
|
|
是否误解了类中的const数据成员?由于const数据成员只在某个对象生存期内是常量,而对于整个类而言倒是可变的。 |
|
|
…… |
|
函数设计 |
||
重要性 |
审查项 |
结论 |
|
参数的书写是否完整?不要贪图省事只写参数的类型而省略参数名字。 |
|
|
参数命名、顺序是否合理? |
|
|
参数的个数是否太多? |
|
|
是否使用类型和数目不肯定的参数? |
|
|
是否省略了函数返回值的类型? |
|
|
函数名字与返回值类型在语义上是否冲突? |
|
重要 |
是否将正常值和错误标志混在一块儿返回?正常值应当用输出参数得到,而错误标志用return语句返回。 |
|
重要 |
在函数体的“入口处”,是否用assert对参数的有效性进行检查? |
|
重要 |
使用滥用了assert? 例如混淆非法状况与错误状况,后者是必然存在的而且是必定要做出处理的。 |
|
重要 |
return语句是否返回指向“栈内存”的“指针”或者“引用”? |
|
|
是否使用const提升函数的健壮性?const能够强制保护函数的参数、返回值,甚至函数的定义体。“Use const whenever you need” |
|
|
…… |
|
内存管理 |
||
重要性 |
审查项 |
结论 |
重要 |
用malloc或new申请内存以后,是否当即检查指针值是否为NULL?(防止使用指针值为NULL的内存) |
|
重要 |
是否忘记为数组和动态内存赋初值?(防止将未被初始化的内存做为右值使用) |
|
重要 |
数组或指针的下标是否越界? |
|
重要 |
动态内存的申请与释放是否配对?(防止内存泄漏) |
|
重要 |
是否有效地处理了“内存耗尽”问题? |
|
重要 |
是否修改“指向常量的指针”的内容? |
|
重要 |
是否出现野指针?例如 (1)指针变量没有被初始化。 (2)用free或delete释放了内存以后,忘记将指针设置为NULL。 |
|
重要 |
是否将malloc/free 和 new/delete 混淆使用? |
|
重要 |
malloc语句是否正确无误?例如字节数是否正确?类型转换是否正确? |
|
重要 |
在建立与释放动态对象数组时,new/delete的语句是否正确无误? |
|
|
…… |
|
C++ 函数的高级特性 |
||
重要性 |
审查项 |
结论 |
|
重载函数是否有二义性? |
|
重要 |
是否混淆了成员函数的重载、覆盖与隐藏? |
|
|
运算符的重载是否符合制定的编程规范? |
|
|
是否滥用内联函数?例如函数体内的代码比较长,函数体内出现循环。 |
|
重要 |
是否用内联函数取代了宏代码? |
|
|
…… |
|
类的构造函数、析构函数和赋值函数 |
||
重要性 |
审查项 |
结论 |
重要 |
是否违背编程规范而让C++ 编译器自动为类产生四个缺省的函数:(1)缺省的无参数构造函数;(2)缺省的拷贝构造函数;(3)缺省的析构函数;(4)缺省的赋值函数。 |
|
重要 |
构造函数中是否遗漏了某些初始化工做? |
|
重要 |
是否正确地使用构造函数的初始化表? |
|
重要 |
析构函数中是否遗漏了某些清除工做? |
|
|
是否错写、错用了拷贝构造函数和赋值函数? |
|
重要 |
赋值函数通常分四个步骤:(1)检查自赋值;(2)释放原有内存资源;(3)分配新的内存资源,并复制内容;(4)返回 *this。是否遗漏了重要步骤? |
|
重要 |
是否正确地编写了派生类的构造函数、析构函数、赋值函数?注意事项: (1)派生类不可能继承基类的构造函数、析构函数、赋值函数。 (2)派生类的构造函数应在其初始化表里调用基类的构造函数。 (3)基类与派生类的析构函数应该为虚(即加virtual关键字)。 (4)在编写派生类的赋值函数时,注意不要忘记对基类的数据成员从新赋值。 |
|
|
…… |
|
类的高级特性 |
||
重要性 |
审查项 |
结论 |
重要 |
是否违背了继承和组合的规则? (1)若在逻辑上B是A的“一种”,而且A的全部功能和属性对B而言都有意义,则容许B继承A的功能和属性。 (2)若在逻辑上A是B的“一部分”(a part of),则不容许B从A派生,而是要用A和其它东西组合出B。 |
|
|
…… |
|
其它常见问题 |
||
重要性 |
审查项 |
结论 |
重要 |
数据类型问题: (1)变量的数据类型有错误吗? (2)存在不一样数据类型的赋值吗? (3)存在不一样数据类型的比较吗? |
|
重要 |
变量值问题: (1)变量的初始化或缺省值有错误吗? (2)变量发生上溢或下溢吗? (3)变量的精度够吗? |
|
重要 |
逻辑判断问题: (1)因为精度缘由致使比较无效吗? (2)表达式中的优先级有误吗? (3)逻辑判断结果颠倒吗? |
|
重要 |
循环问题: (1)循环终止条件不正确吗? (2)没法正常终止(死循环)吗? (3)错误地修改循环变量吗? (4)存在偏差累积吗? |
|
重要 |
错误处理问题: (1)忘记进行错误处理吗? (2)错误处理程序块一直没有机会被运行? (3)错误处理程序块自己就有毛病吗?如报告的错误与实际错误不一致,处理方式不正确等等。 (4)错误处理程序块是“马后炮”吗?如在被它被调用以前软件已经出错。 |
|
重要 |
文件I/O问题: (1)对不存在的或者错误的文件进行操做吗? (2)文件以不正确的方式打开吗? (3)文件结束判断不正确吗? (4)没有正确地关闭文件吗? |
|
本试题仅用于考查C++/C程序员的基本编程技能。内容限于C++/C经常使用语法,不涉及数据结构、算法以及深奥的语法。考试成绩能反映出考生的编程质量以及对C++/C的理解程度,但不能反映考生的智力和软件开发能力。
笔试时间90分钟。请考生认真答题,切勿轻视。
1、请填写BOOL ,float, 指针变量 与“零值”比较的 if 语句。(10分)
提示:这里“零值”能够是0,0.0 , FALSE或者“空指针”。例如 int变量 n 与“零值”比较的 if 语句为:
if ( n == 0 )
if ( n != 0 )
以此类推。
请写出 BOOL flag 与“零值”比较的 if 语句:
|
请写出 float x 与“零值”比较的 if 语句:
|
请写出 char *p 与“零值”比较的 if 语句:
|
2、如下为Windows NT下的32位C++程序,请计算sizeof的值(10分)
char str[] = “Hello” ; char *p = str ; int n = 10; 请计算 sizeof (str ) =
sizeof ( p ) =
sizeof ( n ) = |
void Func ( char str[100]) { 请计算 sizeof( str ) = }
|
void *p = malloc( 100 ); 请计算 sizeof ( p ) =
|
3、简答题(25分)
一、头文件中的ifndef/define/endif 干什么用?
二、#include <filename.h> 和 #include “filename.h” 有什么区别?
三、const 有什么用途?(请至少说明两种)
四、在C++ 程序中调用被 C编译器编译后的函数,为何要加 extern “C”声明?
五、请简述如下两个for循环的优缺点
// 第一个 for (i=0; i<N; i++) { if (condition) DoSomething(); else DoOtherthing(); } |
// 第二个 if (condition) { for (i=0; i<N; i++) DoSomething(); } else { for (i=0; i<N; i++) DoOtherthing(); } |
优势:
缺点:
|
优势:
缺点:
|
4、有关内存的思考题(20分)
void GetMemory(char *p) { p = (char *)malloc(100); } void Test(void) { char *str = NULL; GetMemory(str); strcpy(str, "hello world"); printf(str); }
请问运行Test函数会有什么样的结果? 答:
|
char *GetMemory(void) { char p[] = "hello world"; return p; } void Test(void) { char *str = NULL; str = GetMemory(); printf(str); }
请问运行Test函数会有什么样的结果? 答: |
Void GetMemory2(char **p, int num) { *p = (char *)malloc(num); } void Test(void) { char *str = NULL; GetMemory(&str, 100); strcpy(str, "hello"); printf(str); } 请问运行Test函数会有什么样的结果? 答:
|
void Test(void) { char *str = (char *) malloc(100); strcpy(str, “hello”); free(str); if(str != NULL) { strcpy(str, “world”); printf(str); } } 请问运行Test函数会有什么样的结果? 答:
|
5、编写strcpy函数(10分)
已知strcpy函数的原型是
char*strcpy(char *strDest, const char *strSrc);
其中strDest是目的字符串,strSrc是源字符串。
(1)不调用C++/C的字符串库函数,请编写函数 strcpy
(2)strcpy能把strSrc的内容复制到strDest,为何还要char * 类型的返回值?
6、编写类String的构造函数、析构函数和赋值函数(25分)
已知类String的原型为:
class String
{
public:
String(const char *str = NULL); // 普通构造函数
String(const String &other); // 拷贝构造函数
~ String(void); // 析构函数
String & operate =(const String&other); // 赋值函数
private:
char *m_data; // 用于保存字符串
};
请编写String的上述4个函数。
1、请填写BOOL ,float, 指针变量 与“零值”比较的 if 语句。(10分)
请写出 BOOL flag 与“零值”比较的 if 语句。(3分) |
|
标准答案: if ( flag ) if ( !flag ) |
以下写法均属不良风格,不得分。 if (flag == TRUE) if (flag == 1 ) if (flag == FALSE) if (flag == 0) |
请写出 float x 与“零值”比较的 if 语句。(4分) |
|
标准答案示例: const float EPSINON = 0.00001; if ((x >= - EPSINON) && (x <= EPSINON) 不可将浮点变量用“==”或“!=”与数字比较,应该设法转化成“>=”或“<=”此类形式。
|
以下是错误的写法,不得分。 if (x == 0.0) if (x != 0.0)
|
请写出 char *p 与“零值”比较的 if 语句。(3分) |
|
标准答案: if (p == NULL) if (p != NULL) |
以下写法均属不良风格,不得分。 if (p == 0) if (p != 0) if (p) if (!) |
2、如下为Windows NT下的32位C++程序,请计算sizeof的值(10分)
char str[] = “Hello” ; char *p = str ; int n = 10; 请计算 sizeof (str ) = 6 (2分)
sizeof ( p ) = 4 (2分)
sizeof ( n ) = 4 (2分) |
void Func ( char str[100]) { 请计算 sizeof( str ) = 4 (2分) }
|
void *p = malloc( 100 ); 请计算 sizeof ( p ) = 4 (2分)
|
3、简答题(25分)
一、头文件中的ifndef/define/endif 干什么用?(5分)
答:防止该头文件被重复引用。
二、#include <filename.h> 和 #include “filename.h” 有什么区别?(5分)
答:对于#include <filename.h> ,编译器从标准库路径开始搜索 filename.h
对于#include “filename.h” ,编译器从用户的工做路径开始搜索 filename.h
三、const 有什么用途?(请至少说明两种)(5分)
答:(1)能够定义 const 常量
(2)const能够修饰函数的参数、返回值,甚至函数的定义体。被const修饰的东西都受到强制保护,能够预防意外的变更,能提升程序的健壮性。
四、在C++ 程序中调用被 C编译器编译后的函数,为何要加 extern “C”? (5分)
答:C++语言支持函数重载,C语言不支持函数重载。函数被C++编译后在库中的名字与C语言的不一样。假设某个函数的原型为: void foo(int x, int y);
该函数被C编译器编译后在库中的名字为_foo,而C++编译器则会产生像_foo_int_int之类的名字。
C++提供了C链接交换指定符号extern“C”来解决名字匹配问题。
五、请简述如下两个for循环的优缺点(5分)
for (i=0; i<N; i++) { if (condition) DoSomething(); else DoOtherthing(); } |
if (condition) { for (i=0; i<N; i++) DoSomething(); } else { for (i=0; i<N; i++) DoOtherthing(); } |
优势:程序简洁
缺点:多执行了N-1次逻辑判断,而且打断了循环“流水线”做业,使得编译器不能对循环进行优化处理,下降了效率。 |
优势:循环的效率高
缺点:程序不简洁
|
4、有关内存的思考题(每小题5分,共20分)
void GetMemory(char *p) { p = (char *)malloc(100); } void Test(void) { char *str = NULL; GetMemory(str); strcpy(str, "hello world"); printf(str); }
请问运行Test函数会有什么样的结果? 答:程序崩溃。 由于GetMemory并不能传递动态内存, Test函数中的 str一直都是 NULL。 strcpy(str, "hello world");将使程序崩溃。
|
char *GetMemory(void) { char p[] = "hello world"; return p; } void Test(void) { char *str = NULL; str = GetMemory(); printf(str); }
请问运行Test函数会有什么样的结果? 答:多是乱码。 由于GetMemory返回的是指向“栈内存”的指针,该指针的地址不是 NULL,但其原现的内容已经被清除,新内容不可知。 |
void GetMemory2(char **p, int num) { *p = (char *)malloc(num); } void Test(void) { char *str = NULL; GetMemory(&str, 100); strcpy(str, "hello"); printf(str); } 请问运行Test函数会有什么样的结果? 答: (1)可以输出hello (2)内存泄漏
|
void Test(void) { char *str = (char *) malloc(100); strcpy(str, “hello”); free(str); if(str != NULL) { strcpy(str, “world”); printf(str); } } 请问运行Test函数会有什么样的结果? 答:篡改动态内存区的内容,后果难以预料,很是危险。 由于free(str);以后,str成为野指针, if(str != NULL)语句不起做用。
|
5、编写strcpy函数(10分)
已知strcpy函数的原型是
char*strcpy(char *strDest, const char *strSrc);
其中strDest是目的字符串,strSrc是源字符串。
(1)不调用C++/C的字符串库函数,请编写函数 strcpy
char *strcpy(char *strDest, constchar *strSrc);
{
assert((strDest!=NULL) && (strSrc !=NULL)); // 2分
char *address =strDest; // 2分
while( (*strDest++ = * strSrc++) != ‘\0’ ) // 2分
NULL ;
return address; //2分
}
(2)strcpy能把strSrc的内容复制到strDest,为何还要char * 类型的返回值?
答:为了实现链式表达式。 // 2分
例如 int length = strlen(strcpy( strDest, “hello world”) );
6、编写类String的构造函数、析构函数和赋值函数(25分)
已知类String的原型为:
class String
{
public:
String(const char *str = NULL); // 普通构造函数
String(const String &other); // 拷贝构造函数
~ String(void); // 析构函数
String & operate =(const String&other); // 赋值函数
private:
char *m_data; // 用于保存字符串
};
请编写String的上述4个函数。
标准答案:
// String的析构函数
String::~String(void) // 3分
{
delete [] m_data;
// 因为m_data是内部数据类型,也能够写成 delete m_data;
}
//String的普通构造函数
String::String(constchar *str) // 6分
{
if(str==NULL)
{
m_data= new char[1]; // 若能加 NULL 判断则更好
*m_data= ‘\0’;
}
else
{
intlength = strlen(str);
m_data= new char[length+1]; // 若能加 NULL 判断则更好
strcpy(m_data,str);
}
}
// 拷贝构造函数
String::String(constString &other) // 3分
{
int length = strlen(other.m_data);
m_data = new char[length+1]; // 若能加 NULL 判断则更好
strcpy(m_data, other.m_data);
}
// 赋值函数
String &String::operate =(const String &other) // 13分
{
// (1) 检查自赋值 // 4分
if(this == &other)
return*this;
// (2)释放原有的内存资源 // 3分
delete [] m_data;
// (3)分配新的内存资源,并复制内容// 3分
int length = strlen(other.m_data);
m_data = new char[length+1]; // 若能加 NULL 判断则更好
strcpy(m_data, other.m_data);
// (4)返回本对象的引用 // 3分
return *this;
}