在 Linux 平台中调试 C/C++ 内存泄漏方法

时间 2019-11-09

标签 linux 平台调试 c++ 内存泄漏方法栏目 Linux 繁體版

原文原文链接

因为 C 和 C++ 程序中彻底由程序员自主申请和释放内存，稍不注意，就会在系统中导入内存错误。同时，内存错误每每很是严重，通常会带来诸如系统崩溃，内存耗尽这样严重的后果。从历史上看，来自计算机应急响应小组和供应商的许多最严重的安全公告都是由简单的内存错误形成的。自从 70 年代末期以来，C/C++ 程序员就一直讨论此类错误，但其影响在 2007 年仍然很大。与许多其余类型的常见错误不一样，内存错误一般具备隐蔽性，即它们很难再现，症状一般不能在相应的源代码中找到。例如，不管什么时候何地发生内存泄漏，均可能表现为应用程序彻底没法接受，同时内存泄漏不是显而易见[1]。存在内存错误的 C 和 C++ 程序会致使各类问题。若是它们泄漏内存，则运行速度会逐渐变慢，并最终中止运行；若是覆盖内存，则会变得很是脆弱，很容易受到恶意用户的攻击。html

所以，出于这些缘由，须要特别关注 C 和 C++ 编程的内存问题，特别是内存泄漏。本文先从如何发现内存泄漏，而后是用不一样的方法和工具定位内存泄漏，最后对这些工具进行了比较，另外还简单介绍了资源泄漏的处理(以句柄泄漏为例)。本文使用的测试平台是：Linux (Redhat AS4)。可是这些方法和工具许多都不仅是局限于 C/C++ 语言以及 linux 操做系统。linux

内存泄漏通常指的是堆内存的泄漏。堆内存是指程序从堆中分配的、大小任意的（内存块的大小能够在程序运行期决定）、使用完后必须显示的释放的内存。应用程序通常使用malloc、realloc、new 等函数从堆中分配到一块内存，使用完后，程序必须负责相应的调用 free 或 delete 释放该内存块。不然，这块内存就不能被再次使用，咱们就说这块内存泄漏了。c++

1. 如何发现内存泄漏程序员

有些简单的内存泄漏问题能够从在代码的检查阶段肯定。还有些泄漏比较严重的，即在很短的时间内致使程序或系统崩溃，或者系统报告没有足够内存，也比较容易发现。最困难的就是泄漏比较缓慢，须要观测几天、几周甚至几个月才能看到明显异常现象。那么如何在比较短的时间内检测出有没有潜在的内存泄漏问题呢？实际上不一样的系统都带有内存监视工具，咱们能够从监视工具收集一段时间内的堆栈内存信息，观测增加趋势，来肯定是否有内存泄漏。在 Linux 平台能够用 ps 命令，来监视内存的使用，好比下面的命令 (观测指定进程的VSZ值)：编程

ps -aux

回页首安全

2. 静态分析ide

包括手动检测和静态工具分析，这是代价最小的调试方法。函数

2.1 手动检测 工具

当使用 C/C++ 进行开发时，采用良好的一致的编程规范是防止内存问题第一道也是最重要的措施。检测是编码标准的补充。两者各有裨益，但结合使用效果特别好。专业的 C 或 C++ 专业人员甚至能够浏览不熟悉的源代码，并以极低的成本检测内存问题。经过少许的实践和适当的文本搜索，您可以快速验证平衡的 *alloc() 和 free() 或者 new 和 delete 的源主体。人工查看此类内容一般会出现像清单 1 中同样的问题，能够定位出在函数 LeakTest 中的堆变量 Logmsg 没有释放。性能

清单1. 简单的内存泄漏

#include <stdio.h>
#include <string.h>
#include <stdlib.h>

int LeakTest(char * Para)
{
        if(NULL==Para){
                //local_log("LeakTest Func: empty parameter\n");
                return -1;
        }
        char * Logmsg = new char[128];
        if(NULL == Logmsg){
                //local_log("memeory allocation failed\n");
                return -2;
        }
        sprintf(Logmsg,"LeakTest routine exit: '%s'.\n", Para);
        //local_log(Logmsg);
        return 0;
}
int   main(int argc,char **argv )
{
        char szInit [] = "testcase1";
        LeakTest(szInit);
        return 0;
}

2.2 静态代码分析工具

代码静态扫描和分析的工具比较多，好比 splint, PC-LINT, BEAM 等。由于 BEAM 支持的平台比较多，这以 BEAM 为例，作个简单介绍，其它有相似的处理过程。

BEAM 能够检测四类问题: 没有初始化的变量；废弃的空指针；内存泄漏；冗余计算。并且支持的平台比较多。

BEAM 支持如下平台：

Linux x86 (glibc 2.2.4)
Linux s390/s390x (glibc 2.3.3 or higher)
Linux (PowerPC, USS) (glibc 2.3.2 or higher)
AIX (4.3.2+)
Window2000 以上

清单2. 用做 Beam 分析的代码

#include <stdio.h>
#include <string.h>
#include <stdlib.h>

int *p;

void
foo(int a)
{
  int b, c;

  b = 0;
  if(!p) 
    c = 1;

  if(c > a)
    c += p[1];
}

int LeakTest(char * Para)
{
        char * Logmsg = new char[128];
        if((Para==NULL)||(Logmsg == NULL))
                return -1;        
        sprintf(Logmsg,"LeakTest routine exit: '%s'.\n", Para);        
        return 0;
}

int   main(int argc,char **argv )
{
        char szInit [] = "testcase1";
        LeakTest(szInit);
        return 0;
}

下面以 X86 Linux 为例,代码如清单 2，具体的环境以下:

OS: Red Hat Enterprise Linux AS release 4 (Nahant Update 2)

GCC: gcc version 3.4.4

BEAM: 3.4.2; https://w3.eda.ibm.com/beam/

能够把 BEAM 看做一个 C/C++ 编译器，按下面的命令进行编译 (前面两个命令是设置编译器环境变量)：

./beam-3.4.2/bin/beam_configure  --c gcc
./beam-3.4.2/bin/beam_configure  --cpp g++
./beam-3.4.2/bin/beam_compile  --beam::compiler=compiler_cpp_config.tcl  -cpp code2.cpp

从下面的编译报告中，咱们能够看到这段程序中有三个错误:”内存泄漏”；“变量未初始化”；“ 空指针操做”

"code2.cpp", line 10: warning: variable "b" was set but never used
    int b, c;
        ^

BEAM_VERSION=3.4.2
BEAM_ROOT=/home/hanzb/memdetect
BEAM_DIRECTORY_WRITE_INNOCENTS=
BEAM_DIRECTORY_WRITE_ERRORS=

-- ERROR23(heap_memory)     /*memory leak*/     >>>ERROR23_LeakTest_7b00071dc5cbb458
"code2.cpp", line 24: memory leak
ONE POSSIBLE PATH LEADING TO THE ERROR:
 "code2.cpp", line 22: allocating using `operator new[]' (this memory will not be freed)
 "code2.cpp", line 22: assigning into `Logmsg'
 "code2.cpp", line 24: deallocating `Logmsg' because exiting its scope 
                       (losing last pointer to the memory)

-- ERROR1     /*uninitialized*/     >>>ERROR1_foo_60c7889b2b608
"code2.cpp", line 16: uninitialized `c'
ONE POSSIBLE PATH LEADING TO THE ERROR:
 "code2.cpp", line 10: allocating `c'
 "code2.cpp", line 13: the if-condition is false
 "code2.cpp", line 16: getting the value of `c'

 VALUES AT THE END OF THE PATH:
  p != 0 


-- ERROR2     /*operating on NULL*/     >>>ERROR2_foo_af57809a2b615
"code2.cpp", line 17: invalid operation involving NULL pointer
ONE POSSIBLE PATH LEADING TO THE ERROR:
 "code2.cpp", line 13: the if-condition is true (used as evidence that error is possible)
 "code2.cpp", line 16: the if-condition is true
 "code2.cpp", line 17: invalid operation `[]' involving NULL pointer `p'

 VALUES AT THE END OF THE PATH:
  c = 1 
  p = 0 
  a <= 0

2.3 内嵌程序

能够重载内存分配和释放函数 new 和 delete,而后编写程序按期统计内存的分配和释放，从中找出可能的内存泄漏。或者调用系统函数按期监视程序堆的大小，关键要肯定堆的增加是泄漏而不是合理的内存使用。这类方法比较复杂，在这就不给出详细例子了。

回页首

3. 动态运行检测

实时检测工具主要有 valgrind, Rational purify 等。

3.1 Valgrind

valgrind 是帮助程序员寻找程序里的 bug 和改进程序性能的工具。程序经过 valgrind 运行时，valgrind 收集各类有用的信息，经过这些信息能够找到程序中潜在的 bug 和性能瓶颈。

Valgrind 如今提供多个工具，其中最重要的是 Memcheck，Cachegrind，Massif 和 Callgrind。Valgrind 是在 Linux 系统下开发应用程序时用于调试内存问题的工具。它尤为擅长发现内存管理的问题，它能够检查程序运行时的内存泄漏问题。其中的 memecheck 工具能够用来寻找 c、c++ 程序中内存管理的错误。能够检查出下列几种内存操做上的错误：

读写已经释放的内存
读写内存块越界（从前或者从后）
使用还未初始化的变量
将无心义的参数传递给系统调用
内存泄漏

3.2 Rational purify

Rational Purify 主要针对软件开发过程当中难于发现的内存错误、运行时错误。在软件开发过程当中自动地发现错误，准确地定位错误，提供完备的错误信息，从而减小了调试时间。同时也是市场上惟一支持多种平台的相似工具，而且能够和不少主流开发工具集成。Purify 能够检查应用的每个模块，甚至能够查出复杂的多线程或进程应用中的错误。另外不只能够检查 C/C++，还能够对 Java 或 .NET 中的内存泄漏问题给出报告。

在 Linux 系统中，使用 Purify 须要从新编译程序。一般的作法是修改 Makefile 中的编译器变量。下面是用来编译本文中程序的 Makefile：

CC=purify gcc

首先运行 Purify 安装目录下的 purifyplus_setup.sh 来设置环境变量，而后运行 make 从新编译程序。

./purifyplus_setup.sh

下面给出编译一个代码文件的示例，源代码文件命名为 test3.cpp. 用 purify 和 g++ 的编译命令以下，‘-g’是编译时加上调试信息。

purify g++ -g test3.cpp –o test

运行编译生成的可执行文件 test，就能够获得图1，能够定位出内存泄漏的具体位置。

./test

清单3. Purify 分析的代码

#include <unistd.h> 
 char * Logmsg;

int LeakTest(char * Para)
{
        if(NULL==Para){
                //local_log("LeakTest Func: empty parameter\n");
                return -1;
        }
        Logmsg = new char[128];
		for (int i = 0 ; i < 128; i++)
			Logmsg[i] = i%64;

        if(NULL == Logmsg){
                //local_log("memeory allocation failed\n");
                return -2;
        }
        sprintf(Logmsg,"LeakTest routine exit: '%s'.\n", Para);
        //local_log(Logmsg);
        return 0;
}

int   main(int argc,char **argv )
{
        char szInit [] = "testcase1";
		int i;
         LeakTest(szInit);
		for (i=0; i < 2; i++){
			if(i%200 == 0)
				LeakTest(szInit);
			sleep(1);
		}        
        return 0;
}

须要指出的是，程序必须编译成调试版本才能够定位到具体哪行代码发生了内存泄漏。即在 gcc 或者 g++ 中，必须使用 "-g" 选项。

图 1 purify 的输出结果

回页首

结论

本文介绍了多种内存泄漏，定位方法(包括静态分析，动态实时检测)。涉及到了多个工具，详细描述的它们的用法、用途以及优缺点。对处理其它产品或项目内存泄漏相关的问题有很好的借鉴意义。