GDB的深刻研究

时间 2019-12-01

标签 gdb 深刻研究繁體版

原文原文链接

GDB的深刻研究

1、GDB代码调试

（一）GDB调试实例

在终端中编译一个示例C语言小程序，保存为文件 gdblianxi.c 中，用GCC编译。

在上面的命令行中，使用-o参数指定了编译生成的可执行文件名为 gdblianxi，使用参数-g表示将源代码信息编译到可执行文件中。若是不使用参数-g，会给后面的GDB调试形成不便。
下面输入“gdb”命令启动GDB，将首先显示GDB说明：

下面使用“file”命令载入被调试程序 gdblianxi（这里的 gdblianxi 即前面 GCC 编译输出的可执行文件）

上图中最后一行“(gdb) ”为GDB内部命令引导符，等待用户输入GDB命令。
上图倒数第二行提示已经加载成功。
下面使用“r”命令执行（Run）被调试文件，由于还没有设置任何断点，将直接执行到程序结束
使用“b”命令在 main 函数开头设置一个断点（Breakpoint）
以后一行提示已经成功设置断点，并给出了该断点信息：在源文件 gdblianxi.c 第14行处设置断点；这是本程序的第一个断点（序号为1）；断点处的代码地址为 0x40055d。向上看源代码，第14行中的代码为“n = 1”，刚好是 main 函数中的第一个可执行语句（由于前面的“int n;”为变量定义语句，并不是可执行语句）。
再次使用“r”命令执行（Run）被调试程序：

程序中断在gdblianxi.c第14行处，即main函数是第一个可执行语句处。上面最后一行信息为：下一条将要执行的源代码为“n = 1;”，它是源代码文件gdblianxi.c中的第14行。
下面使用“s”命令（Step）执行下一行代码（即第14行“n = 1;”）：

上面的信息表示已经执行完“n = 1;”，并显示下一条要执行的代码为第15行的“n++;”。前端
下面咱们分别在第21行打印处、tempFunction 函数开头各设置一个断点（分别使用命令“b 21”“b tempFunction”）：linux

使用“c”命令继续（Continue）执行被调试程序，程序将中断在第二个断点（21行），此时全局变量 nGlobalVar 的值应该是 88；再一次执行“c”命令，程序将中断于第三个断点（7行，tempFunction 函数开头处），此时tempFunction 函数的两个参数 a、b 的值应分别是 1 和 2：

再一次执行“c”命令（Continue），由于后面再也没有其它断点，程序将一直执行到结束：

（二）GDB经常使用命令

命令	解释	示例
file <文件名>	加载被调试的可执行程序文件。由于通常都在被调试程序所在目录下执行GDB，于是文本名不须要带路径	(gdb) file gdblianxi
r	Run的简写，运行被调试的程序。若是此前没有下过断点，则执行完整个程序；若是有断点，则程序暂停在第一个可用断点处。	(gdb) r
c	Continue的简写，继续执行被调试程序，直至下一个断点或程序结束。	(gdb) c
b <行号> b <函数名称> b * <函数名称> b * <代码地址> d [编号]	b: Breakpoint的简写，设置断点。两可使用“行号”“函数名称”“执行地址”等方式指定断点位置。其中在函数名称前面加“*”符号表示将断点设置在“由编译器生成的prolog代码处”。若是不了解汇编，能够不予理会此用法。 d: Delete breakpoint的简写，删除指定编号的某个断点，或删除全部断点。断点编号从1开始递增。	(gdb) b 8 (gdb) b main (gdb) b * main (gdb) b * 0x804835c (gdb) d
s, n	s: 执行一行源程序代码，若是此行代码中有函数调用，则进入该函数； n: 执行一行源程序代码，此行代码中的函数调用也一并执行。 s 至关于其它调试器中的“Step Into (单步跟踪进入)” n 至关于其它调试器中的“Step Over (单步跟踪)” 这两个命令必须在有源代码调试信息的状况下才可使用（GCC编译时使用“-g”参数）。	(gdb) s (gdb) n
si, ni	si命令相似于s命令，ni命令相似于n命令。所不一样的是，这两个命令（si/ni）所针对的是汇编指令，而s/n针对的是源代码。	(gdb) si (gdb) ni
p <变量名称>	Print的简写，显示指定变量（临时变量或全局变量）的值。	(gdb) p i (gdb) p nGlobalVar
display ... undisplay <编号>	display，设置程序中断后欲显示的数据及其格式。例如，若是但愿每次程序中断后能够看到即将被执行的下一条汇编指令，可使用命令“display /i $pc” 其中 $pc 表明当前汇编指令，/i 表示以十六进行显示。当须要关心汇编代码时，此命令至关有用。 undispaly，取消先前的display设置，编号从1开始递增。	(gdb) display /i $pc (gdb) undisplay 1
i	Info的简写，用于显示各种信息，详情请查阅“help i”。	(gdb) i r
q	Quit的简写，退出GDB调试环境。	(gdb) q
help [命令名称]	GDB帮助命令，提供对GDB名种命令的解释说明。若是指定了“命令名称”参数，则显示该命令的详细说明；若是没有指定参数，则分类显示全部GDB命令，供用户进一步浏览和查询。	(gdb) help display

2、CGDB代码调试

cgdb能够看做gdb的界面加强版，cgdb主要功能是在调试时进行代码的同步显示，这增长了调试的方便性，提升了调试效率。其余功能则与gdb同样，可以使用其经常使用命令。因此这里只作简单介绍，经常使用命令等参见gdb。

主要功能介绍：

（1）相比GDB，增长了语法加亮的代码窗口，显示在GDB窗口的上部，随GDB的调试位置代码同步显示。程序员

（2）断点设置可视化。正则表达式

（3）在代码窗口中可以使用GDB经常使用命令。编程

（4）在代码窗口可进行代码查找，支持正则表达式。小程序

界面及使用说明

（1）代码窗口windows

调试时同步显示被调试程序源代码，自动标记出程序运行到的位置。当焦点在代码窗口时，能够浏览代码、查找代码以及执行命令，操做方式同vi 。经常使用命令以下：数组

i ： 焦点切换到GDB窗口 。
 o ：打开文件选择框，可选择要显示的代码文件 。
 空格 ：设置/取消断点 。
 k：向上移动
 j：向下移动
 /：查找

（2）状态条窗口数据结构

同vi的状态条，通常显示当前打开的源文件名，当代码窗口进入命令状态时，显示输入的命令等信息

（3）GDB窗口多线程

CGDB的操做界面，同GDB ,按ESC键则焦点切换到代码窗口。
启动&退出——启动：cgdb；退出：在代码窗口或GDB窗口，执行quit命令。

代码实现：

“(gdb)”表示GDB已经启动，等待咱们输入命令。此时程序并未开始运行，输入“run”开始运行程序。这种方式在GDB内部运行程序：

List n,m表示显示n到m行的代码

设置断点，break n,用step单步执行(这里break 21)：

3、汇编代码调试

汇编级的调试或跟踪，须要用到display命令“display /i $pc”，如上表所示，

“display /i $pc”
其中 $pc 表明当前汇编指令，/i 表示以十六进行显示。当须要关心汇编代码时，此命令至关有用。
undispaly，取消先前的display设置，编号从1开始递增。

而且之后程序每次中断都将显示下一条汇编指定（“si”命令用于执行一条汇编代码——区别于“s”执行一行C代码）

接下来咱们试一下命令“b * <函数名称> ”。为了更简明，有必要先删除目前全部断点（使用“d”命令——Delete breakpoint）

当被询问是否删除全部断点时，输入“y”并按回车键便可。
下面使用命令“b *main”在 main 函数的 prolog 代码处设置断点（prolog、epilog，分别表示编译器在每一个函数的开头和结尾自行插入的代码）：

此时可使用“i r”命令显示寄存器中的当前值———“i r”即“Infomation Register”，
也能够输入“i r 寄存器名”显示任意一个指定的寄存器值：

最后输入命令“q”，退出（Quit）GDB调试环境

4、DDD代码调试

（一）DDD简介

DDD，全称是Data Display Debugger，对于Linux系统中的编程人员来讲，它就是windows系统下面的visual studio ，功能强大，是Linux世界中少数有图形界面的程序调试工具。DDD是命令行调试器的图形前端，除了通常的程序调试功能之外，还具备交互式图形数据显示的功能。它在嵌入式应用开发中也十分出色。DDD最初源于1990年Andreas Zeller编写的VSL结构化语言，后来通过一些程序员的努力，演化成今天的模样。DDD的功能很是强大，能够调试用C\C++、Ada、 Fortran、Pascal、Modula-2和Modula-3编写的程序；能够超文本方式浏览源代码；可以进行断点设置、回溯调试和历史纪录编辑；具备程序在终端运行的仿真窗口，并在远程主机上进行调试的能力；图形数据显示功能（Graphical Data Display）是建立该调试器的初衷之一，可以显示各类数据结构之间的关系，并将数据结构以图形化形式显示；具备GDB/DBX/XDB的命令行界面，包括彻底的文本编辑、历史纪录、搜寻引擎。

（二）DDD调试过程

打开终端命令行窗口，输入命令vi testddd.c，创建testddd.c文件做为以后调试的文件：

在testddd.c文件中输入一些C语言的程序数据，DDD工具能够调试不少种程序设置基于的代码，本次调试以C语言做为说明对象。

把testddd.c文件编译成能够执行的文件testddd，命令：gcc -g -o testddd testddd.c，注意必定要带-g参数，不然生成的可执行文件中没有必要的调试信息，最终使用DDD工具不能调试。

运行DDD调试工具，直接输入命令ddd就能够打开DDD工具。

DDD工具打开后以下图所示，上面较大空白部分为代码区，和工具区，分割线下面是调试生成信息区。

点击菜单栏上的“文件”----->“打开程序”，准备打开咱们上面准备的testddd.c文件

在打开程序框中，定位到咱们要调试的程序的目录下，在Files列表下选择咱们要调试信息，以后点击左下方的打开按钮。

调试程序打开后，在代码区能够看到咱们的代码，右边的一些按钮是咱们调试要用的工具。

在代码区点鼠标右键，会弹出如图所示的菜单：

咱们能够给程序设置断点等，点击工具区里面的Run按钮，能够执行程序，在下面的调试信息区能够看到程序的执行结果。

如上图所示：在鼠标右键点击的地方设置了断点，在下方调试信息生成区显示了程序运行的输入信息。

PS：也能够在Terminal中输入ddd 文件名来直接打开ddd调试该文件的界面：

在怀疑程序哪一个变量为可疑变量时，能够在控制台输入以下命令

或者在主窗口原程序中点击某个变量如sum选中该变量，右击后选择display sum 选项就会看到该变量的值在主窗口的上方。接着往下单步运行，屡次点击工具栏中的“Step”按钮，观察变量sum的结果。

若是问题出在count上。这时点击命令工具栏上的“Kill”按钮将程序断掉，把初始化sum的那一句改正确。从新运行以后，发现结果正确，调试过程完毕。

（三）经常使用命令简介

run       执行程序
step      单步调试
kill      杀死正在运行的程序
interrupt 退出这次调试回到原始状态

DDD的数据显示功能很是强大。
对于固定大小的数组，用鼠标选中数组名，点击plot按钮便可画出图形。
对于变长数组，可使用graph plot数组名[起始索引] @ 数组大小的命令来显示。
对于复杂的数据结构，DDD也能够用图形方式解析： DDD有一个detect aliases的选项，能够智能的判别数据是否会被重复显示。这种方式经过内存地址的检测来实现的。

5、段错误

定义：段错误是指访问的内存超出了系统给这个程序所设定的内存空间，例如访问了不存在的内存地址、访问了系统保护的内存地址、访问了只读的内存地址等等状况。

段错误产生的缘由:
（1）访问不存在的内存地址
（2）访问系统保护的内存地址
（3）访问只读的内存地址
（4）栈溢出

下面以缘由一访问不存在的内存地址为例，进行实践。

（一）使用gcc和gdb（对于简单代码）

首先，编写一段代码，访问不存在内存地址。编译后进入CGDB，运行程序：

从输出中能够看出，程序收到SIGSEGV信号，触发段错误，并提示0x00000000004004e六、调用main报的错，在Derro.c中23行。而且在代码窗口第23行被标记出来。
适用场景

仅当能肯定程序必定会发生段错误的状况下使用。
当程序的源码能够得到的状况下，使用-g参数编译程序。
通常用于测试阶段，生产环境下gdb会有反作用：使程序运行减慢，运行不够稳定，等等。
即便在测试阶段，若是程序过于复杂，gdb也不能处理。

（二）使用core文件和gdb

提到段错误会触发SIGSEGV信号，经过man 7 signal，能够看到SIGSEGV默认的handler会打印段错误出错信息，并产生core文件，由此咱们能够借助于程序异常退出时生成的core文件中的调试信息，使用gdb工具来调试程序中的段错误。
查看core文件发现不存在：

查看系统core文件的大小限制，发现为0，这样不会自动生成core文件。把大小设置为1000。运行程序后再次查看可看到存在core文件：

加载core文件，使用gdb工具进行调试。从输出中能够看出一样的段错误信息：

6、多进程与多线程

（一）多进程

一、进程的基本概念

进程定义了一个计算的基本单元，能够认为是一个程序的一次运行。它是一个动态实体，是独立的任务。它拥有独立的地址空间、执行堆栈、文件描述符等。每一个进程拥有独立的地址空间，进程间正常状况下，互不影响，一个进程的崩溃不会形成其余进程的崩溃。当进程间共享某一资源时，需注意两个问题：同步问题和通讯问题。

二、建立进程

父进程经过调用fork函数来建立一个新的运行子进程。fork函数定义以下：

#include <sys/types.h>
#include <unistd.h>

pid_t fork(void);

fork函数只被调用一次，可是会返回两次：父进程返回子进程的PID，子进程返回0.若是失败返回-1。
fork后，子进程和父进程继续执行fork（）函数后的指令。子进程是父进程的副本。子进程拥有父进程的数据空间、堆栈的副本。但父、子进程并不共享这些存储空间部分。若是代码段是只读的，则父子进程共享代码段。若是父子进程同时对同一文件描述字操做，而又没有任何形式的同步，则会出现混乱的情况；父进程中调用fork以前打开的全部描述字在函数fork返回以后子进程会获得一个副本。fork后，父子进程均须要将本身不使用的描述字关闭，有两方面的缘由：（1）以避免出现不一样步的状况；（2）最后能正常关闭描述字

在BSD3.0中开始出现，主要为了解决fork昂贵的开销。它是彻底共享的建立，新老进程共享一样的资源，彻底没有拷贝。二者的基本区别在于当使用vfork()建立新进程时，父进程将被暂时阻塞，而子进程则能够借用父进程的地址空间。这个奇特状态将持续直到子进程退出或调用execve()函数，至此父进程才继续执行。

三、终止进程

进程的终止存在两个可能：（1）父进程先于子进程终止（init进程领养）（2）子进程先于主进程终止。对于后者，系统内核为子进程保留必定的状态信息：进程ID、终止状态、CPU时间等；当父进程调用wait或waitpid函数时，获取这些信息；当子进程正常或异常终止时，系统内核向其父进程发送SIGCHLD信号；缺省状况下，父进程忽略该信号，或者提供一个该信号发生时即被调用的函数。

#include <stdlib.h>
void exit(int status);

本函数终止调用进程。关闭全部子进程打开的描述符，向父进程发送SIGCHLD信号，并返回状态。

#include <sys/types.h>
#include <sys/wait.h>
pid_t wait(int *stat_loc);

返回：终止子进程的ID－成功；-1－出错；statloc存储子进程的终止状态（一个整数）；
若是没有终止的子进程，可是有一个或多个正在执行的子进程，则该函数将堵塞，直到有一个子进程终止或者wait被信号中断时，wait返回。当调用该系统调用时，若是有一个子进程已经终止，则该系统调用当即返回，并释放子进程全部资源。

pidt waitpid(pidt pid, int *statloc, int options);

返回：终止子进程的ID－成功；-1－出错；statloc存储子进程的终止状态；
当pid=-1,option=0时，该函数等同于wait，不然由参数pid和option共同决定函数行为，其中pid参数意义以下：

-1：要求知道任何一个子进程的返回状态（等待第一个终止的子进程）；
>0：要求知道进程号为pid的子进程的状态；
<-1:　wait  for  any  child process whose process group ID is equal to the absolute value of pid.

Options最经常使用的选项是WNOHANG,它通知内核在没有已终止进程时不要堵塞。
调用wait或waitpid函数时，正常状况下，可能会有如下几种状况：

阻塞（若是其全部子进程都还在运行）；
得到子进程的终止状态并当即返回（若是一个子进程已终止，正等待父进程存取其终止状态）； 
出错当即返回（若是它没有任何子进程）

四、调试进程

通常状况下，父进程fork一个子进程，gdb只会继续调试父进程而不会管子进程的运行。若是想跟踪子进程进行调试，可使用set follow-fork-mode mode来设置fork跟随模式。
set follow-fork-mode 所带的mode参数能够是如下的一种：

parent        gdb只跟踪父进程，不跟踪子进程，这是默认的模式。
    child         gdb在子进程产生之后只跟踪子进程，放弃对父进程的跟踪。

进入gdb之后，咱们可使用show follow-fork-mode来查看目前的跟踪模式。

能够看到目前使用的模式是parent。
有时，咱们想同时调试父进程和子进程，以上的方法就不能知足了。Linux提供了set detach-on-fork mode命令来供咱们使用。其使用的mode能够是如下的一种：

on        只调试父进程或子进程的其中一个(根据follow-fork-mode来决定)，这是默认的模式。
    off       父子进程都在gdb的控制之下，其中一个进程正常调试(根据follow-fork-mode来决定)

另外一个进程会被设置为暂停状态。
一样，show detach-on-fork显示了目前是的detach-on-fork模式，如图所示。

以上是调试fork产生子进程的状况，可是若是子进程使用exec系统函数而装载了新程序执行，咱们就使用set follow-exec-mode mode提供的模式来跟踪这个exec装载的程序。mode能够是如下的一种：

new 当发生exec的时候，若是这个选项是new，则新建一个inferior给执行起来的子进程，而父进程的inferior仍然保留，当前保留的inferior的程序状态是没有执行。
 same 当发生exec的时候，若是这个选项是same(默认值)，由于父进程已经退出，因此自动在执行exec的inferior上控制子进程。

（二）多线程

线程：运行在单一进程上下文中的逻辑流，由内核进行调度，共享同一进程的虚拟地址空间。

基于线程的并发编程
线程由内核自动调度，每一个线程都有它本身的线程上下文（thread context），包括一个唯一的整数线程ID（Thread ID,TID），栈，栈指针，程序计数器，通用目的寄存器和条件码。每一个线程和其余线程一块儿共享进程上下文的剩余部分，包括整个用户的虚拟地址空间，它是由只读文本（代码），读/写数据，堆以及全部的共享库代码和数据区域组成的，还有，线程也共享一样的打开文件的集合。
线程不像进程那样，不是按照严格的父子层次来组织的。和一个进程相关的线程组成一个对等线程池，独立于其余线程建立的线程。进程中第一个运行的线程称为主线程。对等（线程）池概念的主要影响是，一个线程能够杀死它的任何对等线程，或者等待它的任意对等线程终止；进一步来讲，每一个对等线程都能读写相同的共享数据。
线程是可执行代码的可分派单元。这个名称来源于“执行的线索”的概念。在基于线程的多任务的环境中，全部进程有至少一个线程，可是它们能够具备多个任务。这意味着单个程序能够并发执行两个或者多个任务。
简而言之，线程就是把一个进程分为不少片，每一片均可以是一个独立的流程。这已经明显不一样于多进程了，进程是一个拷贝的流程，而线程只是把一条河流截成不少条小溪。它没有拷贝这些额外的开销，可是仅仅是现存的一条河流，就被多线程技术几乎无开销地转成不少条小流程，它的伟大就在于它少之又少的系统开销。

linux提供的多线程的系统调用：

（1）函数pthread_create用来建立一个线程，它的原型为：

extern int pthread_create __P ((pthread_t *__thread, __const pthread_attr_t *__attr,void *(*__start_routine) (void *), void *__arg));

第一个参数为指向线程标识符的指针，第二个参数用来设置线程属性，第三个参数是线程运行函数的起始地址，最后一个参数是运行函数的参数。

（2）函数pthread_join用来等待一个线程的结束。函数原型为：

2extern int pthread_join __P ((pthread_t __th, void **__thread_return));

第一个参数为被等待的线程标识符，第二个参数为一个用户定义的指针，它能够用来存储被等待线程的返回值。这个函数是一个线程阻塞的函数，调用它的函数将一直等待到被等待的线程结束为止，当函数返回时，被等待线程的资源被收回。

（3）一个线程的结束有两种途径，一种是象咱们上面的例子同样，函数结束了，调用它的线程也就结束了；另外一种方式是经过函数pthread_exit来实现。它的函数原型为：

extern void pthread_exit __P ((void *__retval)) __attribute__ ((__noreturn__));

惟一的参数是函数的返回代码，只要pthread_ join中的第二个参数thread_ return不是NULL，这个值将被传递给 thread_return。

最后要说明的是，一个线程不能被多个线程等待，不然第一个接收到信号的线程成功返回，其他调用pthread_join的线程则返回错误代码ESRCH。

Linux系统下的多线程遵循POSIX线程接口，称为pthread。编写Linux下的多线程程序，须要使用头文件pthread.h，链接时须要使用库libpthread.a。Linux下pthread的实现是经过系统调用clone（）来实现的。clone（）是Linux所特有的系统调用，它的使用方式相似fork。
下面代码示例：

代码分析：主线程作本身的事情，生成2个子线程，task1为分离，任其自生自灭，而task2仍是继续送外卖，须要等待返回。
编译运行：

屡次运行发现结果并不彻底相同，这是不一样的线程抢占CPU的结果。

7、心得体会

这篇GDB的深刻研究是我作的第一个加分项目，到此算是告一段落了。在作以前，一直感受GDB调试是很困难的一件事，可是本身真正去实践才发现它并无我想象中的那么难。此次我完成了GDB代码调试、CGDB代码调试、汇编代码调试、DDD代码调试以及多进程与多线程的学习，中途也遇到过不少问题，可是经过查阅资料，参考以前的学长学姐的经验最终都解决了。不知不觉，写博客已经有一年的时间了，这门课程也快结束了。从一开始的烦躁到后面的适应再到习惯，本身自主学习的能力提高了太多。之后继续加油！

1. GDB深刻研究
2. redis深刻研究
3. 深刻研究cleardlg
4. git深刻研究
5. Java-String.intern的深刻研究
6. css float的深刻研究
7. spring3 mvc的深刻研究
8. Object类深刻研究
9. 深刻研究java.lang.ThreadLocal类
10. 深刻研究BufferedInputStream内幕
更多相关文章...
• TCP滑动窗口机制深度剖析 - TCP/IP教程
• PHP imagecolorclosest - 取得与指定的颜色最接近的颜色的索引值 - PHP参考手册
• 算法总结-深度优先算法
• 漫谈MySQL的锁机制

GDB的深刻研究

GDB的深刻研究

1、GDB代码调试

（一）GDB调试实例

（二）GDB经常使用命令

2、CGDB代码调试

主要功能介绍：

界面及使用说明

3、汇编代码调试

4、DDD代码调试

（一）DDD简介

（二）DDD调试过程

（三）经常使用命令简介

5、段错误

（一）使用gcc和gdb（对于简单代码）

（二）使用core文件和gdb

6、多进程与多线程

（一）多进程

一、进程的基本概念

二、建立进程

三、终止进程

四、调试进程

（二）多线程

基于线程的并发编程

linux提供的多线程的系统调用：

7、心得体会