GDB的深刻研究

GDB的深刻研究

1、GDB代码调试

(一)GDB调试实例

  • 在终端中编译一个示例C语言小程序,保存为文件 gdblianxi.c 中,用GCC编译。

  • 在上面的命令行中,使用-o参数指定了编译生成的可执行文件名为 gdblianxi,使用参数-g表示将源代码信息编译到可执行文件中。若是不使用参数-g,会给后面的GDB调试形成不便。
  • 下面输入“gdb”命令启动GDB,将首先显示GDB说明:

  • 下面使用“file”命令载入被调试程序 gdblianxi(这里的 gdblianxi 即前面 GCC 编译输出的可执行文件)

  • 上图中最后一行“(gdb) ”为GDB内部命令引导符,等待用户输入GDB命令。
  • 上图倒数第二行提示已经加载成功。
  • 下面使用“r”命令执行(Run)被调试文件,由于还没有设置任何断点,将直接执行到程序结束
  • 使用“b”命令在 main 函数开头设置一个断点(Breakpoint)
  • 以后一行提示已经成功设置断点,并给出了该断点信息:在源文件 gdblianxi.c 第14行处设置断点;这是本程序的第一个断点(序号为1);断点处的代码地址为 0x40055d。向上看源代码,第14行中的代码为“n = 1”,刚好是 main 函数中的第一个可执行语句(由于前面的“int n;”为变量定义语句,并不是可执行语句)。
  • 再次使用“r”命令执行(Run)被调试程序:

  • 程序中断在gdblianxi.c第14行处,即main函数是第一个可执行语句处。 上面最后一行信息为:下一条将要执行的源代码为“n = 1;”,它是源代码文件gdblianxi.c中的第14行。
  • 下面使用“s”命令(Step)执行下一行代码(即第14行“n = 1;”):

  • 上面的信息表示已经执行完“n = 1;”,并显示下一条要执行的代码为第15行的“n++;”。前端

  • 下面咱们分别在第21行打印处、tempFunction 函数开头各设置一个断点(分别使用命令“b 21”“b tempFunction”):linux

  • 使用“c”命令继续(Continue)执行被调试程序,程序将中断在第二个断点(21行),此时全局变量 nGlobalVar 的值应该是 88;再一次执行“c”命令,程序将中断于第三个断点(7行,tempFunction 函数开头处),此时tempFunction 函数的两个参数 a、b 的值应分别是 1 和 2:

  • 再一次执行“c”命令(Continue),由于后面再也没有其它断点,程序将一直执行到结束:

(二)GDB经常使用命令

命令 解释 示例
file <文件名> 加载被调试的可执行程序文件。
由于通常都在被调试程序所在目录下执行GDB,于是文本名不须要带路径
(gdb) file gdblianxi
r Run的简写,运行被调试的程序。
若是此前没有下过断点,则执行完整个程序;若是有断点,则程序暂停在第一个可用断点处。
(gdb) r
c Continue的简写,继续执行被调试程序,直至下一个断点或程序结束。 (gdb) c
b <行号>
b <函数名称>
b * <函数名称>
b * <代码地址>
d [编号]
b: Breakpoint的简写,设置断点。两可使用“行号”“函数名称”“执行地址”等方式指定断点位置。
其中在函数名称前面加“*”符号表示将断点设置在“由编译器生成的prolog代码处”。若是不了解汇编,能够不予理会此用法。
d: Delete breakpoint的简写,删除指定编号的某个断点,或删除全部断点。断点编号从1开始递增。
(gdb) b 8
(gdb) b main
(gdb) b * main
(gdb) b * 0x804835c
(gdb) d
s, n s: 执行一行源程序代码,若是此行代码中有函数调用,则进入该函数;
n: 执行一行源程序代码,此行代码中的函数调用也一并执行。
s 至关于其它调试器中的“Step Into (单步跟踪进入)”
n 至关于其它调试器中的“Step Over (单步跟踪)”
这两个命令必须在有源代码调试信息的状况下才可使用(GCC编译时使用“-g”参数)。
(gdb) s
(gdb) n
si, ni si命令相似于s命令,ni命令相似于n命令。
所不一样的是,这两个命令(si/ni)所针对的是汇编指令,而s/n针对的是源代码。
(gdb) si
(gdb) ni
p <变量名称> Print的简写,显示指定变量(临时变量或全局变量)的值。 (gdb) p i
(gdb) p nGlobalVar
display ...
undisplay <编号>
display,设置程序中断后欲显示的数据及其格式。
例如,若是但愿每次程序中断后能够看到即将被执行的下一条汇编指令,可使用命令“display /i $pc”
其中 $pc 表明当前汇编指令,/i 表示以十六进行显示。当须要关心汇编代码时,此命令至关有用。
undispaly,取消先前的display设置,编号从1开始递增。
(gdb) display /i $pc
(gdb) undisplay 1
i Info的简写,用于显示各种信息,详情请查阅“help i”。 (gdb) i r
q Quit的简写,退出GDB调试环境。 (gdb) q
help [命令名称] GDB帮助命令,提供对GDB名种命令的解释说明。
若是指定了“命令名称”参数,则显示该命令的详细说明;若是没有指定参数,则分类显示全部GDB命令,供用户进一步浏览和查询。
(gdb) help display

2、CGDB代码调试

  • cgdb能够看做gdb的界面加强版,cgdb主要功能是在调试时进行代码的同步显示,这增长了调试的方便性,提升了调试效率。其余功能则与gdb同样,可以使用其经常使用命令。因此这里只作简单介绍,经常使用命令等参见gdb。
主要功能介绍:

(1)相比GDB,增长了语法加亮的代码窗口,显示在GDB窗口的上部,随GDB的调试位置代码同步显示。程序员

(2)断点设置可视化 。正则表达式

(3)在代码窗口中可以使用GDB经常使用命令 。编程

(4)在代码窗口可进行代码查找,支持正则表达式 。小程序

界面及使用说明

(1)代码窗口windows

调试时同步显示被调试程序源代码,自动标记出程序运行到的位置。当焦点在代码窗口时,能够浏览代码、查找代码以及执行命令 ,操做方式同vi 。经常使用命令以下:数组

i : 焦点切换到GDB窗口 。
 o :打开文件选择框,可选择要显示的代码文件 。
 空格 :设置/取消断点 。
 k:向上移动
 j:向下移动
 /:查找

(2)状态条窗口数据结构

  • 同vi的状态条,通常显示当前打开的源文件名,当代码窗口进入命令状态时,显示输入的命令等信息

(3)GDB窗口多线程

  • CGDB的操做界面,同GDB ,按ESC键则焦点切换到代码窗口 。

  • 启动&退出——启动:cgdb;退出:在代码窗口或GDB窗口,执行quit命令 。

代码实现:

“(gdb)”表示GDB已经启动,等待咱们输入命令。此时程序并未开始运行,输入“run”开始运行程序。这种方式在GDB内部运行程序:

List n,m表示显示n到m行的代码

设置断点,break n,用step单步执行(这里break 21):

3、汇编代码调试

汇编级的调试或跟踪,须要用到display命令“display /i $pc”,如上表所示,

“display /i $pc”
其中 $pc 表明当前汇编指令,/i 表示以十六进行显示。当须要关心汇编代码时,此命令至关有用。
undispaly,取消先前的display设置,编号从1开始递增。

而且之后程序每次中断都将显示下一条汇编指定(“si”命令用于执行一条汇编代码——区别于“s”执行一行C代码)

接下来咱们试一下命令“b * <函数名称> ”。 为了更简明,有必要先删除目前全部断点(使用“d”命令——Delete breakpoint)

当被询问是否删除全部断点时,输入“y”并按回车键便可。
下面使用命令“b *main”在 main 函数的 prolog 代码处设置断点(prolog、epilog,分别表示编译器在每一个函数的开头和结尾自行插入的代码):

此时可使用“i r”命令显示寄存器中的当前值———“i r”即“Infomation Register”,
也能够输入“i r 寄存器名”显示任意一个指定的寄存器值:

最后输入命令“q”,退出(Quit)GDB调试环境

4、DDD代码调试

(一)DDD简介

  • DDD,全称是Data Display Debugger,对于Linux系统中的编程人员来讲,它就是windows系统下面的visual studio ,功能强大,是Linux世界中少数有图形界面的程序调试工具。DDD是命令行调试器的图形前端,除了通常的程序调试功能之外,还具备交互式图形数据显示的功能。它在嵌入式应用开发中也十分出色。DDD最初源于1990年Andreas Zeller编写的VSL结构化语言,后来通过一些程序员的努力,演化成今天的模样。DDD的功能很是强大,能够调试用C\C++、Ada、 Fortran、Pascal、Modula-2和Modula-3编写的程序;能够超文本方式浏览源代码;可以进行断点设置、回溯调试和历史纪录编辑;具备程序在终端运行的仿真窗口,并在远程主机上进行调试的能力;图形数据显示功能(Graphical Data Display)是建立该调试器的初衷之一,可以显示各类数据结构之间的关系,并将数据结构以图形化形式显示;具备GDB/DBX/XDB的命令行界面,包括彻底的文本编辑、历史纪录、搜寻引擎。

(二)DDD调试过程

打开终端命令行窗口,输入命令vi testddd.c,创建testddd.c文件做为以后调试的文件:

在testddd.c文件中输入一些C语言的程序数据,DDD工具能够调试不少种程序设置基于的代码,本次调试以C语言做为说明对象。

把testddd.c文件编译成能够执行的文件testddd,命令:gcc -g -o testddd testddd.c,注意必定要带-g参数,不然生成的可执行文件中没有必要的调试信息,最终使用DDD工具不能调试。

运行DDD调试工具,直接输入命令ddd就能够打开DDD工具。

DDD工具打开后以下图所示,上面较大空白部分为代码区,和工具区,分割线下面是调试生成信息区。

点击菜单栏上的“文件”----->“打开程序”,准备打开咱们上面准备的testddd.c文件

在打开程序框中,定位到咱们要调试的程序的目录下,在Files列表下选择咱们要调试 信息,以后点击左下方的打开按钮。

调试程序打开后,在代码区能够看到咱们的代码,右边的一些按钮是咱们调试要用的工具。

在代码区点鼠标右键,会弹出如图所示的菜单:

咱们能够给程序设置断点等,点击工具区里面的Run按钮,能够执行程序,在下面的调试信息区能够看到程序的执行结果。

如上图所示:在鼠标右键点击的地方设置了断点,在下方调试信息生成区显示了程序运行的输入信息。

PS:也能够在Terminal中输入ddd 文件名来直接打开ddd调试该文件的界面:

在怀疑程序哪一个变量为可疑变量时,能够在控制台输入以下命令

或者在主窗口原程序中点击某个变量如sum选中该变量,右击后选择display sum 选项就会看到该变量的值在主窗口的上方。 接着往下单步运行,屡次点击工具栏中的“Step”按钮,观察变量sum的结果。

若是问题出在count上。这时点击命令工具栏上的“Kill”按钮将程序断掉,把初始化sum的那一句改正确。从新运行以后,发现结果正确,调试过程完毕。

(三)经常使用命令简介

run       执行程序
step      单步调试
kill      杀死正在运行的程序
interrupt 退出这次调试回到原始状态
  • DDD的数据显示功能很是强大。
  • 对于固定大小的数组,用鼠标选中数组名,点击plot按钮便可画出图形。
  • 对于变长数组,可使用graph plot数组名[起始索引] @ 数组大小的命令来显示。
  • 对于复杂的数据结构,DDD也能够用图形方式解析: DDD有一个detect aliases的选项,能够智能的判别数据是否会被重复显示。这种方式经过内存地址的检测来实现的。

5、段错误

  • 定义:段错误是指访问的内存超出了系统给这个程序所设定的内存空间,例如访问了不存在的内存地址、访问了系统保护的内存地址、访问了只读的内存地址等等状况。

段错误产生的缘由:
(1) 访问不存在的内存地址
(2) 访问系统保护的内存地址
(3) 访问只读的内存地址
(4) 栈溢出

下面以缘由一访问不存在的内存地址为例,进行实践。

(一)使用gcc和gdb(对于简单代码)

  • 首先,编写一段代码,访问不存在内存地址。编译后进入CGDB,运行程序:

  • 从输出中能够看出,程序收到SIGSEGV信号,触发段错误,并提示0x00000000004004e六、调用main报的错,在Derro.c中23行。而且在代码窗口第23行被标记出来。

  • 适用场景

仅当能肯定程序必定会发生段错误的状况下使用。
当程序的源码能够得到的状况下,使用-g参数编译程序。
通常用于测试阶段,生产环境下gdb会有反作用:使程序运行减慢,运行不够稳定,等等。
即便在测试阶段,若是程序过于复杂,gdb也不能处理。

(二)使用core文件和gdb

  • 提到段错误会触发SIGSEGV信号,经过man 7 signal,能够看到SIGSEGV默认的handler会打印段错误出错信息,并产生core文件,由此咱们能够借助于程序异常退出时生成的core文件中的调试信息,使用gdb工具来调试程序中的段错误。
  • 查看core文件发现不存在:

  • 查看系统core文件的大小限制,发现为0,这样不会自动生成core文件。把大小设置为1000。运行程序后再次查看可看到存在core文件:

  • 加载core文件,使用gdb工具进行调试。从输出中能够看出一样的段错误信息:

6、多进程与多线程

(一)多进程

一、进程的基本概念
  • 进程定义了一个计算的基本单元,能够认为是一个程序的一次运行。它是一个动态实体,是独立的任务。它拥有独立的地址空间、执行堆栈、文件描述符等。 每一个进程拥有独立的地址空间,进程间正常状况下,互不影响,一个进程的崩溃不会形成其余进程的崩溃。 当进程间共享某一资源时,需注意两个问题:同步问题和通讯问题。
二、建立进程
  • 父进程经过调用fork函数来建立一个新的运行子进程。fork函数定义以下:
#include <sys/types.h>
#include <unistd.h>

pid_t fork(void);
  • fork函数只被调用一次,可是会返回两次:父进程返回子进程的PID,子进程返回0.若是失败返回-1。
  • fork后,子进程和父进程继续执行fork()函数后的指令。子进程是父进程的副本。子进程拥有父进程的数据空间、堆栈的副本。但父、子进程并不共享这些存储空间部分。若是代码段是只读的,则父子进程共享代码段。若是父子进程同时对同一文件描述字操做,而又没有任何形式的同步,则会出现混乱的情况; 父进程中调用fork以前打开的全部描述字在函数fork返回以后子进程会获得一个副本。fork后,父子进程均须要将本身不使用的描述字关闭,有两方面的缘由:(1)以避免出现不一样步的状况;(2)最后能正常关闭描述字

  • 在BSD3.0中开始出现,主要为了解决fork昂贵的开销。它是彻底共享的建立,新老进程共享一样的资源,彻底没有拷贝。 二者的基本区别在于当使用vfork()建立新进程时,父进程将被暂时阻塞,而子进程则能够借用父进程的地址空间。这个奇特状态将持续直到子进程退出或调用execve()函数,至此父进程才继续执行。

三、终止进程

进程的终止存在两个可能:(1)父进程先于子进程终止(init进程领养) (2)子进程先于主进程终止。对于后者,系统内核为子进程保留必定的状态信息:进程ID、终止状态、CPU时间等;当父进程调用wait或waitpid函数时,获取这些信息; 当子进程正常或异常终止时,系统内核向其父进程发送SIGCHLD信号;缺省状况下,父进程忽略该信号,或者提供一个该信号发生时即被调用的函数。

#include <stdlib.h>
void exit(int status);
  • 本函数终止调用进程。关闭全部子进程打开的描述符,向父进程发送SIGCHLD信号,并返回状态。
#include <sys/types.h>
#include <sys/wait.h>
pid_t wait(int *stat_loc);
  • 返回:终止子进程的ID-成功;-1-出错;statloc存储子进程的终止状态(一个整数);

  • 若是没有终止的子进程,可是有一个或多个正在执行的子进程,则该函数将堵塞,直到有一个子进程终止或者wait被信号中断时,wait返回。 当调用该系统调用时,若是有一个子进程已经终止,则该系统调用当即返回,并释放子进程全部资源。

pidt waitpid(pidt pid, int *statloc, int options);
  • 返回:终止子进程的ID-成功;-1-出错;statloc存储子进程的终止状态;
  • 当pid=-1,option=0时,该函数等同于wait,不然由参数pid和option共同决定函数行为,其中pid参数意义以下:
-1:要求知道任何一个子进程的返回状态(等待第一个终止的子进程);
>0:要求知道进程号为pid的子进程的状态;
<-1: wait  for  any  child process whose process group ID is equal to the absolute value of pid.
  • Options最经常使用的选项是WNOHANG,它通知内核在没有已终止进程时不要堵塞。

  • 调用wait或waitpid函数时,正常状况下,可能会有如下几种状况:

阻塞(若是其全部子进程都还在运行);
得到子进程的终止状态并当即返回(若是一个子进程已终止,正等待父进程存取其终止状态); 
出错当即返回(若是它没有任何子进程)

四、调试进程
  • 通常状况下,父进程fork一个子进程,gdb只会继续调试父进程而不会管子进程的运行。若是想跟踪子进程进行调试,可使用set follow-fork-mode mode来设置fork跟随模式。
  • set follow-fork-mode 所带的mode参数能够是如下的一种:
parent        gdb只跟踪父进程,不跟踪子进程,这是默认的模式。
    child         gdb在子进程产生之后只跟踪子进程,放弃对父进程的跟踪。
  • 进入gdb之后,咱们可使用show follow-fork-mode来查看目前的跟踪模式。

  • 能够看到目前使用的模式是parent。

  • 有时,咱们想同时调试父进程和子进程,以上的方法就不能知足了。Linux提供了set detach-on-fork mode命令来供咱们使用。其使用的mode能够是如下的一种:

on        只调试父进程或子进程的其中一个(根据follow-fork-mode来决定),这是默认的模式。
    off       父子进程都在gdb的控制之下,其中一个进程正常调试(根据follow-fork-mode来决定)
  • 另外一个进程会被设置为暂停状态。
  • 一样,show detach-on-fork显示了目前是的detach-on-fork模式,如图所示。

  • 以上是调试fork产生子进程的状况,可是若是子进程使用exec系统函数而装载了新程序执行,咱们就使用set follow-exec-mode mode提供的模式来跟踪这个exec装载的程序。mode能够是如下的一种:
new 当发生exec的时候,若是这个选项是new,则新建一个inferior给执行起来的子进程,而父进程的inferior仍然保留,当前保留的inferior的程序状态是没有执行。
 same 当发生exec的时候,若是这个选项是same(默认值),由于父进程已经退出,因此自动在执行exec的inferior上控制子进程。

(二)多线程

  • 线程:运行在单一进程上下文中的逻辑流,由内核进行调度,共享同一进程的虚拟地址空间。

    基于线程的并发编程
  • 线程由内核自动调度,每一个线程都有它本身的线程上下文(thread context),包括一个唯一的整数线程ID(Thread ID,TID),栈,栈指针,程序计数器,通用目的寄存器和条件码。每一个线程和其余线程一块儿共享进程上下文的剩余部分,包括整个用户的虚拟地址空间,它是由只读文本(代码),读/写数据,堆以及全部的共享库代码和数据区域组成的,还有,线程也共享一样的打开文件的集合。
  • 线程不像进程那样,不是按照严格的父子层次来组织的。和一个进程相关的线程组成一个对等线程池,独立于其余线程建立的线程。进程中第一个运行的线程称为主线程。对等(线程)池概念的主要影响是,一个线程能够杀死它的任何对等线程,或者等待它的任意对等线程终止;进一步来讲,每一个对等线程都能读写相同的共享数据。
  • 线程是可执行代码的可分派单元。这个名称来源于“执行的线索”的概念。在基于线程的多任务的环境中,全部进程有至少一个线程,可是它们能够具备多个任务。这意味着单个程序能够并发执行两个或者多个任务。
  • 简而言之,线程就是把一个进程分为不少片,每一片均可以是一个独立的流程。这已经明显不一样于多进程了,进程是一个拷贝的流程,而线程只是把一条河流截成不少条小溪。它没有拷贝这些额外的开销,可是仅仅是现存的一条河流,就被多线程技术几乎无开销地转成不少条小流程,它的伟大就在于它少之又少的系统开销。

linux提供的多线程的系统调用:

(1)函数pthread_create用来建立一个线程,它的原型为:

extern int pthread_create __P ((pthread_t *__thread, __const pthread_attr_t *__attr,void *(*__start_routine) (void *), void *__arg));

第一个参数为指向线程标识符的指针,第二个参数用来设置线程属性,第三个参数是线程运行函数的起始地址,最后一个参数是运行函数的参数。

(2)函数pthread_join用来等待一个线程的结束。函数原型为:

2extern int pthread_join __P ((pthread_t __th, void **__thread_return));

第一个参数为被等待的线程标识符,第二个参数为一个用户定义的指针,它能够用来存储被等待线程的返回值。这个函数是一个线程阻塞的函数,调用它的函数将一直等待到被等待的线程结束为止,当函数返回时,被等待线程的资源被收回。

(3)一个线程的结束有两种途径,一种是象咱们上面的例子同样,函数结束了,调用它的线程也就结束了;另外一种方式是经过函数pthread_exit来实现。它的函数原型为:

extern void pthread_exit __P ((void *__retval)) __attribute__ ((__noreturn__));

惟一的参数是函数的返回代码,只要pthread_ join中的第二个参数thread_ return不是NULL,这个值将被传递给 thread_return。

最后要说明的是,一个线程不能被多个线程等待,不然第一个接收到信号的线程成功返回,其他调用pthread_join的线程则返回错误代码ESRCH。

  • Linux系统下的多线程遵循POSIX线程接口,称为pthread。编写Linux下的多线程程序,须要使用头文件pthread.h,链接时须要使用库libpthread.a。Linux下pthread的实现是经过系统调用clone()来实现的。clone()是Linux所特有的系统调用,它的使用方式相似fork。

  • 下面代码示例:

  • 代码分析:主线程作本身的事情,生成2个子线程,task1为分离,任其自生自灭,而task2仍是继续送外卖,须要等待返回。

  • 编译运行:

  • 屡次运行发现结果并不彻底相同,这是不一样的线程抢占CPU的结果。

7、心得体会

这篇GDB的深刻研究是我作的第一个加分项目,到此算是告一段落了。在作以前,一直感受GDB调试是很困难的一件事,可是本身真正去实践才发现它并无我想象中的那么难。此次我完成了GDB代码调试、CGDB代码调试、汇编代码调试、DDD代码调试以及多进程与多线程的学习,中途也遇到过不少问题,可是经过查阅资料,参考以前的学长学姐的经验最终都解决了。不知不觉,写博客已经有一年的时间了,这门课程也快结束了。从一开始的烦躁到后面的适应再到习惯,本身自主学习的能力提高了太多。之后继续加油!

相关文章
相关标签/搜索