这是几年前在项目中遇到的一个崩溃问题,崩溃在了ComFriendlyWaitMtaThreadProc()
里,没有源码。耗费了我很大精力,最终经过反汇编并结合原代码才最终搞清楚了事情的前因后果。本文的分析仍是基于真实项目进行的,中间略去了不少反汇编的分析工做。文末有我整理的测试代码,你们能够实际体验一把TerminateThread()
的杀伤力。git
大概状况是这样的:程序启动的时候,会经过LoadLibrary()
加载插件模块。其中的UIA
模块会开启一个工做线程,在工做线程里会安装UIA
相关的钩子来监听UIA
事件,程序在退出的时候会调用每一个插件模块的导出函数作清理工做,而后调用FreeLibrary()
释放这个插件模块。UIA
模块的清理函数会通知工做线程退出,并等待工做线程一段时间,等待超时就经过TerminateThread()
强制杀死工做线程,工做线程收到退出命令后会卸载相关钩子。程序退出时偶尔会崩溃在ComFriendlyWaitMtaThreadProc()
中。背景介绍完毕,下面开始分析dump
文件。windows
使用windbg
载入dump
文件,输入.ecxr
bash
从输出结果能够看出是访问到无效的地址0x07acf914
了,使用命令!address 07acf914
查看该地址的信息:微信
从输出结果能够看出该地址确实是不可访问的。咱们须要看看0x07acf914
是从哪里来的,该值来自edi+4
指向的地址所存储的值,那么edi
的值是哪里来的呢?让咱们看看前几条汇编指令是什么,输入ub 7303f614 L10
函数
说明:测试
7303f614
这个地址是我经过7303f611+3
算来的(3
是指令长度),这样就能够在输出结果中看到致使崩溃的这条指令啦。固然这里输入ub 7303f611
也不要紧(咱们关心的是edi
的值是哪里来的),只不过咱们看不到7303f611
对应的指令了。ui
咱们发现edi
的值来自ebp+8
对应的地址内容。研究过反汇编的小伙伴儿应该对ebp+n
比较敏感,有木有?在windows
下,32
位进程中,ebp+8
指向了调用约定为__stdcall
的函数的第一个参数。ebp+8
是否指向了第一个参数,咱们须要经过ComFriendlyWaitMtaThreadProc()
的调用约定来判断。spa
输入k
查看调用栈: 操作系统
从调用栈可知,ComFriendlyWaitMtaThreadProc()
是在新线程中执行的,经过查看CreateThread()
的原型咱们能够知道 ComFriendlyWaitMtaThreadProc()
原型应该知足typedef DWORD (__stdcall LPTHREAD_START_ROUTINE)(LPVOID lpThreadParameter);
。插件
综上可知,ebp+8
确实指向了第一个参数,这个参数指向了一个非法的地址!
我猜想有以下两种可能:
bug
,传递参数的时候就传的有问题!(可能性过低了,对本身的代码比较有信心😂)单纯从dump
看不出更多的信息了!因而我决定给 ComFriendlyWaitMtaThreadProc()
下断点,看看是否能找到是谁建立了这个线程! 执行以下命令:
bu uiautomationcore!ComFriendlyWaitMtaThreadProc
g复制代码 |
断下来后,使用~*k
查看全部线程的调用栈,通过排查,11号线程
和18号线程
最值得怀疑。
18号线程
是出问题的线程。
11号线程
包含咱们本身的代码,并且ComFriendlyWaitForSingleObject()
跟ComFriendlyWaitMtaThreadProc()
类似度不要过高。
大胆猜想内部逻辑应该是:函数AddWinEvent()
内部会建立一个工做线程,uiautomationcore!ComFriendlyWaitMtaThreadProc()
是新线程的入口函数,建立完线程后经过调用ComFriendlyWaitForSingleObject()
等待一个内核对象(经过反汇编确认该对象为Event
)来等待工做线程结束。理所固然的,uiautomationcore!ComFriendlyWaitMtaThreadProc()
结束后应该会激活这个内核对象。
通过一系列的小(艰)心(苦)谨(卓)慎(绝)的反汇编,检查代码,确认逻辑,最终获得以下结论。
当主程序退出时,主线程作清理工做,会等待11号线程
一段时间,若是等待超时就会调用TerminateThread()
将其强行杀死(正是这个TerminateThread()
的调用致使了崩溃)! 而18号线程
会用到11号线程
传过来的线程参数(11号线程
的一个局部变量),若是11号线程
被意外杀死了,那么11号线程
的局部变量对应的地址就无效了,对这块内存的操做就是未定义的!至此真相大白!(中间还有不少相关细节太琐碎了,没有一一列出,这里直接写出告终论。)
知道缘由了,解决就很简单了。去掉对TerminateThread()
的调用,由操做系统来清理未结束的线程便可,因为主程序会调用FreeLibrary()
释放插件模块,因此主程序还须要特殊处理下,在退出的时候不调用FreeLibrary()
释放UIA
模块。
为了让你们更好的理解问题的本质,更直观的感觉下TerminateThread()
的杀伤力,我特地编写了以下测试代码来模拟我在项目里遇到的问题。
#include "stdafx.h"
#include "windows.h"
#include "process.h"
unsigned __stdcall SubWorkProc(void* param) {
int* data = (int*)param;
while (1)
{
*data = 1;
Sleep(1000);
}
return 0;
}
unsigned __stdcall WorkProc(void* param) {
int data = 0;
_beginthreadex(NULL, 0, &SubWorkProc, &data, 0, NULL);
while (1)
{
Sleep(1000);
}
return 0;
}
int _tmain(int argc, _TCHAR* argv[])
{
auto hThread = (HANDLE)_beginthreadex(NULL, 0, &WorkProc, NULL, 0, NULL);
Sleep(1000);
TerminateThread(hThread, 0xdead);
Sleep(INFINITE);
return 0;
}复制代码 |
TerminateThread()
强制杀线程!除非你想故意埋坑!😂windbg
真是windows
下的调试利器,再向你们安利一波。windbg
帮助文档