用二进制写程序,提高装 X 境界

        用二进制来写程序这么反人类的事情,的确是很装的事情,可是它不可是一件很装的事情,也是掌握底层知识的基础能力之一。听我慢慢道来。编程

 

        程序设计语言有高级语言和低级语言之分,尤为是如今各类编程语言的不断发展,掌握高级程序设计语言的人愈来愈多。微信

 

        可是是否可使用二进制来写程序呢?也许最初使用打孔带来控制机器的人能够完成,那么如今是否仍然有人能够完成呢?答案是确定的!数据结构

 

        计算机能够直接运行的指令是二进制的机器码,全部的代码在运行以前都会变成 CPU 能够识别的二进制。对于编译型的二进制语言,其实都是能够直接使用二进制来写的。编程语言

 

        好比,Windows 下使用 C 语言编写的程序编译链接后能够生成一个 .exe 的可执行程序,生成的这个可执行程序就是一个二进制程序。那么,这个程序如何用二进制编写呢?编辑器

 

        先来考虑几个问题!函数

 

        首先,可执行程序中并不是只有代码,而 CPU 要执行的只有代码。学习

 

        其次,CPU 执行的代码是二进制,可是在内存中的数据也是二进制数据,那么如何知道哪部分是代码,哪部分是数据呢?这是操做系统在加载程序文件进入内存时,操做系统按照必定规则把不一样二进制按照不一样的属性装入了不一样的内存分页当中,并对内存设置相应的属性。加密

 

        最后,操做系统如何知道程序文件中的二进制哪部分是数据,哪部分是代码呢?这是在程序被编译链接时不但把代码和代码所需的数据编译到了程序中,还把管理代码的数据也放入了程序中,而这部分管理数据决定了哪部分是数据哪部分是代码。spa

 

        所以,用二进制写代码就须要至少掌握两方面,一方面是了解可执行程序的管理数据,另外一方面就是了解 CPU 的机器码。操作系统

 

        在 Windows 下的可执行程序是 PE 格式的,那么就要了解 PE 格式的数据结构,和 CPU 的机器码;在安卓下的可执行程序中,其格式是 DEX 格式,那么就要了解 DEX 格式的数据结构,以及安卓虚拟机的字节码(这个字节码不是 CPU 的机器码,DEX 的字节码最终被虚拟机解释成机器码,所以手写 DEX 文件时了解 DEX 格式和其字节码便可),一样的,Java 编译的 Class 文件也和安卓相同,由于它也是基于虚拟机执行的文件。其中 PE 格式和 DEX 格式就是程序的管理数据,用于告诉操做系统或虚拟机,整个文件中代码、数据以及其余资源在文件中的结构。

 

        由于二进制的阅读性比较差,所以人们使用了八进制十六进制四位二进制能够表示为一位十六进制,因为系统是 32 位或 64 位,那么恰好使用 8 个十六进制位表示 32 个二进制位,或者 16 个十六进制位表示 64 个二进制位。所以,在内存中查看数据时,更多的是使用十六进制,其实从本质上十六进制和二进制是没有区别的,只是表示的方式不一样。所以,真正使用二进制来写程序时,是使用十六进制来完成的。

 

        那么,在使用十六进制来编写 Windows 下的可执行程序时,首先须要使用十六进制编辑器构造 PE 文件结构,PE 文件结构主要告诉操做系统,程序加载入内存后,程序的映射起始地址是多少,程序的入口地址是多少,程序中的代码和数据分别保存在哪里,以及它们的长度是多少,映射到内存中之后其地址是多少,该可执行文件调用了哪些系统函数,这些系统函数分别在哪些动态连接库中等信息。构造完 PE 文件结构之后,就可使用机器码来写程序了。只要把机器代码写到 PE 文件结构中标识程序入口的位置处就好了。固然了,机器码写程序是比较困难的,可是做为学习底层基础知识来讲,写一个简单的程序仍是能够的,好比写一个弹出对话框的“hello world”这样的程序。用机器码写这样的程序,也无需了解太多的知识,有一份 Opcode 的手册就能够了。

 

        这就是如何用十六进制编辑器来完成一个可执行程序的过程,关于 PE 文件格式,能够参考 MSDN 或网上的文章,对于学习机器码相关的知识能够查看 Intel 的指令手册。学习这些知识对于软件破解、病毒分析、加密解密、内核驱动开发等是相应知识的基础,感兴趣的能够了解一下,了解这些知识绝对不单单是用来装 X 的。

 


 

个人微信公众号:“码农UP2U”

相关文章
相关标签/搜索