- 前言
- Intel四级页表
- 实操寻址
- 获取cr3
- 获取PGD
- 获取PUD
- 获取PMD
- 获取PTE
- 获取内容
- 最后
Linux四级页表的做用主要就是地址映射, 将逻辑地址映射到物理地址. 不少时候, 有些地方想不明白就能够查看实际物理地址进行分析.bash
其实不少设计的根源或者说缘由都来自于CPU的设计, OS不少时候都是辅助CPU. Linux的四级页表就是依据CPU的四级页表来设计的. 这里主要说的就是Intel x64页面大小为4KB的状况, 如图所示:工具
固然, 你能够用指令确认下:ui
getconf PAGE_SIZE
复制代码
首先这里先贴出几个工具, fileview, dram, registers. 这些都是能够帮助快速获取地址的, 上一篇文章说的kgdb工具也是能够的, 就是麻烦一点, 你懂的. 具体内容就不贴了, 这里仅展现用户态的代码:google
#include <stdio.h>
#include <fcntl.h>
#include <unistd.h>
#include <stdlib.h>
#include <sys/stat.h>
#include <sys/types.h>
#define BUFSIZE 4096
int main()
{
int fd, ret;
char buf[BUFSIZE];
unsigned long int a = 0x1234567890abcdef;
printf( "a=0x%016lX addr: %p \n", a, &a );
if ( (fd = open( "/proc/registers", O_RDONLY ) ) < 0 )
{
fprintf( stderr, "Open /proc/registers file failed! \n" );
exit( EXIT_FAILURE );
}
lseek( fd, 0L, SEEK_SET );
if ( (ret = read( fd, buf, sizeof buf - 1 ) ) < 0 )
{
perror( "/proc/registers" );
exit( EXIT_FAILURE );
}
buf[ret] = 0;
close( fd );
puts( buf );
while ( 1 );
return(0);
}
复制代码
使用make指令编译工具, 插入dram.ko和registers.ko驱动模块. 编译运行用户态程序, 如图所示:spa
这之中最关键的是cr3地址以及局部变量地址, 这里看到, 变量地址是0x7ffdcbffaba8, 变量值是0x1234567890ABCDEF. cr3寄存器中地址是0x40c78000. 固然了, 按照CPU的图示, cr3确定是指向PML4E. 在Linux当中, 第一级页表称为PGD, 固然是有历史缘由的, 能够自行google. 因此Linux的四级页表分别是PGD -> PUD -> PMD -> PTE.设计
想要获取PGD中的内容须要经过计算. 这里先来处理一下局部变量地址. 首先写成二进制.3d
0x7ffdcbffaba8
0111 1111 1111 1101 1100 1011 1111 1111 1010 1011 1010 1000
复制代码
而后按照Intel的设计, 从新整合.code
011111111 111110111 001011111 111111010 101110101000
复制代码
从新写成16进制:cdn
ff 1f7 5f 1fa ba8
复制代码
这就是只要用的offset. 由于每一个单元是64-bits所以须要在序号基础上乘以8得到地址. 因此PGD地址为:blog
0x40c78000(cr3) + ff * 8 = 0x40c787f8
复制代码
而后使用启动以前编译的小工具:
./fileview /dev/dram
复制代码
输入以前计算出来的地址0x40c787f8, 就能够获得之中的内容, 也就是PUD, 从CPU图来讲就是PDPTE:
这里获取到的是67 50 75 76 00 00 00 80, 可是注意, Intel是和显示顺序反过来的. 也就是76755067, 而后后面的12-bits是页面属性. 因此, 具体地址就是:
76755000 + 1f7 * 8 = 76755fb8
复制代码
一样输入地址到工具, 获得67 80 E8 2C 00 00 00 00.
直接计算了:
2ce88000 + 5f * 8 = 2ce882f8
复制代码
获得67 00 DD 48 00 00 00 00.
直接计算了:
48dd0000 + 1fa * 8 = 48dd0fd0
复制代码
获得67 58 59 20 00 00 00 80.
最后就能够获取到内容了:
20595000 + ba8 = 20595ba8
复制代码
固然了, 此次是在用户态下进行从线性地址到物理地址转换的, 若是是内核态有些地方会发生变化. 暂时写到这里, 内核态等后续的更新了. 喜欢记得点赞, 有意见或者建议评论区见~