根据上一节的例子,我们实现了不通过Windows的API函数,直接构造一个函数实现ReadProcessMemory的功能。在这个过程中,最关键的一步就是INT2E,通过INT2E软中断自陷,我们从3环进入了0环实现了ReadProcessMemory的功能。本节主要讨论的就是INT2E软中断自陷这个操作过程中更底层的原理,和3环进入0环了另一种方法(Systementer快速调用)
0x01 中断门进0环
何谓CPU进入系统空间
用户空间与系统空间所在的内存区间不一样,所以对于这两种区间,CPU的运行状态也不一样。在用户空间中,CPU处于"用户态";在系统空间中,CPU处于"系统态"。那么这二者有什么区别呢?何谓CPU进入系统空间?
-
CPU的运行状态从用户态转为系统态,拥有了执行"特权指令"的能力。
-
CPU进入系统态后,可以访问内存中的系统区(内核所在的区域),而在用户态下是无法访问的。
-
当前进程使用的堆栈,从用户态切换到系统态。堆栈原先的内容(用户态),以及用户空间的堆栈指针,被压入系统空间堆栈。同时被压入的,还有EFLAGS、CS、EIP的内容。
-
关闭中断,依照中断向量从IDT中找到相应的表项,并根据表项提供的程序入口进入相应的中断服务程序。
CPU进入系统态的手段
CPU从系统态进入用户态是容易的,因为可以执行一些系统态特有的特权指令,从而进入用户态。而相反,用户态进入系统态则不容易,因为用户态是无法执行特权指令的。所以,一般的,有3种手段可以使CPU进入系统态(即转入系统空间执行)。
- 中断:来自于外部设备的中断请求。当有中断请求到来时,CPU自动进入系统态,并从某个预定地址开始执行指令。中断只发生
在两条指令之间,不影响正在执行的指令。 - 异常:无论是在用户空间或系统空间,执行指令失败时都会引起异常,CPU会因此进入系统态(如果原先不在系统空间),从而
在系统空间中对异常做出处理。异常发生在执行一条指令的过程中,所以当前执行的指令已经半途而废了。 - 自陷:以上两种都CPU被动进入系统态。而自陷是CPU通过自陷指令主动进入系统态。多数CPU都有自陷指令,系统调用函数一般都是靠自陷指令实现的。一条自陷指令的作用相当于一次子程序调用,子程序存在于系统空间。
INT2E中断与KiSystemService函数
而INT2E就是自陷指令,即通过自己主动的触发陷阱的方法进入系统态。相信大家应该都知道,IDT表其实就是一个索引表,每个中断门描述符对应着一个中断处理函数,那么我们同样来分析一下这个门描述符 (对门描述符分析有疑问的参见Windows保护模式学习笔记(2)—— 调用门&中断门&陷阱门)
- 门描述符:804dee00`0008e7d1
- CS:门描述符的段选择子部分(0008)
- SS:从段选择子指向的TSS段描述符指向的TSS表中取出
- ESP:从段选择子指向的TSS段描述符指向的TSS表中取出
- EIP:804de7d1
然后我们查看一下这个EIP对应的地址空间
可以看到,INT2E号中断对应着KiSystemService函数,我们可以看到这个函数前面带着 nt! 的字样,这个关键字说明这个函数是内核函数,即其存在于0环空间
通过自陷指令调用系统服务流程
下面我们用一个例子(ReadFile函数)来看一下通过中断门进0环的一个整体的调用过程
Windows将2e号向量专门用作系统调用,在启动早起初始化中断描述表时便注册好了适合的服务例程。因此当NtDll中的NtReadFile发出int 2e指令后,cpu便会通过idt表找到KisystemService函数。因为KiSystemService函数是位于内核空间的,所以cpu在把执行权交给KiSystemService函数前,会做好从用户态换到内核态的各种工作,包括:
-
权限检查 即检查源位置和目标位置所在的代码段权限,核实是否可以转移。
-
准备内核态使用的栈,为了保证内核安全,所有线程在内核态执行时都必须使用位于内核的内核栈(kernel stack),内核栈的大小一般为8KB或者12KB.
KiSystemService会根据服务ID从**系统服务分发表(System Service Dispatch Table)**中查找到需要的服务函数地址和参数描述,然后将参数从用户态复制到该线程的内核栈中,最后KiSystemService调用内核中真正的NtReadFile()函数,执行读文件操作,操作结束后会返回到KiSystemService,KISystemService函数会将操作结果复制回线程用户态栈,最后通过IRET指令将执行权交回给NtDll.dll中的NtReadFile()函数,继续执行INT 2E后面的那条指令。
其实,纵观ntdll.dll,大部分的函数都是这个样式的。所有windows基本系统调用的中介函数存在于ntdll.dll中,这些中介函数拥有相同的样式(都是执行自陷指令,然后调用相应的内核函数),所以reactOS用工具自动生成这些中介函数。它们的函数名、系统调用号、参数个数,来自文件sysfuncs.lst中。
0x02 快速调用进0环
从ring0到ring3最开始是用的int2E(中断门方式),此模式切换过程设计很多次内存访问(从IDT中取CS和EIP,从TSS中取SS和ESP),还有两次查表操作机访问权限的检查,这导致模式切换的开销很大。因此,从PentiumII 处理器开始,Inter引入了新的指令sysenter/sysexit,来实现快速的模式切换。但同样的,并不是所有处理器都支持快速调用!
判断CPU是否支持快速调用
使用 CPUID 指令可以从处理器厂商里获得关于处理器的详细信息,该指令是从 Intel 486 处理器以后开始加入支持(这个版本实在太过古老,暂不考虑不支持该指令的情况)。通过该条指令获取到的SEP位可确认是否支持快速调用
|
|
SEP=1,说明当前CPU支持 sysenter / sysexit 指令
_KUSER_SHARED_DATA
学习快速调用还需要补充一些前置知识。系统在 User 层和 Kernel 层分别定义了一个 _KUSER_SHARED_DATA 结构区域,用于 User 层和 Kernel 层共享某些数据。它们使用固定的地址值映射,_KUSER_SHARED_DATA结构区域在User层和Kernel层地址分别为:
User:0x7ffe0000
Kernnel:0xffdf0000
可以看到,这两个地址虽然指向的是同一个物理页,但在User层是只读的,而在Kernnel层是可写的
KiFastSystemCall
前面我们说过,系统在初始化的时候根据CPU是否支持快速系统调用而使*_KUSER_SHARED_SYSCALL(0x7ffe0300)*指针指向KiIntSystemCall()或KiFastSystemCall(),所以我们这里看一下快速调用时调用的函数KiFastSystemCall()
可以看到,同样的,这个函数也只有简单的两行代码。第一行将当前栈顶(esp)的值放入edx中,第二行执行了sysenter指令。同样的,可以看到,在执行KiIntSystemCall函数前,编号已被写入EAX
sysenter指令
CPU如果支持sysenter指令,操作系统会提前将CS/SS/ESP/EIP的值存储在MSR寄存器中,sysenter指令执行时,CPU会将MSR寄存器中的值直接写入相关寄存器,没有读内存的过程,所以叫快速调用,但其与中断门调用进入0环的本质是一样的。 在执行sysenter指令之前,操作系统必须指定0环的CS段、SS段、EIP以及ESP,其中,CS段、EIP以及ESP来自MSR寄存器,下面看一下该寄存器的结构(该寄存器非常庞大,这里只列出三个最重要的值)
可以在内核模式下通过 rdmsr/wrmsr 指令来读写这3个寄存器。
- kd> rdmsr 174 //查看CS
- kd> rdmsr 175 //查看ESP
- kd> rdmsr 176 //查看EIP
查看EIP所在地址的反汇编,可以看到nt表示当前函数为内核函数
然后这里有个注意点,在执行sysenter指令时,只有CS、ESP、EIP三个寄存器的值可从MSR寄存器中获得,其中并不包括SS!
- SS= IA32_SYSENTER_CS + 8