8.1.6　破解技术

2025年09月21日

版权

8.1.6　破解技术

下面让我们暂时客串一把破解者的角色!本节的目的并不是要把你训练成一个破解高手,而只想使大家对破解技术有一个大致印象。假设破解者拿到的只是一个运行在Linux操作系统下,针对x86处理器编译的二进制可执行文件,而且这个可执行文件还是不带调试符号的。我们最主要的破解工具是gdb调试器。

虽然攻击的具体细节依据所在的操作系统,破解者所使用的工具以及被破解软件中使用的保护技术的不同而不同,但所有破解技术的本质却是相通的。另外,也有一些描述如何在Windows系统、Android系统中进行破解的书籍已经出版。

1.从可执行文件中获取信息

在正式开始破解之前,你必须对被破解的可执行文件本身进行一次分析,搞清它是静态链接,还是动态链接的,是否带调试符号,程序中各个段的起始和结束位置等信息。在每个操作系统中都会有一些工具能帮助你获取这些信息,执行命令和结果如下所示:

pagenumber_ebook=243,pagenumber_book=231

现在你已经知道了不少关于这个可执行文件的有用信息了。首先,它是一个动态链接的程序,所以在可执行文件中就一定带有一些符号信息。此外你还知道了这个程序中.text段(代码段)和.rodata段(数据段)的起始和结束位置。如果要在可执行文件中搜索某个字符串或者某个指令序列的话,这些信息就会非常有用。最后(当然不是说你能得到的信息就到此为止了),你还知道这个程序应该从0x4006a0这个地址开始执行。

2.在库函数上设置断点

在破解之初,你把程序当成一个黑盒子。给它输入一定的数据,然后观察它的运行结果。你立刻就发现:程序将只输出一句“expired!”(过期!),而不是播放音乐给你听。

pagenumber_ebook=244,pagenumber_book=232

所以你首先要破解的就是这个讨厌的软件使用期限限制!

你已经知道这个可执行程序是不带调试符号和动态链接的。也就是说,你能通过函数名找到不少库函数。由于程序一般都会通过调用标准库函数time()来获取当前时间,并把结果和指定的软件过期时间相比较来实现限制软件使用日期的功能。所以你现在的任务就是从程序中找出那个与语句if(time(0) pagenumber_ebook=244,pagenumber_book=232 somevalue)等价的汇编指令序列。

我们现在的想法是,在time()函数上设置一个断点,然后运行程序,直到命中这个断点。这时,我们就可以去检查函数调用栈,看看是哪条指令调用了time()函数。而在这条指令附近就很可能是我们要找的东西了。找到它之后,我们就可以将跳转条件置反,把语句改成if(time(0) pagenumber_ebook=244,pagenumber_book=232 =somevalue)...

一切都按计划顺利执行!我们发现位于0x4008bc的这条指令就是我们要修改的跳转指令。

pagenumber_ebook=244,pagenumber_book=232

现在我们只要把操作码jle改成jg(x86的操作码是0x7f)就可以了。我们用gdb调试器中的set指令来完成这一工作:

pagenumber_ebook=244,pagenumber_book=232

在这个案例中,我们的运气不错,由于这个可执行文件是动态链接的,因而有一部分符号信息被保留了下来。如果这个程序是静态链接且不带调试符号的,我们就没这么容易在time()函数上设置断点了。不过这也不难!可以用模式匹配的方法,根据time()函数的特征从可执行文件中找出它。另外,由于time()函数最终是要调用gettimeofday()这个系统函数,才能从操作系统那里获取系统当前时间,我们也可以通过在gettimeofday()函数上设置断点的方法,达到与在time()函数上设置断点类似的效果。

3.静态模式匹配

现在播放器不再输出“expired!”,我们可以继续去对付其他的保护措施了!我们发现如果现在我们输入的不是正确的激活码“42”的话,程序将给出一个“wrong code”的消息,然后崩溃掉。

pagenumber_ebook=245,pagenumber_book=233

这次,我们准备使用另一个常用的破解方法,在可执行文件中搜索指定的字符串。估计我们这次要找的汇编代码大致应该是下面这个样子。

pagenumber_ebook=245,pagenumber_book=233

我们首先要在数据段里搜索字符串"wrong code"所在的位置addr1,然后把代码段中所有引用这个字符串的指令都找出来。

pagenumber_ebook=245,pagenumber_book=233

第一次搜索就找到了addr1的地址,第二次搜索又找到了addr2的地址。这次把je指令改成jmp指令,就能绕过printf()语句。顺便说一下,在x86体系结构的处理器中,jmp指令的操作码是0xeb。

pagenumber_ebook=245,pagenumber_book=233

我们的运气实在是不错,因为在这个例子里,addr2上的那条指令在引用字符串“wrong code”时是直接使用它的地址addr1的。所以我们才能用直接搜索addr1的方法找到addr2。而在其他许多处理器中(如x86的16位处理器),指令在引用数据段中的数据时是使用:

偏移地址+段基址寄存器上存放的段基地址=被引用数据地址

这个方法的。这样的话,搜索工作的难度无疑就要大一些。

4.内存断点

现在这个播放器再也不会去检查软件使用期限和激活码了,但是它还是会因为一个段违规而崩溃。

pagenumber_ebook=246,pagenumber_book=234

我们可以比较有把握地猜想这是因为我们之前对程序进行的修改,使得程序中防篡改代码被触发执行而导致的。在UNIX系统中,段违规一般是由于程序试图访问某个非法的内存地址,比如程序中使用了一个空指针(NULL pointer),而引发的。

这次我们采用的方法是:在调试器中运行这个程序,直到它崩溃棹。然后检查是哪条指令试图访问非法地址及出错的原因。接着再次在调试器中运行程序,这次我们将在被改为错误值的那个内存地址上设置一个内存断点(watchpoint),看它是在何时被写入一个错误值的。

pagenumber_ebook=246,pagenumber_book=234

显然,这个段违规是由于地址0x40087b上的这条指令试图往0x601240上存放的指针所指向的地址写入一些数据时引发的。所以我们就要在0x601240这个地址上设置一个内存断点,然后重新运行一下程序看看在这个内存地址上都发生了些什么。

pagenumber_ebook=246,pagenumber_book=234