欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  IT编程

Python实例分享:快速查找出被挂马的文件

程序员文章站 2023-11-20 16:34:10
思路 需要实现准备一份未受感染的源代码和一份可能受感染的源代码,然后运行以下脚本,就能找出到底哪些文件被挂马了。 其中,主要是根据比对2份文件的md5值来过滤可能被挂马...

思路

需要实现准备一份未受感染的源代码和一份可能受感染的源代码,然后运行以下脚本,就能找出到底哪些文件被挂马了。

其中,主要是根据比对2份文件的md5值来过滤可能被挂马的文件(确切的说应该是被修改过的文件)

python脚本

复制代码 代码如下:

__author__ = 'flying'
#coding:utf-8
#date:2014.6.5
#检测修改过的文件
import os,sys,hashlib,datetime
global_dirold = ""
global_dirnew = ""
global_fileslist = []
#输入要比对的文件路径
def inputdirpath():
    global global_dirold,global_dirnew
    global_dirold = unicode(raw_input("请输入备份文件所在目录:"),"utf-8")
    while not os.path.exists(global_dirold):
        print  u"指定的路径不存在,请重新输入"
        global_dirold = unicode(raw_input("请输入备份文件所在目录:"),"utf-8")
    global_dirnew = unicode(raw_input("请输入要检测文件的目录:"),"utf-8")
    while not os.path.exists(global_dirnew):
        print  u"指定的路径不存在,请重新输入"
        global_dirnew = unicode(raw_input("请输入要检测文件的目录:"),"utf-8")

#将数据保存到文件中
def savetofile(filepath,content):
    try:
        f = open(filepath,"a+")
        f.write(content.encode("utf-8") + "\n")
        f.close()
    except exception,ex:
        print "error:" + str(ex)

#计算文件的md5值
def calcmd5(filepath):
    try:
        #以二进制的形式打开
        with open(filepath,'rb') as f:
            md5obj = hashlib.md5()
            md5obj.update(f.read())
            hash = md5obj.hexdigest()
            return hash
    except exception,ex:
        print "error:" + str(ex)
        return none

#遍历目录下的所有文件
def getallsubfiles():
    global global_fileslist
    for dir in os.walk(global_dirnew):
        for file in dir[2]:
            filepath = dir[0] + os.sep + file
            global_fileslist.append(filepath[len(global_dirnew)+1:])

#列出新增文件和变动的文件
def listchangedfiles():
    global global_dirold,global_dirnew,global_fileslist
    print u"变动或新增的文件:"
    for file in global_fileslist:
        filepathold = global_dirold + os.sep + file
        filepathnew = global_dirnew + os.sep + file
        if not os.path.exists(filepathold) or calcmd5(filepathold)!=calcmd5(filepathnew):
            content = "[" + datetime.datetime.now().strftime('%y-%m-%d %h:%m:%s')+ "]" + filepathnew
            print content
            savetofile("changedfiles.txt",content)

if __name__=="__main__":
    inputdirpath()
    getallsubfiles()
    listchangedfiles()

脚本执行结果

Python实例分享:快速查找出被挂马的文件