开发

4.1 开发环境配置

4.1.1 Python环境配置

在使用到一些全新的Python库之后，代码的开发和测试流程与以前相比略有不同。由于在首次使用Bold-Falcon之前必须先进行安装，这使得常规的"修改——测试"的迭代开发过程无法像以前一样独立进行。下面我们将概述如何在使用Bold-Falcon的同时开发和测试新的特性。

初始化一个新的虚拟环境。考虑到放置在/tmp目录下的虚拟环境在重启后便不会继续保存，因此可以设置一个单独的存储目录路径，例如，~/venv/bold-falcon-development(即用于在通用的~/venv目录下为所有的虚拟环境设置一个名为bold-falcon-development的存储子目录)。
```
$ virtualenv /tmp/bold-falcon-development
```
激活该虚拟环境。该操作必须在每次启动新的shell会话时完成（除非将该命令放入~/.bashrc或者类似的配置文件中）。
```
$ . /tmp/bold-falcon-development/bin/activate
```
为了创建一个Bold-Falcon分发包，需要从社区库中获取一些匹配监控二进制文件。这里我们提供了一个简单易用的脚本来半自动地执行这一操作。通过在当前库的根目录下按以下方式运行，即可自动获取上述二进制文件。
```
(bold-falcon-development)$ python stuff/monitor.py
```
在开发者模式下安装Bold-Falcon，在执行期间将使用当前目录下的相关文件。
```
(bold-falcon-development)$ python setup.py sdist develop
```

完成以上步骤后，现在可以修改和测试代码文件了，代码文件位于Bold-Falcon目录下。实际上，即使是对当前库的开发版本进行测试，Cuckoo Working Directory和Cuckoo Working Directory Usage中的所有规则仍然有效。

4.1.2 Pycharm环境配置

在这一节中，我们将在Bold-Falcon开发的背景下介绍大量的Pycharm配置选项，并尝试在Pycharm IDE下开展Bold-Falcon的运行和开发任务。

网页端界面

本节会介绍基于Django框架运行的Bold-Falcon网页端界面。这一部分的代码修改以及自定义特性的新增工作比较容易。

路径和概念

Bold-Falcon网页端提供了Web接口和RESTAPI
Django项目根目录位于Bold-Falcon/web
配置位于Bold-Falcon/web/web/settings.py
URL调度程序位于Bold-Falcon/web/web/urls.py，以及其他路径下，包括但不限于Bold-Falcon/web/analysis/urls.py
HTML模板使用Django模板语言。
前端中与Bold-Falcon相关的JavaScript内容位于Bold-Falcon/web/static/js/cuckoo/，其中源代码位于 Bold-Falcon/web/static/js/cuckoo/src/目录下。
所谓的"控制器"用于代替基于类的视图，其中控制器负责不属于视图函数的操作（通常是后端）。例如：Bold-Falcon/web/controllers/analysis/analysis.py
视图函数是视图使用的函数，位于routes.py。例如：Bold-Falcon/web/controllers/analysis/routes.py
API函数是API使用的函数，位于api.py。例如：Bold-Falcon/web/controllers/analysis/api.py

运行和调试

直接使用PyCharm运行和调试Bold-Falcon，可以直接绕过Bold-Falcon启动程序并使用PyCharm的内置Django服务器，而且无需对源代码进行任何修改即可做到这一点。首先，建议全程在虚拟环境中操作，从而将Bold-Falcon所需的依赖项与系统范围内安装的Python隔离开来。其次，建议在开发模式下安装Bold-Falcon. 假设Bold-Falcon成功安装（并且有一个正在使用的工作目录，参见Cuckoo Working Directory Installation）；启动PyCharm并打开Bold-Falcon目录。选择Run->Edit Configurations并单击+，选择"Django服务器"。服务器配置使用下列参数值：

Name - web
Host - 127.0.0.1
Port - 8080
Environment variables -单击 ... 并增加 CUCKOO_APP:web
Python interpreter - 选择之前配置的虚拟环境。如果该虚拟环境不存在，请使用File->Settings->Project: Cuckoo->Project Interpreter将该虚拟环境添加到本项目中。
Working directory -Django项目根目录的绝对路径，例如：/home/test/PycharmProjects/virtualenv/Bold-Falcon/web/

此时，可以使用PyCharm运行和调试Bold-Falcon了，通过选择Run->Run->web即可启动网页端服务器。

JavaScript传输

Bold-Falcon前端中的Javascript代码是基于ECMAScript 6标准开发的。为了兼容浏览器，需要将它转回ECMAScript 5标准。首先，配置PyCharm使其能够识别并理解ECMAScript 6的语法。选择File->Settings->Languages & Frameworks->Javascript并从"Javascript语言版本"下拉列表中选择"ECMAScript 6"。然后选择Apply. 然后，使用Babel传输Javascript代码。在Bold-Falcon项目根目录中安装Babel（需要npm）：

(bold-falcon)    test:$ pwd
/home/test/PycharmProjects/virtualenv/bold-falcon
(bold-falcon)    test:$ npm install --save-dev babel-cl
  

它将在Bold-Falcon项目根目录下创建一个名为node_modules的文件夹。切换回PyCharm并打开cuckoo/web/static/js/cuckoo/src路径下的任意js文件，PyCharm将询问是否要为该文件配置一个文件监视程序。点击Add watcher（如果此选项不可用，请在File->Settings->Tools->File watchers下找到"file watcher"位置）。在弹出屏幕"Edit Watcher"中，输入下列值：

Name - Babel ES6->ES5
Description - Transpiles ECMAScript 6 code to ECMAScript 5
Output filters - None
Show console - Error
Immediate file synchronisation - yes
Track only root files - yes
Trigger watcher regardless of syntax errors - no
File type - Javascript
Scope - 单击 ... -> + (添加范围) -> local -> OK. 在文件浏览器中，进入 Bold-Falcon/web/static/js/cuckoo/src/目录下并选择src文件夹，单击include. src中的文件现在应该会变成绿色。选择 OK.
Program - 应该是 node_modules/.bin/babel的绝对路径，例如：/home/test/PycharmProjects/virtualenv/cuckoo/node_modules/.bin/babel. 再次检查输入的路径是否反映文件node_modules/.bin/babel的实际位置。
Arguments - --source-maps --out-file $FileNameWithoutExtension$.js $FilePath$
Working directory - 浏览并选择 Bold-Falcon/web/static/js/cuckoo
Output paths to refresh $FileNameWithoutExtension$-compiled.js:$FileNameWithoutExtension$-compiled.js.map

最后，需要创建一个manage.py mock文件，以便PyCharm将其视为Django项目。文件Bold-Falcon/web/manage.py的内容如下：

#!/usr/bin/env python
import sys

if __name__ == "__main__":
   from django.core.management import execute_from_command_line
   execute_from_command_line(sys.argv)
  

转到File->Settings->Languages & Frameworks->Django，然后配置如下：

Django Project root - Bold-Falcon/web
Settings - web/settings.py
Manage script - manage.py

测试

到目前为止，项目配置已经完成，可以使用PyCharm运行和调试Bold-Falcon了！

4.2 辅助功能模块

4.2.1 设计说明

辅助功能模块定义了一些需要与每个样本分析过程并行执行的辅助功能，例如：记录并为用户提供分析样本的网络流量、中间人代理、客户端重启等辅助功能。全部辅助模块放在 Bold-Falcon/moduls/auxiliary/ 目录下，全部辅助模块配置选项在 Bold-Falcon/conf/auxiliary.conf 文件下。

1）辅助功能定义函数

from lib.cuckoo.common.abstracts import Auxiliary

class MyAuxiliary(Auxiliary):
    """定义辅助模块"""
    
    def start(self):
        # 定义辅助功能

    def stop(self):
        # 定义模块关闭
  

start()：将在主机启动客户机并有效执行提交的恶意文件之前执行
stop()：将在分析过程的最后以及启动处理和报告过程之前执行

2）辅助功能运行函数

class RunAuxiliary(object):
    """辅助模块管理"""
    
	def __init__(self, task, machine, guest_manager)：
    	# 辅助功能模块初始化
    
  	def start(self):
    	# 辅助功能模块配置
        options = config2("auxiliary", module_name)
       	
    def callback(self, name, *args, **kwargs):
    	# 辅助功能模块加载
        MyAuxiliary.start()
        
  	def stop(self):
    	# 辅助功能模块关闭
    	MyAuxiliary.stop()	
  

__init__(): 辅助功能模块初始化（任务号、虚拟机软件、客户机IP映射等）
start(): 根据 Bold-Falcon/conf/auxiliary.conf 下的配置选择辅助功能模块列表
callback(): 开启辅助功能模块列表的辅助功能
stop(): 关闭辅助功能模块列表的辅助功能

3）辅助功能列表

辅助模块名称	辅助模块功能
sniffer	负责执行tcpdump以转储沙箱样本分析过程中生成的网络流量
mitm	负责执行mitmdump以提供中间人代理功能
reboot	负责提供重启分析支持

4.2.2 设计流程

1) 辅助功能模块时序图

%% 时序图例子,-> 直线，-->虚线，->>实线箭头 sequenceDiagram participant 沙箱主机 participant 客户机 autonumber #opt is run %%rect rgb(121, 255, 121) 沙箱主机->客户机: 启动沙箱主机沙箱主机->客户机: 初始化沙箱配置 #rect rgb(135,206,250) 沙箱主机->>客户机: 辅助功能模块初始化沙箱主机->>沙箱主机: 辅助功能模块加载沙箱主机->>客户机: 辅助功能模块开启 loop 文件分析模块沙箱主机->>+客户机: 样本上传客户机->>-客户机: 样本分析 Note right of 客户机: 执行分析脚本客户机->>沙箱主机: 分析结果存储 end 沙箱主机->>沙箱主机: 辅助功能模块存储沙箱主机->客户机: 辅助功能模块结束 #end 沙箱主机->客户机: .... #end

2）辅助功能模块流程设计

启动沙箱主机
初始化沙箱配置
辅助功能模块初始化
辅助功能模块加载
辅助功能模块开启
样本上传
样本分析
分析结果存储
辅助功能模块存储
辅助功能模块关闭

4.3 机器交互模块

4.3.1 设计说明

机器交互模块定义了沙箱主机与虚拟化软件的交互过程，包括开启虚拟机、启动任务调度、上传样本、上传分析模块和分析配置文件、在数据库中记录虚拟机的状态等操作。全部机器交互模块放在 Bold-Falcon/modules/mechinery/目录下，我们默认使用了VirtualBox虚拟机软件。全部辅助模块配置选项在 Bold-Falcon/conf/virualbox.conf文件下。

沙箱主机与客户机网络配置中使用Host-Only连接方式。对于一个恶意软件，当其被安装配置了Bold-Falcon的主机提交到各个客户机进行运行分析时，主机是想要知道客户机的所有流量信息的，因为绝大部分的恶意软件都需要依赖网络来执行恶意行为。此时只有设置Host-Only连接，主机才能截获客户机与互联网之间流经的所有流量，进而更好地分析恶意软件的行为方式。

1）机器交互定义函数

from lib.cuckoo.common.abstracts import Machinery
from lib.cuckoo.common.exceptions import CuckooMachineError

class MyMachinery(Machinery):
    def start(self, label):
    	# 开启定义虚拟机管理软件
        try:
            revert(label)
            start(label)
        except SomethingBadHappens:
            raise CuckooMachineError("oops!")
    
    def initialize(self, module_name):
        # 初始化配置信息
    	self._initialize(module_name)
    
    def stop(self, label):
    	# 关闭定义虚拟机管理软件
        try:
            stop(label)
        except SomethingBadHappens:
            raise CuckooMachineError("oops!")
  

start()：开启定义虚拟机管理软件
stop()：关闭定义虚拟机管理软件
initialize()：根据指定的配置信息（标签、平台、IP等）生成可用客户机的列表

2）机器交互管理函数

class AnalysisManager(threading.Thread):

    def __init__(self, task_id, error_queue):
        # 读取任务的消息、配置文件中的服务端ip和端口

    def init(self):
        # 初始化分析, 创建分析结果存储目录

    def acquire_machine(self):
        # 开启配置虚拟机
        
    def launch_analysis(self):
  		# 开启分析任务
        self.init():
        self.acquire_machine()
        # 开启虚拟机如：machinery/virtualbox.py 中 VirtualBox.start
        machinery.start(self.machine.label, self.task)
        return succeeded
  

__init__(): 读取任务的消息（指明分析时间、系统类型、开始时间、结束时间、指明分析状态）；配置文件中的服务端ip和端口（我这里设置的是192.168.56.1和2042）
init()：创建文件夹, 用于存放分析结果和样本文件，将target指向的文件存放到storage/binaries下
acquire_machine(): 开启配置虚拟机
launch_analysis(): 开启分析任务，各个模块的清理工作

3）客户端代理函数

Host和Client端的数据传输,客户端代理 agent.py 脚本在客户机运行

class MiniHTTPRequestHandler(SimpleHTTPServer.SimpleHTTPRequestHandler):
  	# 用作对不同路径的不同函数处理(响应)
    server_version = "Cuckoo Agent"

    def do_GET(self):
        # 响应GET请求

    def do_POST(self):
        # 响应POST请求
    	# host与client之间的数据传输, 格式为multipart/form-data
  

do_GET(): 响应GET请求
do_POST():
- 响应POST请求
- host与client之间的数据传输, 格式为multipart/form-data，可以理解为key:value形式
- 如: analysis.conf, 分析模块, 样本等，这些数据在传输的时候, 都要带有filename字段

AGENT_VERSION = "0.10"
AGENT_FEATURES = [
    "execpy", "pinning", "logs", "largefile", "unicodepath",
]
 
@app.route("/")
def get_index():
  
@app.route("/environ")
def get_environ():

@app.route("/mktemp", methods=["GET", "POST"])
def do_mktemp():
    
@app.route("/mkdtemp", methods=["GET", "POST"])
def do_mkdtemp():  
    
@app.route("/extract", methods=["POST"])
def do_extract():
    
@app.route("/store", methods=["POST"])
def do_store():
  
@app.route("/execpy", methods=["POST"])
def do_execpy():
       
@app.route("/status")
def get_status():
  

get_index(): agent的一些基本信息

浏览器输入192.168.56.2:8000 返回：

{"message": "Cuckoo Agent!", "version": "0.10", "features": ["execpy", "pinning", "logs", "largefile", "unicodepath"]}
  

get_environ(): 获取client端环境变量,以便后面后续的一些命令执行
do_mktemp() 和 do_mkdtemp()
- 两个创建临时文件夹的命令: mktemp和mkdtemp，但二者创建的位置不一样
- mkdtemp –> 在%SYSTEMDRIVE%(C:)下创建一个随机文件夹
- mktemp –> 在%TEMP%(C:\Users\bill\AppData\Local\Temp)下创建一个随机文件夹
do_extract(): 将分析模块以zip格式压缩,发送给client端；发送extrac命令, 将分析模块解压到上一步创建的文件夹中。

do_store():

执行store命令, 写入analysis.conf 到 C:/tmppx7scx/analysis.conf

analysis.conf	内容
category	file
target	/tmp/cuckoo-tmp-pwnmelife/tmpZ3SA0v/maze.exe (host端的样本地址)
package	exe
file_type	PE32 executable (GUI) Intel 80386, for MS Windows
file_name	maze.exe
clock	20200620T09:28:00
id	1
timeout	120
ip	192.168.56.1
port	2042

执行store命令, 写入simple.bin 到 C:\Users\bill\AppData\Local\Temp\simple.bin

do_execpy(): 执行分析脚本
get_status(): 不断获取样本分析状态

4）客户端管理函数

class GuestManager(object):

    def __init__(self, vmid, ipaddr, platform, task_id, analysis_manager):
      	# 初始化信息

    def stop(self):
        # 关闭客户端分析
    
    def upload_analyzer(self, monitor):
        # 上传分析模块
     
    def add_config(self, options):
        # 上传分析脚本

    def start_analysis(self, options, monitor):
        # 客户端开启分析
        self.upload_analyzer(monitor)

        self.add_config(options)

        # 执行store命令 --> 在系统中执行写入analysis.conf
        self.post("/store", files=files, data=data)

        # 执行execpy命令 --> 在系统中执行python analyzer.py
        self.post("/execpy", data=data)
            
        # 执行execute命令, execute(command)
        self.post("/execute", data=data)

    def wait_for_completion(self):
        # 不断获取客户端分析状态
  

__init__(): 初始化IP、端口号、系统、任务号、保存路径信息
stop(): 关闭客户端分析
upload_analyzer():
- 分析模块的文件位于Bold-Falcon/data/analyzer/(android, darwin, linux, windows)
- analyzer_zipfile 也会将 dumpmem.yarac 和Monitor 写入到压缩文件流中
add_config(): 上传分析脚本，将options中的内容传入client中, 写入到self.analyzer_path的analysis.conf中
start_analysis(): 客户端开启分析,client 端也开启了http server, 获取agent（配置的时候,需要在虚拟机中放置agent.py）的信息
wait_for_completion(): 不断获取客户端分析状态

4.3.2 设计流程

1) 机器交互模块时序图

%% 时序图例子,-> 直线，-->虚线，->>实线箭头 sequenceDiagram participant 沙箱主机 participant 代理 participant 客户机 autonumber #opt is run %%rect rgb(121, 255, 121) 沙箱主机->客户机: 启动沙箱主机沙箱主机->客户机: 初始化沙箱配置沙箱主机->客户机: 启动虚拟机管理软件，生成可用客户机的列表沙箱主机->沙箱主机: 创建文件夹, 用于存放分析结果和样本文件沙箱主机-->沙箱主机: 开启分析任务、开启客户端 #rect rgb(135,206,250) #loop 机器交互模块沙箱主机->>代理: Get/index 客户机-->>沙箱主机: 获取代理的基本信息沙箱主机->>代理: Get/environ 客户机-->>沙箱主机: 获取client端环境变量沙箱主机->>代理: Get/mktemp 客户机-->>客户机: 在%SYSTEMDRIVE%(C:\)下创建一个随机文件夹沙箱主机->>代理: Get/mkdtemp 客户机-->>客户机: 在%TEMP%(C:\Users\bill\AppData\Local\Temp)下创建一个随机文件夹沙箱主机->>代理: POST/extract 沙箱主机-->>客户机: 将分析模块以zip格式压缩,发送给client端沙箱主机->>代理: POST/store 沙箱主机-->>客户机: 写入analysis.conf 到 C:/tmppx7scx/analysis.conf 沙箱主机->>代理: POST/store 沙箱主机-->>客户机: 写入simple.bin 到 C:\Users\bill\AppData\Local\Temp\simple.bin 沙箱主机->>代理: POST/execpy 客户机->>客户机: 执行分析脚本沙箱主机->>代理: Get/status 客户机-->>沙箱主机: 不断获取样本分析状态 #end 沙箱主机->客户机: 关闭客户端沙箱主机->沙箱主机: 关闭虚拟机管理软件沙箱主机->客户机: .... #end

2) 机器交互模块设计流程

启动沙箱主机
初始化沙箱配置
启动虚拟机管理软件
根据指定的配置信息（标签、平台、IP等）生成可用客户机的列表
创建文件夹, 用于存放分析结果和样本文件，将target指向的文件存放到storage/binaries下
开启分析任务、开启客户端
使用GET/index访问代理
获取agent的一些基本信息
使用GET/environ访问代理
获取client端环境变量,以便后面后续的一些命令执行
使用GET/mktemp访问代理
mkdtemp –> 在%SYSTEMDRIVE%(C:)下创建一个随机文件夹
使用GET/mkdtemp访问代理
mktemp –> 在%TEMP%(C:\Users\bill\AppData\Local\Temp)下创建一个随机文件夹
使用POST/extract访问代理
将分析模块以zip格式压缩,发送给client端. 发送extrac命令, 将分析模块解压到上一步创建的文件夹中.
使用POST/store访问代理
写入analysis.conf 到 C:/tmppx7scx/analysis.conf
使用POST/store访问代理
写入simple.bin 到 C:\Users\bill\AppData\Local\Temp\simple.bin
使用POST/execpy访问代理
执行分析脚本
使用POST/status访问代理
不断获取样本分析状态
关闭客户端
关闭虚拟机管理软件

4.4 文件分析模块

4.4.1 设计说明

文件分析模块定义了分析组件在客户机环境中执行并分析给定的文件的过程。可以通过设置一个包含对所有类型的文件的通用处理方法的基类Package，然后使用多态的形式为不同类型的文件实现不同的启动分析方式。可供样本运行的客户机环境包括Windows、Linux、Android系统等，模块代码存放在Bold-Falcon/data/analyzer/目录下，包含所有用户指定选项的配置存储在self.options文件中。

1）文件分析定义函数

from lib.api.process import Process
from lib.common.exceptions import CuckooPackageError

class Package(object):
    """定义文件分析模块"""
    
 	def start(self):
        # 定义文件分析初始化操作
 		raise NotImplementedError

    def check(self):
        # 执行重复操作
        return True

    def execute(self, path, args):
        # 启动分析进程
        dll = self.options.get("dll")
        free = self.options.get("free")
        suspended = True
        if free:
            suspended = False
        p = Process()
        if not p.execute(path=path, args=args, suspended=suspended):
            raise CuckooPackageError(
                    "Unable to execute the initial process, analysis aborted."
            )

        if not free and suspended:
            p.inject(dll)
            p.resume()
            p.close()
            return p.pid

    def finish(self):
        # 转储进程内存
        if self.options.get("procmemdump"):
            for pid in self.pids:
                p = Process(pid=pid)
                p.dump_memory()
        return True
  

start()：进行所有初始化操作，包括运行恶意软件进程、启动其他应用程序、拍摄内存快照等。
check()：执行任何类型的重复操作（每秒），可用于分析终止条件的触发机制。
execute()：封装恶意软件执行和DLL注入两个操作。
finish()：在完成分析并关闭客户机之前执行，用于转储所有受监控进程的进程内存。

2）分析进程定义函数

以Windows环境中的分析进程为例：

Class Process(object):
    """Windows分析进程"""
    
    def execute(self):
        # 执行样本分析
        
        # 启动inject.exe作为中间人，负责启动目标样本进程并挂起主线程
        argv = [
            inject_exe,
            "--app", path,
            "--only-start",
        ]
				subprocess_checkoutput(argv, env)
        
        # 再次启动inject.exe作为中间人，执行dll注入功能
        argv = [
            inject_exe,
            "--resume-thread",
            "--pid", "%s" % self.pid,
            "--tid", "%s" % self.tid,
        ]
        if free:
            argv.append("--free")
        else:
            argv += [
                "--apc",
                "--dll", dllpath,
            ]
        subprocess_checkoutput(argv, env)
  

3）管道通信定义函数

Class PipeServer(threading.Thread):
    # 接收传入的管道句柄，创建新线程
    
    def run(self):
        handler.start()
  

Class PipeForwarder(threading.Thread):
	# 将通过管道接收的数据发送给中心服务器
    
    def run(self):
        socket.create_connection()
        socket.sendall()
  

4）Windows分析模块运行函数

以分析通用Windows可执行文件的默认方法为例：

from lib.common.abstracts import Package

class Exe(Package):
    """EXE分析包"""
	
    def start(self, path):
        args = self.options.get("arguments")
        return self.execute(path, args)
  

5）Linux分析模块运行函数（后期扩展）

class Generic(Package):
    """基于Shell的通用执行分析包"""

    def start(self, path):
        os.chmod(path, 0o755)
        return self.execute(["sh", "-c", path])
  

6）Android分析模块运行函数（后期扩展）

class Apk(Package):
    """APK分析包"""

    def start(self, path):
        install_sample(path)
        execute_sample(self.package, self.activity)
  

7）分析脚本运行函数

class Analyzer(object):
    """Windows分析脚本"""
    
    def prepare(self):
        # 配置分析环境
        
    def run(self):
    	# 启动分析进程
        
        self.prepare()
        Package()
        # 根据文件类型选择对应的分析包
        package = choose_package()
        Auxiliary()
        # 启动一系列辅助分析工具
        aux.init()
        aux.start()
        # 隐藏进程
        zer0m0n.hidepid(self.pid)
        zer0m0n.hidepid(self.ppid)
        # 开始执行分析包
        package.start()
        package.execute()
  

prepare(): 为分析进程配置环境，包括授予权限、启动管道服务器等
run(): 启动分析进程，首先启动一系列辅助分析工具，并根据上传的文件类型选择其对应的文件包，在隐藏当前进程及其父进程后，执行分析包

8）文件分析对象列表

客户机环境	文件对象
Windows	通用Windows可执行文件
	DLL文件
	PDF文档
	Microsoft Office文档
	ZIP文件
	Java JAR文件
	Python文件
	......
Linux	基于Shell的通用可执行文件
Android	APK文件

4.4.2 设计流程

1）文件分析模块时序图

sequenceDiagram participant host_server participant analyzer participant inject participant monitor autonumber loop 分析环境准备 analyzer->>analyzer: 授予权限<br/>开启管道 end analyzer->analyzer: 启动辅助分析工具 analyzer->analyzer: Package() analyzer->analyzer: 隐藏进程 analyzer->>inject: 启动目标样本的分析进程 analyzer->>inject: 挂起主线程 inject-->>analyzer: 输出目标样本进程pid和主线程tid analyzer-->>monitor: 注入monitor.dll到目标样本的进程 monitor->>monitor: 唤醒主线程 inject->>monitor: monitor_init() monitor-->>monitor: process.py inject->>monitor: monitor_hook() monitor-->>analyzer: 管道返回日志 analyzer-->>host_server: Socket返回日志 loop 分析结果存储 host_server-->>host_server: 在线分析日志<br/>数据库<br/>结果文件夹 end

2）文件分析模块流程设计

分析环境准备
- 授予当前进程两个新权限，用于后续操作样本所在进程和加载驱动使用
- 启动两个管道服务器与目标样本进程交互，分别用于传输代码执行日志和函数调用记录日志
启动一系列辅助分析工具，主要包括截屏工具、驱动加载工具等
调用Package类，根据上传的文件类型选择其对应的文件包来启动分析
调用驱动功能，实现对当前进程（Analyzer进程）和父进程（Agent）的隐藏，防止目标检测到沙箱的存在
启动目标样本的分析进程
挂起主线程
输出目标样本进程pid和主线程tid，退出
再次启动目标样本进程，注入monitor.dll
唤醒主线程，执行样本
monitor_init()

配置读取初始化
hook初始化
管道初始化，连接前面Analyzer进程开启的两个管道
sleep初始化，针对sleep函数进行特殊处理
monitor模块的自我隐藏：抹去PE头数据+从PEB中的模块链表中将自己摘掉

process.py
- 工具脚本，处理对象为根据不同功能分成的rst文件（file.rst、process.rst、network.rst等等）
- 提取rst文件中所有需要HOOK的函数的信息，包括函数所在的模块名，函数名称、函数的所有参数信息、函数的返回值等
- 将所有rst文件通过一个hooks.c的代码模板渲染出来，得到完整的hooks.c文件，该代码文件里面定义了一个全局的g_hooks的数组，来记录所有待hook的函数信息
monitor_hook()：安装HOOK，生成函数调用记录
通过管道发送代码执行日志和函数调用记录日志
通过Socket通信发送代码执行日志和函数调用记录日志到中心服务器
中心服务器对文件分析结果进行各种形式的存储（分析日志、数据库、结果文件夹等），分析结果放置在Bold-Falcon/storage/analyse/{task_id}目录下，供后续结果处理模块使用

4.5 结果处理模块

4.5.1 设计说明

结果处理模块允许自定义方法来分析沙盒生成的原始结果，并将一些信息附加到一个全局结果容器中，该结果容器稍后将由家族签名模块、机器学习模块和报告生成模块使用。

结果处理模块都将被初始化和执行，返回的数据将被附加到一个名为全局结果容器的数据结构中。这个容器仅仅是一个大的Python字典，它包含了由所有按标识键分类的模块生成的抽象结果。每次分析的全局结果容器被储存在 Bold-Falcon/storage/analysis/task_id 文件夹下。

1）结果处理定义函数

from lib.cuckoo.common.exceptions import CuckooProcessingError
from lib.cuckoo.common.abstracts import Processing

class MyModule(Processing):

    def run(self):
        self.key = "key"
        
        try:
            data = do_something()
        except SomethingFailed:
            raise CuckooProcessingError("Failed")
            
        return data
  

run()：self.key 该属性定义要用作返回 data 的子容器的名称。
将 data 附加到全局容器中（列表、字典、字符串等）。
可以指定一个order值，允许按顺序运行可用的处理模块。

2）结果处理运行函数

class RunProcessing(object):

    def __init__(self, task):
        # 初始化信息
        
    def process(self, module, results):
      	# 执行一个结果处理模块
        
    def run(self):
        # 执行所有结果处理模块，返回全局结果容器
        # 获得 processing 功能列表
        processing_list = cuckoo.processing.plugins
        
        for module in processing_list:
            # 执行功能
            key, result = self.process(module, results)
            # If the module provided results, append it to the fat dict.
            if key and result:
                results[key] = result
        return results
  

__init__(): 初始化任务信息、虚拟机信息、分析结果存储路径
process():
- 执行一个结果处理模块
- 初始化对应处理功能
- 如果在配置中禁用了处理模块，请跳过它
- 获得分析结果存储路径
- 执行对应处理功能
- 返回关键字，对应处理功能结果
run(): 执行所有结果处理模块，返回全局结果容器

3）结果处理功能列表

处理模块名称	处理模块功能
Analysisinfo	生成有关当前分析的一些基本信息，例如时间戳、沙箱版本等
BehaviorAnalysis	解析原始行为日志，执行一些初始转换并提供解释，包括完整的进程跟踪、行为摘要和进程树
Buffer	丢弃缓冲区分析
Debug	包括错误和分析程序生成的analysis.log
Dropped	包括由恶意软件丢弃并由沙箱转储的文件的信息
Memory	在完整的内存转储上执行 Volatility 内存取证分析工具
NetworkAnalysis	解析PCAP文件并提取一些网络信息，例如DNS流量、域、ip、HTTP请求、IRC和SMTP流量
Screenshots	屏幕截图和OCR分析
StaticAnalysis	对文件执行一些静态分析
Strings	从分析的二进制文件中提取字符串
TargetInfo	包括当前所分析文件的信息，如哈希，ssdeep等
VirusTotal	在VirusTotal.com上搜索所分析文件的反病毒签名
ApkInfo	生成有关当前APK分析的一些基本信息（Android分析）
Baseline	从采集的信息中获取基线结果
Drioidmon	从Droidmon日志中提取动态API调用信息
DumpTls	交叉引用从监控程序中提取的TLS主密钥和从PCAP提取的密钥信息以转储主密钥文件
GooglePlay	有关分析会话过程的Google Play信息
Irma	IRMA连接器
Misp	MISP连接器
ProcMemory	执行进程内存转储的分析，并能够处理用户自定义的Yara规则
ProcMon	从procmon.exe的输出中提取事件
Snort	Snort处理
Suricata	Suricata处理

4）全局结果容器内容

全局结果容器为python的字典格式，为家族签名模块、机器学习模块和报告生成模块提供信息，最后保存在 Bold-Falcon/storage/analyses/{task_id}/reports/report.json 文件中。

- info
  - added/strarted/ended: 上传样本, 启动分析与结束分析的时间戳
  - duration: 分析时长
  - id: ={task_id}, 数据库中的任务id
  - package: 文件类型
  - machine: 样本运行环境
- signatures
	- families: 恶意软件家族
	- description: 签名描述
	- severity: 安全等级
	- references: URL列表
  - name: 签名名称
- target
  - file
    - yara: yara规则匹配
    - sha-1/sha256/sha512/md5: 文件哈希值
    - name: 文件名
    - type: 文件类型(包括运行系统与压缩加壳方式)
    - crc32: 校验码
    - path: 文件二进制形式存储路径
    - size: 文件大小
- network
  - tls/udp/http/icmp/smtp/tcp/dns: 协议解析字段
  - pcap_sha256: 流量包哈希值
- static
  - pe_imports: 导入地址表(IAT), 列出了动态链接库和它们的函数
  - imported_dll_count: DLL数量
  - pe_resources: 资源节, 列出了文件中的可打印字符串/图形图像/按钮图标等信息
  - pe_sections: 文件节区信息, 包括节区大小/虚拟地址/熵/加壳方式/虚拟内存等
- behavior
  - generic
    - process_path: 进程启动路径
    - process_name: 进程执行程序名
    - pid: 进程id
    - first_seen: 进程启动时间戳
    - ppid: 父进程id
  - processes
    - modules: 样本运行时调用的系统文件信息, 包括被调用文件名/路径/基地址及其大小
    - time: 运行时间
  - processtree
    - children: 子进程列表
- debug: analysis.log分析结果
- screenshots: 指定运行截图存储路径
- strings: 文件中的可打印字符串列表
  

5）结果处理模块属性

结果处理模块提供了一些属性，可用于访问当前分析任务的原始结果：

self.analysis_path：存储分析结果的目录路径，例如：Bold-Falcon/storage/analysis/1
self.log_path：analysis.log文件的路径
self.file_path：所分析文件的路径
self.dropped_path：存储丢弃文件的目录路径
self.logs_path：存储原始行为日志的目录路径
self.pcap_path：网络pcap转储的路径
self.memory_path：完整的内存转储的路径（如果已创建）
self.pmemory_path：进程内存转储的路径（如果已创建）

使用这些属性，能够轻松地访问由Bold-Falcon存储的所有原始结果，并对它们执行分析操作。

4.5.2 设计流程

1）结果处理模块时序图

%% 时序图例子,-> 直线，-->虚线，->>实线箭头 sequenceDiagram participant 沙箱主机 participant 任务目录 autonumber #opt is run %%rect rgb(121, 255, 121) 沙箱主机->任务目录: 启动结果处理模块沙箱主机->任务目录: 初始化任务信息、虚拟机信息、分析结果存储路径 #rect rgb(135,206,250) 沙箱主机->>沙箱主机: 获得处理功能列表 loop 执行处理功能列表沙箱主机->>任务目录: 执行一个结果处理功能沙箱主机->>任务目录: 初始化对应处理功能任务目录-->>沙箱主机: 获得分析数据沙箱主机->>+任务目录: 执行对应处理功能任务目录-->>-沙箱主机: 返回关键字及处理功能结果 end 沙箱主机->>沙箱主机: 全局结果容器沙箱主机->任务目录: 结果处理模块结束 #end 沙箱主机->任务目录: .... #end

2）结果处理模块设计流程

启动结果处理模块
初始化任务信息、虚拟机信息、分析结果存储路径
获得处理功能列表
执行一个结果处理功能
初始化对应处理功能
获得分析数据读取路径
执行对应处理功能
返回关键字，对应处理功能结果
执行所有结果处理模块，返回全局结果容器

4.6 家族签名模块

4.6.1 设计说明

家族签名模块定义了一些特定的"签名"，用于表示特定的恶意行为模式或特征指标，一定程度上实现特定的恶意软件家族的类别划分，并将一些信息附加到一个全局容器中。这类特征简化了结果的解释，也可以自动识别感兴趣的恶意软件样本。所有签名位于Bold-Falcon/modules/signatures/目录或社区库的Bold-Falcon/data/signatures/目录下。

通过隔离一些独特的行为（如文件名或互斥）来识别您感兴趣的特定恶意软件系列
发现恶意软件在系统上执行的修改活动，例如安装设备驱动程序
通过隔离通常由银行特洛伊木马或勒索软件执行的典型操作，识别特定的恶意软件类别
将样本分类为恶意软件/未知类别，无法识别未知的样本

1）家族签名定义函数

例：检查是否有以".exe"结尾的文件：在这种情况下，它将返回True，表示签名匹配，否则返回False

from lib.cuckoo.common.abstracts import Signature

class CreatesExe(Signature):
    name = "creates_exe"
    description = "Creates a Windows executable on the filesystem"
    severity = 2
    categories = ["generic"]
    authors = ["Cuckoo Developers"]
    minimum = "2.0"

    def on_complete(self):
        return self.check_file(pattern=".*\\.exe$", regex=True)
    
    def on_call(self, call, pid, tid):
        # 只用于事件签名
  

初始签名属性
- name：签名的标识符
- description：签名所代表内容的简要描述
- severity：标识匹配事件严重性的数字（通常在1到3之间）
- categories：描述匹配事件类型的类别列表，例如：banker, injection, anti-vm, Bold-Falcon.
- families：恶意软件家族名称列表（如果签名与已知签名高度匹配）
- authors：签名作者的列表
- references：提供签名上下文的引用（URL）列表
- enable：如果设置为False，则跳过签名
- alert：如果设置为True，则可用于指定应报告的签名
- minimum：成功运行此签名所需的最低沙箱版本
- maximum：成功运行此签名所需的最高沙箱版本
on_complete()：特征匹配签名函数，在签名进程结束时被调用
on_call()：签名匹配时执行的回调函数

2）家族签名运行函数

所有签名都将并行执行，并通过API调用集合为一个单循环中的每个签名调用回调函数on_call().

class RunSignatures(object):

    def __init__(self, results):
        # 初始化签名，记录标签API

    def call_signature(self, signature, handler, *args, **kwargs):   
        # 签名的包装器。这个包装器将事件产生给签名，并递归地处理匹配的签名
      
    def process_yara_matches(self):
       
    def process_extracted(self):

    def run(self):
      
        self.process_yara_matches()
        # 遍历所有Yara匹配项
        self.process_extracted()
        for sig in self.signatures:
            self.call_signature(sig, sig.on_extract, ExtractedMatch(item))
        # 遍历所有提取的匹配项    
        self.matched.append(signature.results())
        # 分数计算
        score += signature.severity
        # 按严重性级别对匹配的签名进行排序，并将其放入结果字典
        self.matched.sort(key=lambda key: key["severity"])
        self.results["signatures"] = self.matched
        if "info" in self.results:
            self.results["info"]["score"] = score / 5.0
    
    required = ["creates_exe", "badmalware"]
    
    def on_signature(self, matched_sig):
        # 将识别异常的多个签名组合为一个签名分类实例（恶意软件警报）
        
        if matched_sig in self.required:
            self.required.remove(matched_sig)
            
        if not self.required:
            return True
        
        return False
  

3）生成的签名结果、

如果签名匹配成功，生成的签名结果将被添加到全局容器中。

"signatures": [
    {
        "severity": 2,
        "description": "Creates a Windows executable on the filesystem",
        "alert": false,
        "references": [],
        "data": [
            {
                "file_name": "C:\\d.exe"
            }
        ],
        "name": "creates_exe"
    }
]
  

4）Yara规则

Yara是一个能够帮助恶意软件研究人员识别和分类恶意软件样本的工具，使用Yara可以基于文本或二进制模式创建恶意软件家族描述信息。每一条YARA规则都由一系列字符串和一个布尔型表达式构成，并阐述其逻辑。Yara规则可以提交给正在运行的进程，以帮助系统识别其样本是否属于某个已进行规则描述的恶意软件家族。Yara规则语法类似于C语言，每个规则都以关键字"rule"开头，后面跟着一个规则标识符。规则示例如下：

rule Test : Trojan
{
    //规则描述
    meta:
        author = "Sunset"
        date = "2021-04-21"
        description = "Trojan Detection"

    //规则字符串
    strings:
        $a = {6A 40 68 00 30 00 00 6A 14 8D 91}
        $b = {8D 4D B0 2B C1 83 C0 27 99 6A 4E 59 F7 F9}
        $c = "UVODFRYSIHLNWPEJXQZAKCBGMT"

    //条件表达式
    condition:
        $a or $b or $c
}
  

根据已有的恶意软件家族的专家知识，现在一般将Yara规则分为11类：

Antidebug_AntiVM：反调试/反沙箱类yara规则
Crypto：加密类yara规则
CVE_Rules：CVE漏洞利用类yara规则
email：恶意邮件类yara规则
Exploit-Kits：EK类yara规则
Malicious_Documents：恶意文档类yara规则
malware：恶意软件类yara规则
Mobile_Malware：移动恶意软件类yara规则
Packers：加壳类yara规则
capabilities：通用类yara规则
Webshells：Webshell类yara规则

4.6.2 设计流程

1) 家族签名模块时序图

%% 时序图例子,-> 直线，-->虚线，->>实线箭头 sequenceDiagram participant 沙箱主机 participant 结果容器 autonumber %%rect rgb(121, 255, 121) 沙箱主机->结果容器: 结果处理模块沙箱主机->结果容器: 启动家族签名模块 #rect rgb(135,206,250) 沙箱主机->>沙箱主机: 初试化所有可用签名，记录标签API 沙箱主机->>结果容器: 遍历所有Yara规则结果容器-->>沙箱主机: 记录匹配的Yara规则结果沙箱主机->>结果容器: 遍历所有签名结果容器-->>沙箱主机: 记录匹配的签名结果沙箱主机->>沙箱主机: 签名分数计算沙箱主机->>沙箱主机: 按严重性级别对匹配的签名进行排序沙箱主机-->>结果容器: 将签名结果放入结果字典沙箱主机->>结果容器: ... #end

2）家族签名模块流程设计

文件分析模块
结果处理模块
启动家族签名模块
初试化所有可用签名，记录标签API
遍历所有匹配的Yara规则
遍历所匹配的签名
分数计算
按严重性级别对匹配的签名进行排序
将签名结果放入结果字典

4.7 机器学习模块

4.7.1 设计说明

机器学习模块定义一些基于机器学习的Windows恶意软件检测模型（其他文件检测模型后续添加），用于检测恶意软件，并将一些信息附加到一个全局容器中。

**1) 检测模型定义函数 **

from lib.cuckoo.common.exceptions import CuckooDetectionError

class Detection(object):
    """
    Base abstract class for detection module.
    """
    def set_options(self, options):
        """ Set report options."""
    def set_path(self, analysis_path):
        """Set paths."""
    def set_task(self, task):
        """Add task information."""
    def load_instance(self, results):
        """
        Initialize the sample instance and load the dictionary
        need a class Instance 
        """
    def run(self):
        """ Start detection."""
        raise NotImplementedError    
  

class MyDetection(Detection):
 		
    def load_features(self)
    	# 数据预处理
    def load_model(self):
      # 加载模型训练
    def run(self, Y)
    	# 预测目标值
      	return predict
  

extract_features()：数据预处理
fit()：模型训练
predict()：预测目标值

2）检测模型运行函数

class RunDetection(object):
	""" plugins.py """
       
    def __init__(self, task):
        # 初始化模型信息
        
    def process(self, module, results):
      	# 执行一个检测模块
        
    def run(self):
        # 执行所有结果检测模块，返回全局结果容器
        # 获得 detection 功能列表
        detection_list = cuckoo.detection.plugins
        
        for module in detection_list:
            # 执行功能
            model_name,predict = self.process(module, results)
            if model_name and predict:
                results[model_name] = predict
        return results
  

__init__(): 初始化检测模型
process():
- 执行一个检测模块
- 初始化对应检测功能
- 如果在配置中禁用了检测模块，请跳过它
- 读取分析数据路径
- 加载预训练检测模型
- 特征工程
- 返回关键字，预测结果
run(): 执行所有检测模块，返回全局结果容器

3）检测模型列表

名称	类型	特征	算法模型
Malconv	静态分析	字节序列	Malconv卷积神经网络
String	静态分析	字符串序列	XGBoost集成学习模型
Apistats	动态分析	API调用序列	XGBoost集成学习模型

4.7.2 设计流程

1）模型检测模块时序图

%% 时序图例子,-> 直线，-->虚线，->>实线箭头 sequenceDiagram participant 沙箱主机 participant 任务目录 autonumber #opt is run %%rect rgb(121, 255, 121) 沙箱主机->任务目录: 启动机器学习模块沙箱主机->任务目录: 初始化检测模型 #rect rgb(135,206,250) 沙箱主机->>沙箱主机: 获得检测模型功能列表 loop 执行检测功能列表沙箱主机->>任务目录: 执行一个检测模块沙箱主机->>任务目录: 初始化对应处理功能任务目录-->>沙箱主机: 读取分析数据任务目录-->>沙箱主机: 加载预训练检测模型沙箱主机->>+任务目录: 特征工程任务目录-->>-沙箱主机: 返回关键字，对应预测结果 end 沙箱主机->>沙箱主机: 全局结果容器沙箱主机->任务目录: 机器学习模块结束 #end 沙箱主机->任务目录: .... #end

2）模型检测模块设计流程

启动机器学习模块
初始化检测模型
获得检测模型功能列表
执行一个检测模块
初始化对应检测功能
如果在配置中禁用了检测模块，请跳过它
读取分析数据路径
加载预训练检测模型
特征工程
返回关键字，对应预测结果
执行所有检测模块
保存到全局结果容器
机器学习模块结束

4.8 对抗攻击模块

对抗攻击模块在结果处理模块、家族签名模块处理之后，与机器学习模块同时进行，对抗攻击模块定义了生成恶意软件对抗样本的添加扰动方式和搜索策略算法。Bold-Falcon/modules/adversarial/目录中提供的所有处理模块，都属于对抗攻击模块。每个模块在 Bold-Falcon/conf/adversarial.conf中都应该有一个专门的配置选项。该模块生成恶意软件对抗样本保存在Bold-Falcon/storage/analysis/task_id/Adversarial/ 文件夹下。

4.8.1 对抗攻击功能列表

secml_malware :https://github.com/pralab/secml_malware

扰动方式（问题空间扰动）
- 文件末尾填充字节 Yuan et. al.
- 节区末空间中添加字节 Suciu et al.
- 填充DOS字段 Demetrio et al.
- 修改PE文件头部字节 Demetrio et al.
搜索策略
- FGSM (白盒)
- MAEGAN（黑盒）

**1) 对抗模型定义函数 **

from lib.cuckoo.common.exceptions import CuckooDetectionError

class Adversarial(object):
    """
    Base abstract class for Adversarial module.
    """
    def set_options(self, options):
        """ Set report options."""
    def set_path(self, analysis_path):
        """Set paths."""
    def set_task(self, task):
        """Add task information."""
    def get_adversarial(self, results):
        """
        Initialize the sample instance and load the dictionary need a class Instance 
        """
        
    def run(self):
        """ Start Adversarial"""
        raise NotImplementedError    
  

class MyAdversarial(Detection):
 		
    def load_features(self)
    	# 数据预处理
    def load_model(self):
      # 加载模型训练
    def run(self, Y)
    	# 预测目标值
      	return predict
  

extract_features()：数据预处理
fit()：模型训练
predict()：预测目标值

2）检测模型运行函数

class RunAdversarial(object):
	""" plugins.py """
       
    def __init__(self, task):
        # 初始化模型信息
        
    def process(self, module, results):
      	# 执行一个检测模块
        
    def run(self):
        # 执行所有结果检测模块，返回全局结果容器
        # 获得 detection 功能列表
        detection_list = cuckoo.detection.plugins
        
        for module in detection_list:
            # 执行功能
            model_name,predict = self.process(module, results)
            if model_name and predict:
                results[model_name] = predict
        return results
  

__init__(): 初始化检测模型
process():
- 执行一个检测模块
- 初始化对应检测功能
- 如果在配置中禁用了检测模块，请跳过它
- 读取分析数据路径
- 加载预训练检测模型
- 特征工程
- 返回关键字，预测结果
run(): 执行所有检测模块，返回全局结果容器

4.8.3 设计流程

secml_malware :https://github.com/pralab/secml_malware

1）对抗攻击模块时序图

%% 时序图例子,-> 直线，-->虚线，->>实线箭头 sequenceDiagram participant 沙箱主机 participant 任务目录 participant 模型服务器 autonumber #opt is run %%rect rgb(121, 255, 121) 沙箱主机->任务目录: 启动对抗攻击模块沙箱主机->任务目录: 初始化对抗攻击模型 #rect rgb(135,206,250) 沙箱主机->>沙箱主机: 获得对抗攻击功能列表模型服务器-->>沙箱主机: 加载检测模型（生成器模型） loop 执行对抗攻击功能列表沙箱主机->任务目录: 执行一个对抗模块（基于GAN的逃逸攻击）沙箱主机->任务目录: 初始化攻击扰动策略任务目录-->>沙箱主机: 读取样本数据任务目录-->>沙箱主机: 加载预训练检测模型（MalConv）沙箱主机->+任务目录: 特征工程任务目录-->>-沙箱主机: 返回关键字，对应预测结果沙箱主机->>沙箱主机: 生成对抗样本特征任务目录-->>沙箱主机: 加载预训练检测模型（MalConv）任务目录-->>沙箱主机: 返回关键字，对应预测结果沙箱主机->>沙箱主机: 对比预测结果沙箱主机-->>任务目录: 结果不同，保存对抗样本沙箱主机->>沙箱主机: 全局结果容器 end 任务目录-->>模型服务器: 返回成功的对抗样本模型服务器->>模型服务器: 添加对抗样本到数据集模型服务器->>模型服务器: 对抗训练沙箱主机->任务目录: 对抗攻击模块结束 #end 沙箱主机->任务目录: .... #en

4.9 报告生成模块

4.9.1 设计说明

在结果处理模块、家族签名模块、机器学习模块处理之后，报告生成模块定义了恶意软件分析报告生成的不同格式，将全局结果容器转化为json，将分析目录保存到非关系数据库 (MongoDB) 中。Bold-Falcon/modules/reporting/目录中提供的所有处理模块，都属于结果处理模块。每个模块在 Bold-Falcon/conf/reporting.conf中都应该有一个专门的配置选项，供用户选择结果处理功能。

1）Json报告模块

接收结果处理模块生成的全局容器，将其转换为Json并写入文件

from lib.cuckoo.common.abstracts import Report

class JsonDump(Report):

    def erase_calls(self, results):
        # 通过将调用替换为空列表，暂时从报表中删除
        
    def run(self, results)
        # 将report.json写入report文件夹
  

erase_calls(): 通过将调用替换为空列表，暂时从报表中删除
run(): 将report.json写入report文件夹

2) MongoDB存储函数

class MongoDB(Report):

    @classmethod
    def init_once(cls):
      	# 初始化mongo数据库

    def store_file(self, file_obj, filename=""):
        # 存储成 GridFS 文件格式.
 
    def run(self, results):
        # 创建词典的副本。这样做是为了不修改原始字典，并可能损害以下报告模块
        # 依次读取结果容器字段，并保存
        self.db.analysis.save(report)
  

init_once(): 初始化mongo数据库
store_file(): 储成 GridFS 文件格式
run():
- 创建词典的副本。这样做是为了不修改原始字典，并可能损害以下报告模块
- 依次读取结果容器字段，并保存

3）报告生成运行函数

class RunReporting(object):

    def __init__(self, task, results):
      	# 初始化任务、结果容器、任务目录
        
    def process(self, module):
       	# 执行一个生成功能模块
        # 初始化生成功能模块
        # 获得分析任务目录
    	  # 执行对应处理功能
        current.run(self.results)
    
    def run(self):
        #依次执行report模块jsondump,mongodb
        reporting_list = cuckoo.reporting.plugins
        
        for module in reporting_list:
            self.process(module)
  

4.9.2 设计流程

1）报告生成模块时序图

%% 时序图例子,-> 直线，-->虚线，->>实线箭头 sequenceDiagram participant 沙箱主机 participant 任务目录 participant 数据库 autonumber #opt is run %%rect rgb(121, 255, 121) 沙箱主机->任务目录: 启动报告生成模块沙箱主机->数据库: 初始化结果容器、任务目录 #rect rgb(135,206,250) 沙箱主机->>沙箱主机: 获得报告生成功能列表（jsondump,mongodb）沙箱主机->>任务目录: 执行一个jsondump生成功能沙箱主机->>任务目录: 初始化jsondump生成功能沙箱主机-->>任务目录: 通过将调用替换为空列表，暂时从报表中删除沙箱主机-->>任务目录: 将report.json写入report文件夹沙箱主机->>任务目录: 执行一个mongodb生成功能沙箱主机->>任务目录: 初始化mongodb生辰功能任务目录-->>沙箱主机: 创建结果容器的副本 loop 数据库存储沙箱主机-->>沙箱主机: 依次读取结果容器字段沙箱主机-->>数据库: 并保存到数据库 end 沙箱主机->任务目录: 报告生成模块结束 #end 沙箱主机->任务目录: .... #end

2）报告生成模块设计流程

启动报告生成模块
初始化任务、结果容器、任务目录
获得报告生成功能列表（jsondump,mongodb）
执行一个jsondump生成功能
初始化对应生成功能
通过将调用替换为空列表，暂时从报表中删除
将report.json写入report文件夹
执行一个mongodb生成功能
初始化对应生成功能
创建词典的副本
依次读取结果容器字段
保存到数据库
报告生成模块结束

4.10 用户交互模块

4.10.1 设计说明

1）前端框架Django

前端基于Python的Django框架开发，Django是一个开源的Web应用框架，采用MTV的框架模式：Model(模型), Template(模板), Views(视图)

模块	功能
Model	数据存取层，处理和数据相关的所有事物
Template	表现层，处理与表现相关的决定
Views	业务逻辑层，存取模型以及调取恰当的模板，是模板和模型之间的桥梁

Django框架

2）Django的一些特性：

特性	内容
URL设计	可以设计任意的URL，而且还支持使用正则表达式匹配
模板系统	提供可扩展的模板语言，并且模板之间具有继承性
Nginx	Nginx是一款轻量级的Web服务器，占用内存少，并发性强
WSGI	是一种为Python语言定义的Web服务器和Web应用程序或框架之间的通用的接口协议

3）WSGI的三级架构：

WSGI三级架构

4）项目配置说明

项目应用路径为Bold-Falcon/web,项目总体设置：Bold-Falcon/web/web/setting.py文件中，包含了整个应用的配置信息，包括数据库连接、静态资源和url的路径定义、中间件和cookie的配置、模板文件的配置等

mongo.connect()
DATABASES = {}
	#数据库连接
    
STATIC_URL = "/static/"
STATICFILES_DIRS = (
    ...#添加静态资源路径
)

SECURE_PROXY_SSL_HEADER = ("HTTP_X_FORWARDED_PROTO", "https")
	#配置https
    
SESSION_ENGINE = "django.contrib.sessions.backends.signed_cookies"
SESSION_COOKIE_HTTPONLY = True
	#配置cookie
    
STATICFILES_FINDERS = (
	...#finder函数用来寻找静态文件
)

MIDDLEWARE_CLASSES = (
	...#配置中间件
)

ROOT_URLCONF = "web.urls"
	#配置路由路径
    
TEMPLATES = [
	...#配置模板文件路径
]

WSGI_APPLICATION = "web.wsgi.application"
	#注册WSGI服务
    
INSTALLED_APPS = (
	...#注册应用
)
  

项目url配置：Bold-Falcon/web/web/urls.py文件中配置了视图类views绑定页面的url

urlpatterns = [
	...#自定义URL绑定视图函数
]

handler404 = web.errors.handler404
handler500 = web.errors.handler500
	#错误页面绑定自定义视图
  

数据库配置：前端数据库使用非关系型数据库MongoDB.数据库配置信息：lib/cuckoo/common/config.py

"mongodb": {
    "enabled": Boolean(False),
    "host": String("127.0.0.1"),
    "port": Int(27017),
    "db": String("cuckoo"),
    "store_memdump": Boolean(True),
    "paginate": Int(100),
    "username": String(),
    "password": String(),
},
  

在Django前端框架中配置并连接数据库：Bold-Falcon/web/web/setting.py

mongo.connect()
  

class Mongo(object):
    def init(self):
        #初始化
    def drop(self):
        #删除数据库表
    def close(self):
        #关闭数据库链接
    def connect(self):
        #连接数据库
  

API接口：获取数据库Analysis表的数据的API接口定义在Bold-Falcon/web/controllers/analysis/api.py

db = Database()
	#数据库连接
	
class AnalysisApi(object):

    def tasks_list(request, body):
        #获取任务列表
    def task_info(request, task_id):
        #获取指定任务信息
	def task_delete(request, task_id):
        #删除指定任务
    def task_screenshots(request, task_id, screenshot=None):
        #获取指定任务截图
    def tasks_stats(request, body):
        #返回任务状态
    def tasks_recent(request, body):
        #返回最近任务
    ...