二进制代码相似性检测的目的是在无法访问源代码的情况下检测相似的二进制函数,是计算机安全领域的一项重要任务。传统方法通常使用图匹配算法,速度慢...
C/C++漏洞检测数据集汇总
漏洞检测这个方向最近几年尤为热门,尤其是与深度学习技术相结合的研究,同时一些公开可用的数据集的出现也进一步推动了这些技术的发展。本篇文章总结...
关于 Embedding 的个人粗略见解
首先举一个简单的例子:我爱吃饭。 如何将 “我爱吃饭” 这句话转化为可供神经网络输入的数值向量呢? 最传统的方法就是通过 one-hot 编...
DeepDFA: 受控制流分析驱动的有效深度漏洞检测
目前基于深度学习的漏洞检测中性能最高的方法使用的是基于 token 的 transformer 模型,这对于捕捉漏洞检测所需的代码语义来说并...
特征向量可视化方法介绍
在最近的研究中,实验需要结合可视化进行解释分析,于是大致上了解了下目前一些特征可视化的工具,主要分为四种类型:热力图、散点图、线性图和雷达图...
深度学习可解释性方法的一些概念
理解和解释深度学习模型的决策过程和原理。 1 特征可视化 通过可视化神经网络的中间层来理解模型是如何识别和处理输入的,比如卷积核可视化是一种...
利用SHAP算法解释BERT模型的输出
1 何为SHAP? 传统的 feature importance 只告诉哪个特征重要,但并不清楚该特征如何影响预测结果。SHAP 算法的最大...
软件生态安全自主可控指标体系
1 研究背景 随着信息技术的飞速发展,软件已经渗透到社会生活的各个角落,成为支撑现代社会运转的关键基础设施。然而,软件生态的复杂性和多样性也...
LineVul实验复现及相关问题
最近在复现 LineVul 这篇文章的实验,本文主要用于简化文章复现流程和记录复现过程中出现的问题。 1 安装依赖环境 pip instal...
LineVul: 基于Transformer的行号级漏洞预测
文中提出一种基于Transformer的行号级漏洞预测方法 LineVul,以解决最先进的 IVDetect 方法的若干局限性。该方法通过对...