给出cve描述的简单包试图使用nlp从中提取有用的语义。
cve-analyzer的Python项目详细描述
CVE分析仪
本项目旨在从一组以通用英语表达的漏洞报告中提取各种语义信息。 这些语义信息使用描述中的名称实体识别(ner)进行编码和检索,目前可用的标签如下:
- 函数:易受攻击的函数名。
- version:目标程序的易受攻击版本。
- sourcece:包含易受攻击函数的源代码的路径。
- driver:攻击者需要与之交互才能触发攻击的驱动程序。
- struct:包含错误的格式错误的结构。
- 漏洞:漏洞的类型(例如缓冲区溢出等)。
- capability:攻击者成功利用此漏洞(例如远程代码执行等)后获得的功能。
数据集
开发和测试项目初始状态的数据集是关于2017年和2018年Linux内核的常见漏洞暴露(CVE)列表(首次实现)。数据集可以在网站上找到CVE detail
数据集的格式为逗号分隔值(CSV),但它已从原始版本中简化,只考虑了描述字段。
安装
使用以下命令安装项目及其所有依赖项:
pip install cve_analyzer