任务详情
1.收集相关信息或数据(1)进行充分需求分析,明确系统应具备的功能,收集整理相关文献资料;对系统设计与实施的成本进行合理分析,对影响系统或工程实施的经济、法律、环境等因素进行分析。(2)从互联网爬取相关文本数据,包括漏洞报告、攻击事件描述、黑客论坛帖子等,收集2000篇并标注至少1000篇网络威胁情报相关的文本数据,作为系统开发的试验数据;2.技术要求(1)在本体指导下,通过关系抽取技术从爬取的文本数据中提取出与安全情报有关的信息,构建知识图谱,知识图谱节点数量(实体)大于10万个,关系数量超过100万条;(2)建立网络威胁情报的知识图谱,包括威胁漏洞、攻击方式、攻击者信息等实体及其关联;(3)设计和实现网络威胁情报的分析算法和可视化方法,包括图谱展示和关联关系分析等功能。3.非技术要求(1)考虑系统的工程成本,对系统或工程的约束因素,如工程应用环境下人工标注质量或模型训练算力等因素进行初步分析;(2)在毕业设计说明书中制图和制表符合工程规范性要求;(3)程序代码命名统一和规范,说明文档书写规范。4.所需条件(1)熟悉软件工程中软件开发流程、开发方法和理念;(2)熟悉自然语言处理的基本理论和方法;(3)熟悉爬虫的设计方法;(4)掌握类似Neo4J的图数据库管理技术。