全网唯一标准王
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210184821.X (22)申请日 2022.02.28 (71)申请人 南京众智维信息科技有限公司 地址 211300 江苏省南京市高淳区龙井路3 号 (72)发明人 车洵 孙捷 胡牧 梁小川  刘志顺 金奎  (74)专利代理 机构 南京知识律师事务所 32 207 代理人 张苏沛 (51)Int.Cl. G06F 16/36(2019.01) G06F 40/30(2020.01) G06N 3/04(2006.01) (54)发明名称 网络安全应急响应知识图谱的关系提取方 法 (57)摘要 本发明公开了网络安全应急响应知识图谱 的关系提取方法, 包括: 给定网络安全响应知识 文本; 将知识文本数据进行向量化, 提取出网络 安全响应知识文本中的词汇, 并将词汇均映射到 一个K维的词汇向量; 提取词汇向量对应的位置 向量, 将当前单词实体 与实体 之间的相对距 离转换为矢量表示; 采用残差分段卷积神经网络 JRpcnn来提取句子的语义特征, 形成特征向量, 将词汇向量和与词汇向量对应的位置向量作为 输入残差分段卷积神经网络JRpcnn; 采用多实例 注意力机制MIT对特征向量做进一步处理, 得到 实体关系, 本方案具有有效减少噪声数据对远程 监督的影 响, 更加精确地 从网络安全应急响应文 本中提取实体关系的特点。 权利要求书3页 说明书8页 附图3页 CN 114254130 A 2022.03.29 CN 114254130 A 1.网络安全应急响应知识图谱的关系提取 方法, 其特 征在于, 包括以下步骤: S1: 给定一个网络安全响应知识文本; S2: 将知识文本数据进行向量化, 即提取出网络安全响应知识文本 中的词汇, 并将词 汇 均映射到一个K维的词汇向量; S3: 采用位置矢量映射表示方法来提取词汇向量对应的位置向量, 即将当前单词实体 与实体 之间的相对距离, 通过嵌入转换为矢量表示; S4: 采用残差分段卷积神经网络JRpcnn来提取句子的语义特征, 形成特征向量, 即将步 骤S2和S3中得到的词汇向量和与词汇向量对应的位置向量作为残差分段卷积神经网络 JRpcnn的输入; S5: 采用多实例注意力机制MIT对步骤S4中得出的特征向量做进一步处理, 并得到实体 关系。 2.根据权利要求1所述的网络安全应急响应知识图谱的关系提取方法, 其特征在于, 步 骤S2: 将知识文本数据进 行向量化, 即提取出网络安全响应知识文本中的词汇, 并将词汇均 映射到一个K维的词汇向量包括以下步骤: S201: 输入原始的网络安全应急响应知识文本, 每个输入单词标记通过查找预先训练 的单词嵌入转换为 一个向量; S202: 对于给定的句子 由n个单词组成, 使用word2vec模型将每个 单词映射到一个低维实值向量空间, word2v ec输入的是该词的One ‑Hot编码, 然后经过神经 网络的隐藏层得到 输出; S203: 然后对该句子执行字向量处理, 最后得到句子中每个单词的向量表示, 形成一个 单词向量查询矩阵 , 每个输入训练序列通过词向量查询矩阵 映射得到相应的词汇 向量 。 3.根据权利要求2所述的网络安全应急响应知识图谱的关系提取方法, 其特征在于, 步 骤S3: 采用位置矢量映射表示方法来提取词汇向量对应的位置向量, 即将当前单词实体与 实体之间的相对距离, 通过嵌入转换为矢量表示包括以下步骤: S301: 用pf定义为从当前单词到实体 和实体 的相对距离的组合, 随机初始化两个 位置嵌入矩阵 和 , 通过查找位置嵌入矩阵, 将相对距离转换为词汇向量; S302: 在句子位置矢量化中, 若词汇向量维数为 , 位置向量维数为 , 则句子向量维 数为 , 词汇向量和位置向量组合构成了句子向量 ,随后将句子向量 Q反馈到卷积部分。 4.根据权利要求3所述的网络安全应急响应知识图谱的关系提取方法, 其特征在于, 步 骤S4: 采用残差分段卷积神经网络JRpcnn来提取句子的语义特征, 形成特征向量, 即将步骤 S2和S3中得到的词汇向量和与词汇向量对应的位置向量作为残差分段卷积神经网络 JRpcnn的输入, 包括以下步骤: S401: 采用残差分段卷积神经网络JRpcnn提取网络安全应急响应知识文本的语义信 息, 其中两个卷积层构成一个残差块, 同时在每一个卷积层之后均采用一个激活函数Relu权 利 要 求 书 1/3 页 2 CN 114254130 A 2用于非线性映射; S402: 卷积是卷积核W和输入向量q序列之间的运算, 其中卷积核W是一个权重矩阵, 将 卷积核W作为卷积的滤波器, 卷积运 算可以表示 为: 其中i和j表示 的行和列,n是卷积核的个数,s是句子向量的维数,w是卷积核的维 数,  表示 到 的连接; 一次卷积的结果得到一个矩阵: 。 5.根据权利要求4所述的网络安全应急响应知识图谱的关系提取方法, 其特征在于, 还 包括以下步骤: S403: 残差分段卷积神经网络中所有卷积核 的维数均为w, 并采用边界填充操作, 两层 卷积的卷积核是 , 由步骤S401知残差块的第一层卷积后得到的结果为 , 第二层卷积后得到的结果是 , 其中 , 是偏移矢量, 残差卷积块的输出向量为C=f (x)+x,其中f(x)是第二个卷积层的输出 结果, x为第一个卷积层的输入; S404: 在卷积层获取语义特征后, 通过池化层进一步提取最具代表性的局部特征, 并采 用分段最大池过程, 公式为: 对于每个池化层卷积核的输出, 我们可以得到一个3维向量 , 然后拼接所有卷积核分段池化层输出为 , 再经过非线性 函数输出为: 其中 为 到 的连接, tanh()函数为神经网络中的激活函数。 6.根据权利要求5所述的网络安全应急响应知识图谱的关系提取方法, 其特征在于: 步 骤S5: 采用多实例注 意力机制MIT对步骤S4中得出的特征向量做进一步处理, 并得到实体关 系包括以下步骤: S501: 对于 一个实例集向量 , 该实例集向量描述了 一个与之相 对应的网络安全应急响应实体对 , 其中 代表了神经网络的输出; S502: 计算实例向量 与关联度  r 之间的关联度, 并计算实例集向量S, 实例集向量S 的计算公式为:权 利 要 求 书 2/3 页 3 CN 114254130 A 3

.PDF文档 专利 网络安全应急响应知识图谱的关系提取方法

文档预览
中文文档 15 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共15页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 网络安全应急响应知识图谱的关系提取方法 第 1 页 专利 网络安全应急响应知识图谱的关系提取方法 第 2 页 专利 网络安全应急响应知识图谱的关系提取方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 09:00:00上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。