基于关系标签语义与全局特征融合的专利实体关系抽取

2025-05-16 50 1.27M 0

  专利文本长度较长且关系重叠严重,传统的关系抽取模型中将关系视作离散的标签且只关注文本的局部特征,未充分利用其中的潜在信息,影响复杂的专利文本的抽取性能。针对以上问题,本文在OneRel模型的基础上提出了一种基于关系标签语义与全局特征融合的填表式实体关系抽取模型SRL-GFI(Semantics of Relation Labels and Global Feature Integration)。SRL-GFI模型使用BERT预训练模型获取关系标签的语义信息,并与表格标记方式相结合得到关系-标记联合编码,使之与分词对的编码进行匹配得出相应的相关性分数,再通过全局信息融合模块将模型中间结果反馈回去并迭代,以融合其中的全局特征,从而进行实体关系抽取。多个数据集上的对比实验都显示了新模型性能的提升,其中在专利实体抽取数据集PERD和TFH2020上,F1值分别达到79.8%和55.9%,相比OneRel提升了5.0百分点和1.8百分点。本文提出的SRL-GFI模型有效利用了关系标签中的语义信息,以及文本中的全局信息和关系三元组中的内在联系,可以很好地应用于对专利领域的复杂文本的实体关系抽取。



您还没有登录,请登录后查看详情



 
举报收藏 0打赏 0评论 0
本类推荐
下载排行
网站首页  |  关于我们  |  联系方式  |  用户协议  |  隐私政策  |  版权声明  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  蜀ICP备2024057410号-1