CCKS2020基于本体的金融知识图谱自动化构建技术评测第五名

我要开发同款
proginn20085419902024年02月08日
97阅读
开发技术torch、自然语言处理、深度学习、python
所属分类远程监督、关系抽取
授权协议GPL许可

作品详情

整体结构可以分为实体识别和关系/属性抽取两部分,流程可以分为6步,其中2、3和4步会重复执行多次。

第1步:通过Hanlp和规则匹配的方式抽取部分实体
第2步:采用远程监督方法,用种子知识图谱对齐无标数据得到标出了实体的数据
第3步:用上一步得到的标出了实体的数据训练模型
第4步:用上一步训练的实体识别模型抽取无标数据中的实体,并将抽取出的实体加入到种子知识图谱中,增加种子知识图谱的规模,重复2,3,4步多次不断使种子知识图谱规则不断扩大
第5步:通过重复2,3,4步多次后得到扩展了大量实体的知识图谱,用种子知识图谱对齐无标数据,将无标数据中的实体都找出来
第6步:通过上一步得到无标数据中的实体后,使用规则的方法判断实体间的关系和属性
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论