点击空白处退出提示
知识图谱平台
我要开发同款作品详情
有专家在系统中定义好实体、属性、关系。结构化数据(指标)由其他数据库任务或定时抽取到数据集中。非结构化数据由文控云的归档库,每天将增量更新的文档消息推送到知识图谱平台文档库中,将Word、PDF、TXT格式的文档内容抽取到数据集中。针对非结构化数据,首先通过NLP算法分词,文本量化后,经过实体识别算法模型和关系抽取算法模型将文本内容中的实体和实体间的关系标注出来。专家对于标注后的信息进行人工审核,审核通过后入结果集库。结构化数据经过分类算法、 D2R转换后,入库结果集。
进行初步的知识表示后,从全局的角度出发,把相关的领域知识融合在一起,做到实体消歧,实体对齐,将多个知识库中的知识进行整合,形成一个知识库的过程,在这个过程中,主要需要解决的问题就是实体对齐。不同的知识库,收集知识的侧重点不同,对于同一个实体,有知识库的可能侧重于其本身某个方面的描述,有的知识库可能侧重于描述实体与其它实体的关系,知识融合的目的就是将不同知识库对实体的描述进行整合,从而获得实体的完整描述。针对行业术语、行业数据都采用自顶向下的方式来建设知识图谱,确定知识图谱的数据模型,根据数据模型约定的框架,再补充数据,完成知识图谱的建设形成标准知识表示,对最后的结果数据进行评估,将合格的数据放入知识图谱中,不合格的数据进行数据模型修正,最终形成图谱存储在Neo4j图数据库中,通过Cypher语句查询知识,更新知识。
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态
评论