基于国家低碳课题的低碳项目数据库开发项目

我要开发同款
数码小爱2022年12月26日
221阅读
所属分类人工智能

作品详情

接口开发工作:由于数据库中的数据格式对人的观感并不友好,需要有一个txt和excel文件互换的功能来实现内嵌的文件转换,另外,将excel上传到数据库时对数据有一个规范化检测(比如列名是否存在,个别必空字段、必填字段、字段长度限制,时间格式规范是否合法)并给出具体规范修改反馈,通过Tkinter实现了内库数据导入导出外接工具的开发;
 语义推荐工作:低碳技术数据库建设需要相似技术推荐,复现了两种方法实现下游相似度计算任务。第一种方法是基于spacy和word2vec,先提取文档中的动词、名词和形容词,并将词语变形归一作为文档的文本信息,再借助glove向量提取文本向量特征,最后计算文本相似度。另一种方法先做了数据预处理,通过KeyBERT提取数据摘要,喂入Bert模型中的malteos/scincl预训练模型实现相似度计算。两种方法的输出效果超过关键词检索,得到业务认可。
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论