负责实体识别之后的术语标准化模型构建工作,数据量在8万左右。 尝试了bert等主流模型,发现在当前数据集中,编辑距离+bert+FNText。通过django 负责智能问诊系统的模型构建工作。 任务目的是从几百个候选问题中选出最有意义的一个询问用户。采用的是改良信息熵方案。通过django + docker提供服务接口。
评论