数据分析支撑系统

我要开发同款
EmiyaSaber2023年09月20日
140阅读
所属分类IT人工智能

作品详情

一. 项目功能模块:
1. 文本分析
(一)投诉内容中文分词
中文分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。
分词是文本分析的基础,如在分相似工单的时候,就需要用到投诉内容相似度分析的算法,而文本相似度算法首先就需要分词的支持,将用户投诉文本分词后形成词袋模型,再通过类似TFIDF文本相似度算法来分析哪些热线投诉是相似工单,这样就可以辅助业务人员在处置工单的时候可以参考以往相似工单,有针对性的下发派遣。
(二)投诉内容关键词提取
如何准确、高效地对热线投诉的内容进行检索,是目前的研究热点。对于文本的分析,一般会先从关键词入手,热线投诉的关键词不但可以概括文章的主题,还能反映整篇文章所表达的主要内容与情感倾向。因此,高效、准确地获取关键词,对于文本分类、自动摘要和文本检索至关重要。
(三)投诉内容实体识别
实体识别是指将预先定义好的实体类型(人名,机构,地名等)识别出来,如识别文本中的人名、手机号、车牌号、身份证、地名、机构名、时间、其他专有名字。
实体识别主要用于热线工单的填报辅助分析,通过识别分析投诉工单,自动将工单中的投诉事件,投诉人名称,投诉地点,投诉关键信息摘录出来,帮助业务人员填报相关信息。
(四)投诉内容自动摘要
投诉内容摘要是指用户投诉信息的主题范围及内容梗概的简明摘要,相当于简介。在有限的字数内向管理者提供尽可能多的定性或定量的信息,充分反映该研究的创新之处。本次项目中文章自动摘要主要针对于字数较多、阅读时间比较长的投诉信息,根据投诉的字数提取出符合文章主题的摘要信息。
2. 地址辅助解析
在投诉工单的派单中会涉及到地址解析和地址定位问题,比如案件描述中有“秀文路靠近七莘路向东200米的商店”,需要能解析出“秀文路536号莘庄华玲商店”这个地址。然而,这里的店面有很多家店面都是一个门牌号码,但是商店只有一家为“秀文路536号莘庄华玲商店”,所以,这家商店需排在智能推荐的第一的,方便管理者准确及时定位。将各类历史地址描述文本进行词性标注和实体标注后进行模型训练,定期获取新的训练集数据对模型进行优化。
将训练后的模型应用到实际的语义分析中,进行分词和地名实体的提取,对有问题的结果进行记录后定期反馈模型重新训练。
主要用于接入智能派单系统,用户也可以通过NLP模块的文本解析查询。
3. 评价指标体系管理
针对绩效考核报告与数据分析报告,提供标准化的指标管理功能,根据不同的业务分类,可以搭建用于不同考核内容,不同分析内容的指标分类。包含上报数,受理数,核实数,派遣数,应处置数,处置数,按期处置数,超期处置数,超期未处置数,应核查数,核查数,结案数,应结案数,按期结案数,超期结案数,缓办数,督办数,返工数,挂账数等。在不同的分类下围绕考核与分析的数据与统计模型,建立原子指标、派生指标和复合指标。
支持指标体系导出EXCEL,支持用户对指标进行增删改查操作,支持指标上下线操作。
4. 预警管理
自动指标预警是指对现象城市运行过程进行监测,并据此对可能出现的总体失衡、结构性矛盾、突发异常情况作出预报的指标,不限于一人多诉、集中投诉、反弹回潮、强反强延、结案存疑、不合理退单等自动预警推送。
预警指标配置
根据业务场景需求,配置预警模型进行提醒。根据配置的预警阈值,支持对接不同类型的业务数据库,
预警任务管理
配置预警的任务计算触发时间,允许查看历史预警结果。
二. 技术栈
项目基于Nacos使用了微服务的架构模式,使用了Spring、Spring MVC、SpringBoot、SpringCloud Alibaba、MyBatis、Oracle、Mysql、Redis、ElasticSearch
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论