自然语言处理

年双十一成交量4982亿元,全国快递企业共处理快件39亿件,这背后则是物流行业工作量的骤增。除了满负荷的长深高速公路,还有繁忙的快递小哥。无论是企业业务汇总,还是寄件信息填写,都少不了关键信息智能提取这一环节,这其中均采用了命名实体识别技术。
700自然语言处理自然语言处理
【1】论文研究深度学习中弱监督问题,发表在CCF-A会议Neurips2020,被引用次数50+,https://arxiv.org/abs/1906.00642 【2】我主要负责其中算法设计,代码实现,实验对比测试、论文撰写等方面。
990
人民陪审员管理系统,实现人民陪审员管理标准化,使得人民陪审员数据实现精准化,从而提高陪审员排期的工作效率。建立人民陪审员信息库,以随机参审等方式推进人民陪审员均衡参审,改善人民陪审员的广泛性和代表性不足的问题,推进司法民主、促进司法公正、提高司法公信力。 系统统一维护陪审员数据信息,摒弃了传统Excel手动维护陪审员信息的方式,系统通过批量到入维护更新的方式,极大提高了人员信息的维护成本。系统抽取陪审员通过系统随机抽取和人工指定两种方式来权衡抽取,有效根据案件的情况抽取陪审人员,陪审员通过小程序确认是否正常参与陪审,确认参审后,系统会在开庭前24小时通过短信提醒陪审人员按时参与陪审,提供了短信提醒功能。 系统通过记录陪审次数、拒绝次数,分析陪审员的可参审次数,自动预警提醒规避。
1140Java自然语言处理
用transformer的机器翻译,进行中文到英文的翻译,使用的是cmn-eng这个小型数据集,用transformer让模型自由学习写诗,用transformer共享encoder,decoder词嵌入,实现对联模型,对于编码器原序列,用遮挡填充的掩码,这样编码器的输出中序列中的每个token的表示就变成了整个序列token表示的加权和形式,解码器自注意力用因果掩码,让目标输入序列注意到自己已经有的token序列,之后用自注意力后的输出做query,编码器的输出做key,value,因为编码器的输出中每个token时间步都是整个序列的混合信息,所以解码器跨注意力时,解码器的输出就包含了源序列整个序列的上下文信息,以此来预测下一个token
1060人工智能
主要解决执行法官登记材料管理困难的问题,可以通过系统统筹管理,执行案款到期预警提醒等功能。通过线上线下结合的模式,解决执行局材料收转问题。同时每份文件都可以进行电子扫描登记,并存入中间库管理。 负责整体的流程设计、功能搭建、原型设计
810Java自然语言处理
用于提升孩子英文阅读和口语的免费播放器。 - 1000本英文原版书, 与美国青少年同步课外阅读 - 不仅是看书,还能随时随地练听说,把贴身外教请回家 - 国际领先的A-Z分级阅读法,9-14岁孩子都能找到自己喜欢的 - 在线老师指导,让孩子科学阅读,养成好的阅读习惯
1120PHP自然语言处理
N4-乙酰半胱氨酸(AC4C)RNA是一个具有挑战性的数据集,因为它很难观察AC4C的过程,并且其类别极不平衡。而且高度封装的集成模型可能无法很好地用于该数据集。AC4C现有的最佳模型可能无法实现研究中更精确的预测,并且模型的大小使应用受到在线服务器形式的限制。为了解决这个问题,我们提出了ResVariant结构,并使用带这该结构的自编码器(AE)进行训练和应用,我们称这个模型为AEResVar。本文提出的AEResVar模型由编码器和解码器组成。该模型的特殊性在于解码器中的ResVarant层,它通过添加完全连接的隧道来增强解码能力。另一个特殊点是解码器使用编码器Dense输出作为输入,由于对解码器中激活函数的反向分析,这使得其包含更多的边缘信息。 我独自完成了该项目周期在三周左右。项目链接见:https://www.kaggle.com/code/spike8086/improving-representational-ability-in-ac4c
600
项目简介: 此平台致力于为垂直领域行业各场景下的智能对话业务提供通用性技术解决方案。具体场景包括智能培训机器 人、营销线索机器人、智能客服等。平台其构建过程主要包括:建立模型训练语料库、构建故事线与意图数据知识图谱、模型核心能力研发(NLU与 DM 核心算法)、后台运维管理系统与CUI 能力(ASR与 TTS )构建。 技术关键词: Rasa、知识图谱、实体识别、NLP、NLU、意图识别、词槽技术、seq2seq、LSTM、CRF、CUI能力。 项目业绩: 1. 产品方案材料编写、技术可行性探索与预研; 2. 项目技术选型与框架搭建; 3. 模型语料库数据清洗与知识图谱构建,语言模型训练、运维管理系统研发以及CUI能力接入。 产品能力: 1. 高度定制化的对话体验:通过构建故事线与意图数据知识图谱,平台能够提供高度个性化的对话管理,确保与用户的交互更加自然和流畅; 2. 精准的意图识别和实体抽取:利用先进的NLP和NLU技术,如实体识别、意图识别和词槽技术,平台能够准确理解用户的查询意图和上下文信息,从而提供更准确的服务; 3. 强大的自然语言处理能力:集成了seq2seq、LSTM和
850Java大模型
1.基于大语言模型(LLM)的AI应用开发,帮助图书馆接入AI大模型,完成图书馆书籍信息的智能检索管理; 2.使用开源大模型配合dspy完成agent设计,RAG加向量数据库建立图书馆的私有知识库; 3.助手具备知识库信息检索,上网搜索及工具调用的自定义工作流能力;
780python
【1】用百川、千问等国内优秀大语言模型测试特定领域知识问答效果,并引入检索增强提升问答准确率 【2】针对特定领域结合传统小模型完成文件拆解、分类等需求,分类准确率高达92%+。
740大模型
1.【60%】项目分为哪些功能模块,对使用者来说能实现哪些功能 2.【40%】我负责哪些任务,使用了什么技术栈,最终达到了什么成果 3.【选填】有哪些难点,怎么解决的
1450自然语言处理
【项目描述】12345热线及政府网站等有大量的市民投诉,无法精准分类和定位热点事件,给决策层造成困扰。基于此,借助大模型及深度学习算法,对投诉内容进行分类和内容识别摘要 【责任描述】项目开发主力人员。负责项目的功能设计讨论及实现。 【主要模块】 1.大模型管理:管理开源的大模型的基础信息,如:请求地址,请求参数等 2.规则管理:主要从往期热点事件中提取规则,用于匹配持续热点事件 3.热点事件聚类:将每天的投诉内容进行聚类,统计数据量达到阈值的事件 4.报告管理:主要生成每天的热点事件日报、周报、月报等
910pythonAI
1.通过超宽带雷达技术扫描人体胸腔起伏做呼吸,心率检测 2.通过对患者睡眠质量数据分析做统计 3.通过对意外发生危险时间段做数据分析统计 4.针对对监测患者异常情况进行唤醒并做报警机制 5.针对慢性病对产品市场前景居家医疗的落地做分析计算商业价值
1320pythonBI商业智能
通过对接ChatGPT服务,使国内用户可以用上OpenAId的ChatGPT4.0和DALL-E服务 用户需要在平台注册用户,并通过充值的方式来预存一定的费用,用于openai生成对话和图片等
890JavaJava
将主流大模型通义千问和通义万象接入微信用户,达到AI聊天和AI绘图的效果。该项目也支持其他模型,同时能在群聊中进行问答和回复。
1050
语义检索系统产品系统
基于语义的检索系统主要分召回阶段和排序阶段,召回阶段要训练语义模型,之后构建索引库评估召回1,召回5,召回10等等,之后要用语义模型提取每个文本的语义向量,之后构建milvus索引库,写service,rpc,配置,之后启动服务,测试模型提取向量效果,查询milvus库召回效果,排序阶段首先要用单塔或双塔模式训练个排序打分模型,之后对测试集排序,之后也一样,写排序service,rpc,配置排序参数,之后启动排序service,之后写个总的运行程序,先去访问召回service,获取召回topk结果,之后把结果传给排序service,让排序service打分,最后整个系统完成
830机器学习/深度学习
将上万条数据进行清洗和处理成适合模型的训练数据集,对BLOOMZ模型使用数据集进行多次微调训练,主要包括模型的隐藏功能训练和还原功能训练两部分,训练完成后继续对模型无法正常读取换行内容、无法对特定内容进行隐藏等功能不足的地方进行调试。 调试完毕的模型能够对用户需要输出到公共平台的内容进行隐私实体替换和还原,可以有效提升需出域数据的安全性。
1240机器学习/深度学习
项目分为:旅游知识图谱构建模块、路径规划模块、对话机器人模块,对使用者来说实现了一部手机游北京的功能 我负责关键部分的NLP、知识图谱算法的解决,最终达到了信息的准确度提升30%,系统运行流畅度提升50%。 难点:非结构化-半结构化-结构化数据的对齐、领域大模型的训练、层次化本体构建、实例层建模、结构化数据的抽取
1030知识图谱
1. 项目收集评论数据训练AI模型,可生成优、中、坏三个等级的评价系统,分析用户对于商品的评价体系。 2. 负责数据的收集和整理,模型的搭建、训练以及调参,生成参数模型。
1000python自然语言处理
通过私有化部署AI模型通义千问,将AI与JIRA打通,使用AI来预处理jira ticket,释放出更多的生产力,为用户带来更好的云上体验 通过AI预处理工单后,人工投入大大降低了35%,并且给用户带来了高效的服务响应体验,特别是新上云的用户,体验最佳,并不断探索通过agent来完成自动化运维工作
1610pythonLLM (大语言模型)
当前共272个项目
×
寻找源码
源码描述
联系方式
提交