自然语言处理

1. 该系统主要有语音clone,语音合成,语音识别,数字人等模块。主要用于合成不同声音,文本用于不同场景中,比如数字人播报,教育,医疗等 2. 主要负责,整体架构搭建,语音clone训练,核心api接口开发 3. 与多个不同行业的公司签署相关合作合同
2430JavaLLM
使用CLIP预训练模型进行跨模态检索,Flask框架搭建web服务,可对检索数据库进行管理、留言,并对模型进行微调,实现跨模态数据检索。
540python人工智能
算法实现基于文本内容的自动匹配: 1、数据预处理,微调中文文本向量化模型和语义分割模型,实现将文本内容转化为向量; 2、构建相似向量库; 3、分析数据特征,构造匹配算法。
700机器学习/深度学习
【业务模块】 整体金融大模型行业调研报告项目主要分为三个部分,其中第一部分主要是待调研公司核心数据的 配置模块,主要包括三个类别下的数据信息,即:所属行业,推荐指标类别和核心指标类别等。第二 部分主要是对待调研公司的各类指标进行行业咨询内容的采集。第三部分是对于采集的信息做核心信 息抽取,完成整体摘要信息的生成。 【负责业务】 主要负责整体业务架构的算法架构设计,实现基于金融搜索大模型的信息采集和基于金融推理大模型的 调研报告生成。主要涉及到搜索大模型的应用,大模型微调和基于大模型的摘要生成等业务内容。 【效果】 整体完成了业务目标,实现了全自动的行业信息采集和摘要生成,极大地提高了行业调研报告生成的效率。
3930python大模型
一)研究目的 本项目实现一款基于wechaty的多功能服务机器人,制作一个校园官方的“朋友圈”,学生可以通过微信平台,以自然语言对话的方式简便快速地完成校内日常事务及活动发布推广;也可以通过与智能机器人对话方式获取如图像处理等趣味功能,丰富校园生活并且提升学校形象。 (二)研究内容 大学生在校园中常常有丢失物品的情况,通常会通过校园墙等渠道大海捞针式的寻找,耗时费力。如果能够借助wechaty,拾到失物者通过向微信服务机器人发送失物照片,借助AI技术对失物进行识别,即可快速匹配联系到失主。 学校管理中有大量的规章制度.例如学生竞赛、项目报销、最新防疫政策、毕业设计相关流程和要求等。师生们通常遇到问题是不知道去哪里查找对应的政策,甚至不知道该找谁询问,导致在流程上耗费了大量的时间和精力。如果能够有一个智能且友好的接入服务,针对提出的疑问自动答复,将会有力提高校园运转效率。 互联网时代传统学校招生方式也越来越不受年轻人喜欢。如何提供一种更有亲和力,更有趣的方式吸引年轻人的注意,介绍并且推广学校是一个非常需要考虑的问题。通过微信接口,可以给大众以问答的形式,实时回答各种关于至诚学院的问题
1080pythonpython
TrendFlow 是一款强大的 web app 工具,它具备一项令人惊叹的功能。用户只需输入关键词,TrendFlow 便会迅速在各大论文平台上展开搜索,犹如一位敏锐的研究员,精确地筛选出与之相关的论文。然而,它的能力并非仅仅止于搜索,TrendFlow 还会对这些论文进行深入总结,提取出关键信息,就像是一位智慧的学者,将复杂的知识转化为简洁明了的精华。有了 TrendFlow,用户可以轻松获取所需论文的核心要点,大大提高了研究效率。
560python
这是一个简历文件解析的平台,我在里面负责开发“解析文件解析”功能,负责简历解析器的日常维护,修复疑难简历的解析问题。 也参与部分开发其它功能,如职位管理、快搜、上传简历、人才库等等。 个人在里面碰到的技术难点有: 简历文件很多,却要求快速、高并发的解析效果。 每人的简历格式不同,不少个性化的简历写法,尤其设计师以图片作品为主的简历,但要求精准解析出简历的所有内容,如姓名等基本信息、工作经历、教育经历等。 采用大量正则表达式来匹配内容,并需要训练大量的基础数据来匹配内容,如公司名、学校名、项目名等。
690python人力资源管理
使用flask实现的web应用,对文章进行分词(jieba),生成按级分词结果。可按词表实现不同等级的分词处理,有匹配分析、过滤分析等不同功能。
590python个人助理软件
PEER: AI Tutor开源项目
PEER是一个由德国慕尼黑工业大学开发的教育项目,旨在利用LLM(大语言模型)等最先进的NLP(自然语言处理)技术,帮助德国中小学生改进和优化他们的论文。
620python自然语言处理
使用olllama加载本机模型,创建建modelfile对模型进行提示词构建,使用ngrok对ollama服务器进行反向代理进行公网访问
830人工智能
这是一个类似foxmail之类的邮件管理工具,但它是在服务器运行,并同时支持大量邮箱的。 我个人在里面负责所有的后端功能。 功能需求: - 像foxmail之类的邮件管理工具那样添加邮箱信息,并读取邮箱里面的邮件和下载附件。 - 需要大批量读取邮件,并定时轮询各邮箱。 - 将读取到的简历文件,解析出来,再将解析结果通知给各客户的接口。 - 需要保证系统的高可用、出错重试、调用日志查询、及时读取各邮箱等。 - 需要支持几乎所有邮箱类型。 - 需要支持目前的3种邮箱读取协议:IMAP、POP3、EXCHANGE。
1010python
现有的抄清摘要抽取算法主要基于用户主观意识的文字生成,带有主观偏见,但是抄清工作赋能的目标是尽可能少的利用原文获取更多信息,保存更多的信息。 本项目将基于自然语言处理技术对抄清数据进行分析,快速挖掘出重要信息,并通过结构化形式展示出来。方便其他人员的信息的快速阅识。主要包括如下三步任务: 1、将诸如PDF、图片等格式抄清信息通过特定算法识别出来转为纯文本信息; 2、利用训练的算法先对文本信息进行分类处理,再基于不同类别训练的算法模型从完整的抄清信息中快速挖掘出重要信息; 3、通过直观的结构化形式展示出来。 2、拟解决的关键问题 1、将抄清信息从不同格式文件中提取出来 抄清信息储存的格式丰富多样,包括PDF、TXT、图片、DOC、EXCEL等,将抄清信息从这些不同格式中抽取出来是下游任务进行的关键,本项目将用诸如pdfplumber、PaddleOCR等python库并结合规则算法将文本信息从上述格式中抽取出来。 2、筛选任务目标需要的模型 针对本项目,从文本基础预处理出发到抄清重要信息任务展示,选取大量的领域较优模型进行对比分析,筛选适合本任务的算法模型进行后续的优化研究。
1480人工智能
1.后台管理系统开发,实现了客户对设备的全部设置、管理等功能。并在运维端可对客户的后台系统进行管理等功能。 2.公司之有我一个前端开发人员,前端的所有开发均由我一人开发。
620操作系统工具
AI作品的特点主要表现在以下几个方面: 高效性:AI作品能够快速地生成和处理大量数据,大大提升了创作效率。例如,在绘画和摄影领域,AI可以通过机器学习和深度学习算法,模仿和学习人类艺术家的创作风格和技术,自动生成图像或修复图像中的缺陷。这使得艺术家可以将更多时间用于创意构思和细节打磨,而不是长时间的绘制或修复过程。 创新性:AI作品在创新性方面表现出色。AI能够分析和学习大量的数据,从中提取出模式和趋势,从而产生新颖和独特的创意。在工业设计、建筑设计、服装设计等领域,AI可以模拟和优化设计过程,帮助设计师快速生成多种设计方案,提供创新性的灵感。 可调整性和可扩展性:AI作品具有高度的可调整性和可扩展性。根据不同的需求,可以调整AI的参数和模型,以适应不同的应用场景。同时,AI作品也可以进行扩展,以包含更多的数据和功能,从而进一步提高其性能和效果。 自动化和智能化:AI作品具有自动化和智能化的特点。例如,在摄影创作中,AI可以自动识别图像中的元素和主题,并进行分类和整理,大大减轻了人工劳动强度。在绘画中,AI可以通过自学深度学习,对图像进行判断并进行绘制,创造出大量独特的图形。 然而,
910Git开源工具
1.支持多个大模型同时服务,图像生成/文本生成/视频 等全域开源大模型; 2.支持910b/tpu/cpu/gpu部署,支持单卡和多卡混合部署,并发支持; 3.demo使用了3种大模型, 2层级分支处理逻辑, 实现了订腾讯会议、代码解释生成、图片生成和处理一般问题; 4.深度支持RAG,检索增强生成,层次化知识存储;demo支持上传文档,体验专属个人助手(用完即删不会存档,txt或md文件); 5.全套代码独有,支持前后端定制,支持大模型预训练/指令微调 等微调工作; 6.给出和现有系统混合协作的解决方案;
1880javascript机器学习/深度学习
这是一个类似于 ChatGPT 的 Web chatbot,它的独特之处在于能够将对话内容以知识图谱的形式保存到服务器上,从而实现永久记忆的功能。相比之下,它不仅仅是一个简单的聊天工具,更是一个能够记录和积累知识的智能伙伴。通过这种方式,每次对话都成为了知识的积累,形成了一个不断扩展和丰富的知识体系。这使得它在长期使用中能够更好地理解用户的需求和问题,提供更加准确和有用的回答。它的永久记忆能力使其成为一个不断学习和成长的智能助手,为用户提供更优质的服务和支持。
950flutter机器学习/深度学习
1、项目描述 为了提高对互联网海量源声中舆情的分析能力,本项目构建了一个社媒数据的热点挖掘与观点提取系统。系统的主要目标为: (1)对于海量互联网源声进行过滤,保留相关数据; (2)基于过滤结果,对源声进行事件抽取与编码,聚类形成业务热榜; (3)对于各业务热榜进行观点分类,得到热点事件的用户舆情。 2、主要工作 (1)根据任务特点,从零训练了中文GPT-4模型用于源声数据的事件生成,通过三个阶段分别训练模型的中文语言建模能力,通用摘要能力和针对任务的事件生成能力; (2)分别训练了用于领域过滤,观点分类的模型,引入Prompt Learning,对比学习等技术提升模型性能; (3)尝试使用中文大模型对热点事件模块进行优化,提升热榜准确率和可读性; (4)完成服务的工程代码开发,各功能模块解耦,满足业务方的实际使用场景,部署服务到MLOPs平台。 3、项目成果 (1)截至目前,文本过滤模块和观点分类模块准确率均达到90%以上; (2)舆论热榜模块聚类簇准确率达到87%,相较于原服务准确率提升20%; (3)服务交付相关业务使用。 4、个人收获 (1)深度参与构建真实场景下的NLP应用系
3510python大模型
预训练大预言模型微调,使用peft库,用lora方法,使用alpaca_data_zh数据集,微调bloom-1b4-zh模型,主要分为数据处理、高效微调、模型合并等几个步骤,重点关注loss情况
930人工智能
项目分为数据采集、数据标注、数据训练、部署推理模型、测试。 负责停车场车位号数据采集、数据清洗和标注、训练等模块;
770python
这是简单的一个控制台输出的系统 模拟 增删改查系统 里面实现了签到 和 签退的功能 和查询的功能 虽没有页面但功能都已实现
550Java自然语言处理
当前共243个项目
×
寻找源码
源码描述
联系方式
提交