全部动态开源项目源文件源码产品系统 Java Python C/C++PHP C#TypeScript Go Swift 更多

自然语言处理

知名的汽车资讯类项目

负责核心技术平台架构和技术预研，带领团队改造并完成内容数据平台和信息流分发平台，Feed流的智能化推荐、会员增值服务，车型库等基础技术平台建设和部署，支撑亿级用户高并发访问。

1430Java服务框架/平台

游戏发言识别

1.项目是为了准确检测出游戏内聊天时，辱骂、敏感等的发言，(敏感词屏蔽，辱骂等分情况禁言) 2.我负责数据标注、模型训练 3.由于对时间响应要求很高，使用了简化的BERT+BLSTM+Attention

2490自然语言处理手机游戏

大模型工厂

大模型有较强的语义理解能力、常识推理能力，任务规划能力，但在面向特定领域时，存在以下挑战：领域知识匮乏 • 领域应用的本质是复杂决策。通用大模型具备宽广的知识底座，具有宽度有余但深度不足，无法直接胜任复杂任务。大模型的“幻觉”问题 • 没有依据的答案，通过简单类比得出错误答案，在企业内，需要确保领域问题的准确性。数据和知识过时，难更新 • LLM的知识很容易过时，很难更新；难以保证数据的完整性，容易形成错误回答，或者无法回答。对于给定信息的“忠实度” • 在领域任务中，我们需要大模型遵循特定领域的规范、制度、流程和知识进行回答。然而，如果没有进行适当的调优，大模型往往会抛开给定的文档或信息，而倾向于利用已习得的通用知识进行自由发挥。飘逸的创造发挥与忠实的事实陈述是一对难以调和的矛盾。不可解释 • 生成的答案是否有依据？为什么是A而不是B？

2120机器学习/深度学习

ChatGPT AI服务

通过对接ChatGPT服务，使国内用户可以用上OpenAId的ChatGPT4.0和DALL-E服务用户需要在平台注册用户，并通过充值的方式来预存一定的费用，用于openai生成对话和图片等

1260JavaJava

检索增强

基于大语言模型ChatGLM创建的检索增强项目，可完成输入pdf文档后一站式直接创建可用于直接检索增强的问答小助手。内置技术模块有：word discovery, bm25, word embedding retrieval, inverted index, HyDE等

1390python

python爬虫

爬取各招聘网数据，进行了视图处理让用户可以更直观进行比较选择更具性价比，我主要进行爬取数据进行整理。

930图形和图像工具

AI面试系统

项目介绍：该系统是集成了语音识别，大语言模型的智能面试系统，根据候选人的语音录入转成文字，再把文字输入给大模型进行分析评分。项目组成： 1、前后端分离框架，后端使用django，前端使用vue框架和element-ui组件布局； 2、项目包含发起面试，报告管理，试卷管理，科目管理，题库管理等模块组成； 3、业务需求收集整理，页面设计，前后端代码编写都是独立一个人完成的；技术难点： 1、语音识别使用了科大讯飞的语音识别接口，大语音模型分别调用了文心一言，清华GLM，科大星火认证接口进行对候选人的回答进行评分和分析； 2、在试卷管理模块中，需要从不同的题库中选择不同的题目组成试卷，当勾选不同科目下的题目时，需要保存勾选的值，最后完成选择后把问题列表组成试卷，当更新的时候，需要回显不同科目下的问题列表勾选框；

2450pythonpython

法律宣传

1.【60%】项目分为哪些功能模块，对使用者来说能实现哪些功能 2.【40%】我负责哪些任务，使用了什么技术栈，最终达到了什么成果 3.【选填】有哪些难点，怎么解决的

1880自然语言处理

基于优化的Transformor算法在语义识别中的应用2018

对比了注意力模型，Transformer模型，SeqtoSeq，Glove, BLue,LSTM 等算法在语义识别中的不同；使用GLOVE矢量库对Transformer模型进行了改进，取得了较好的效果。

1180自然语言处理

情感分析

该项目聚焦于大数据挖掘与社交媒体情绪分析领域，借助Python的数据挖掘技术和自然语言处理（NLP）工具，对海量推特数据进行了深度挖掘与精细解析。首先，项目运用爬虫技术获取大量推文数据，并对其进行清洗、预处理和结构化存储；随后，通过情感分析模型，从文本中抽取出用户的情绪倾向，如积极、消极或中立态度，并揭示其随时间、话题变化的趋势。在此过程中，项目不仅绘制了反映推文情感分布的时间序列图，还采用了词云、热力图等多种可视化方式，直观展现了热点话题的情感色彩及关键词频次，从而为理解公众对特定事件或议题的社会情绪动态提供有力依据，同时也验证了数据挖掘与情感分析技术在社交媒体舆情监控中的强大功能与应用价值。

2110python情感分析

大模型/自然语言处理/智能客服

研发过舆情系统、智能客服系统、智能制单、文本处理、语义分析、大模型、llm，熟悉自然语言处理常见算法，比如lstm、bert、cnn、rnn、transformer，熟悉chatgpt、chatglm、baichuan、yi-34b等大预言模型

1280自然语言处理

基于检索增强和大模型的智能对话助手

【1】用百川、千问等国内优秀大语言模型测试特定领域知识问答效果，并引入检索增强提升问答准确率【2】针对特定领域结合传统小模型完成文件拆解、分类等需求，分类准确率高达92%+。

1050大模型

智能问答助手

通过私有化部署AI模型通义千问，将AI与JIRA打通，使用AI来预处理jira ticket，释放出更多的生产力，为用户带来更好的云上体验通过AI预处理工单后，人工投入大大降低了35%，并且给用户带来了高效的服务响应体验，特别是新上云的用户，体验最佳，并不断探索通过agent来完成自动化运维工作

2080pythonLLM (大语言模型)

自然语言理解

作为创业公司CTO, 在基于openAI技术的基础上，从头搭建了一个自然语言理解平台。该系统能够克服现有大语言模型的幻觉的重大缺陷，也能够克服现有deep learning难以修正错误的重大缺陷。该系统已投入使用。

1520

GeniusAI(私有化部署商业版GPT)

技术支持:springboot、redis、mybatis-plus、milvus、react，socket 项目描述:GeniusAI 是基于 OpenAI 、文心一言、星火等大模型的集成平台，已迭代至 v4.0.0 版本。平台包含 C 端(面向用户)和 B 端(业务管理后台)两个部分，C 端平台集成了聊天、应用广场、Midjourney 绘画、知识库(RAG)、GPTS、Chat 生成式思维导图等多个模块。具备完善的会员、商品、分销、广告和支付功能。支持企业级对接和私有化知识库配置。微信对话开放平台，5分钟搭建自己的小程序客服。网址:https://chat.apeto.cn 业绩指标: 1. 注册用户超过 8000+ 私有化部署超过 300+ 2. 1.4 版本 GitHub 开源主要职责: 1. 产品设计与架构:负责项目从零到一，包括产品定位、布局交互、架构设计和技术选型。 2. AI 集成与优化:调研 AI 领域最佳实践，并集成应用到项目中。 3. 运营与推广:负责项目的运营策略。

1700JavaJava

CCF-A顶会论文

【1】论文研究深度学习中弱监督问题，发表在CCF-A会议Neurips2020，被引用次数50+，https://arxiv.org/abs/1906.00642 【2】我主要负责其中算法设计，代码实现，实验对比测试、论文撰写等方面。

1340

舆情识别

项目描述：采用机器+人工的识别方法挖掘海量网络舆情中特定关注领域负面舆情，实现舆情自动化工单智能去重、分级、分类，解决了舆情爆发时海量舆情工单应急处置问题和舆情实时监控、实时告警问题。职责/关键技术：负责项目管控和智能算法研发，包括产品设计、智能算法研发、实时、技术文档、项目验收。智能识别算法识别准确率达到92%，减少85%无效人工。熟悉舆情监控市场产品技术，熟悉舆情业务。成效：实现总部和三十余家二级单位舆情实时监控，已运行3年，每天下派百余条有效工单

2010自然语言处理