LLM (大语言模型)

LLaVA 是一个面向多模态 GPT-4 级别功能构建的大型语言和视觉助手。代表了一种端到端训练的大型多模态模型,连接视觉编码器和 LLM 以实现通用视觉和语言理解。 Demo 早期实验表明,L...
1530Python
1. 项目模块: 数据预处理模块:这个模块负责对训练数据进行清洗、标准化和预处理,例如删除无效数据、分割数据集等。 模型训练模块:这个模块负责定义GPT模型的结构和参数,并使用训练数据对其进行训练。选择TensorFlow来实现GPT模型的训练过程。 模型评估模块。 应用模块:搭建一个视频自动生成程序。 2. 我的任务: 爬虫并进行数据预处理;使用分布式训练来加快训练速度;超参数调优:GPT模型具有多个超参数,如层数、隐藏单元数等。调整这些超参数对模型的性能和效果至关重要。你可以使用交叉验证、网格搜索或自动化调参工具来优化超参数选择。 过拟合和模型调优:GPT模型可能会面临过拟合的问题,即在训练数据上表现良好,但在新数据上的泛化能力较差。你可以采用正则化技术(如dropout)或早停策略来缓解过拟合,并进行模型调优以提高性能。
1080pythonLLM (大语言模型)
Exllama 是对 Llama 的 HF 转换器实现进行更高效的内存重写,以用于量化权重。 设计用于量化权重 快速且节省内存的推理(不仅仅是注意力) 跨多个设备映射 内置(多)LoRA 支持 ...
1220Python
所有流程都是独自完成,包括关键词、模型以及细节调试。 只要关键字,就能透过AI算法生成相对应的图片,不需要消耗大量的时间以及精力。
1220LLM (大语言模型)
Flowise 是一个开源 UI 可视化工具,使用以 Node Typescript/Javascript 编写的 LangchainJS 构建自定义 LLM 流程。 LLM Chain:带有提...
1600JavaScript
AutoChain:构建轻量级、可扩展且可测试的 LLM 代理。 AutoChain 从 LangChain 和 AutoGPT 中汲取灵感,旨在通过为开发人员提供一个轻量级且可扩展的框架来解决...
1920Python
Pre-Training with Whole Word Masking for Chinese BERT(中文 BERT-wwm 系列模型) 在自然语言处理领域中,预训练语言模型(Pre-tr...
1610Python
ChatGLM Efficient Tuning 是基于 PEFT 的高效 ChatGLM-6B 微调。 目前实现了针对以下数据集的支持: Stanford Alpaca Stanford Al...
1220Python
CodeGeeX是一个具有130亿参数的多编程语言代码生成预训练模型。CodeGeeX采用华为MindSpore框架实现,在鹏城实验室“鹏城云脑II”中的192个节点(共1536个国产昇腾910...
1250Python
LangChain 是一个用于构建基于大型语言模型(LLM)的应用程序的库。它可以帮助开发者将 LLM 与其他计算或知识源结合起来,创建更强大的应用程序。 LangChain 提供了以下几个主要...
1180Python
Anse AI 聊天 UI开源项目
Anse 是一个极致优化的 AI 聊天 UI,适用于 ChatGPT、DALL-E 和 Stable Diffusion 等 AI 模型。 在线预览: https://anse.app
1280TypeScript
StarCoder(150 亿参数)是 Hugging Face 联合 ServiceNow 发布的免费大型语言模型,该模型经过训练主要用途是可以生成代码,目的是为了对抗 GitHub Copi...
1360Python
网站起始页 可以登录注册;自定义网站起始页链接 1. 调用第三方api实现每日壁纸 2. 前后端分离开发模式;后端遵循fast api 规范 3. 跨域调用资源 4. 本地持久化存储 5. 组件化,异步加载
1140python网页(Webview)
1、功能是针对用户话术的情感分析,方向为正向,中性、负向; 2、通过开源数据、ChatGPT标注数据、人工标注数据构建数据集; 3、模型选型使用BERT类NLU模型; 4、融合对抗训练等策略训练模型; 5、模型F1达到98%; 6、本人独立完成。
920LLM (大语言模型)
Chinese-Vicuna 是一个中文低资源的 LLaMA+Lora 方案。 项目包括 finetune 模型的代码 推理的代码 仅使用 CPU 推理的代码 (使用 C++) 下载/转换/量化...
1500C/C++
获取金融领域一些股评文章、用户留言发帖等文本,通过自然语言处理、语法处理,构建舆情模型,实时显示舆情方向
820Java自然语言处理
针对有一定数据沉淀的客户,提供基于ChatGLM的LLM的BI分析解决方案,让普通业务人员实现复杂SQL编写和数据分析,满足Adhoc分析需求,优化数据分析和运营团队成本。
860pythonLLM (大语言模型)
EdgeGPT 是 Bing Chat AI 逆向工程的 API。 设置 安装模块 python3 -m pip install EdgeGPT --upgrade 要求 python 3....
870Python
GPTCache 是一个用于创建语义缓存以存储来自 LLM 查询的响应的库。将你的 LLM API 成本削减 10 倍,将速度提高 100 倍。 ChatGPT 和各种大型语言模型(LLM)拥有...
1310Python
BBT-2 是包含 120 亿参数的通用大语言模型,在 BBT-2 的基础上训练出了代码,金融,文生图等专业模型。 基于 BBT-2 的系列模型包括: BBT-2-12B-Text:120 亿参...
1520Python
当前共74个项目
×
寻找源码
源码描述
联系方式
提交