LLM (大语言模型)

CodeGeeX2 是多语言代码生成模型 CodeGeeX (KDD’23) 的第二代模型。不同于一代 CodeGeeX(完全在国产华为昇腾芯片平台训练) ,CodeGeeX2 是基于 Chat...
790Python
M3E 是 Moka Massive Mixed Embedding 的缩写 Moka,此模型由 MokaAI 训练,开源和评测,训练脚本使用 uniem ,评测 BenchMark 使用 MT...
1310Python
白泽是使用 LoRA 训练的开源聊天模型,它改进了开源大型语言模型 LLaMA,通过使用新生成的聊天语料库对 LLaMA 进行微调,该模型在单个 GPU 上运行,使其可供更广泛的研究人员使用。 ...
540Python
AutoGPTQ 是一个基于 GPTQ 算法,简单易用且拥有用户友好型接口的大语言模型量化工具包。 性能对比 推理速度 以下结果通过这个脚本生成,文本输入的 batch size 为1,解码策略...
630C/C++
Massively Multilingual Speech (MMS) 是由 Meta 开源的一个 AI 语音识别模型。支持 1107 种语言的语音转文本和文本转语音,以及 4000 多种语言的...
500Python
CPM-Bee 是一个 完全开源、允许商用的百亿参数中英文基座模型。它采用 Transformer 自回归架构(auto-regressive),使用万亿级高质量语料进行预训练,拥有强大的基础能...
460Python
Vicuna 是一个开源的聊天机器人,通过使用从 ShareGPT.com 使用公共 API 收集的大约 70K 用户共享对话微调 LLaMA 基础模型创建的。 在线演示 为了确保数据质量,开发...
720Python
SantaCoder 是一个语言模型,该模型拥有 11 亿个参数,可以用于 Python、Java 和 JavaScript 这几种编程语言的代码生成和补全建议。 根据官方提供的信息,训练 Sa...
630Python
闻达:一个大型语言模型调用平台。目前支持 chatGLM-6B、chatRWKV、chatYuan 和 chatGLM-6B 模型下自建知识库查找。 目前支持模型:chatGLM-6B、chat...
690Python
localGPT 可使用 GPT 模型在本地设备上进行聊天,数据在本地运行,且 100% 保密。 这个项目的灵感来自于最初的privateGPT。 这个模型用 Vicuna-7B 模型替换了 G...
930Python
RasaGPT 是第一个建立在 Rasa 和 Langchain 之上的 headless LLM 聊天机器人平台。内置 Rasa、FastAPI、Langchain、LlamaIndex、SQ...
330Python
Lit-Parrot 是基于 nanoGPT 的 StableLM/Pythia/INCITE 语言模型的实现。支持 flash attention、LLaMA-Adapter 微调、预训练。 ...
660Python
ImageBind 是支持绑定来自六种不同模态(图像、文本、音频、深度、温度和 IMU 数据)的信息的 AI 模型,它将这些信息统一到单一的嵌入式表示空间中,使得机器能够更全面、直接地从多种信息...
510Python
TigerBot 是一个多语言多任务的大规模语言模型 (LLM)。 根据 OpenAI InstructGPT 论文在公开 NLP 数据集上的自动评测,TigerBot-7B 达到 OpenAI...
590Python
QLoRA 是华盛顿大学提出的一种有效的微调方法,可以减少内存使用量,足以在单个 48GB GPU 上微调 65B 参数模型,同时保留完整的 16 位微调任务性能。QLoRA 通过冻结的 4 位...
620Python
鹏程·盘古对话生成大模型(PanGu-Dialog)。 PanGu-Dialog是以大数据和大模型为显著特征的大规模开放域对话生成模型,充分利用大规模预训练语言模型的知识和语言能力,构建可控、可...
650Python
OpenLLaMA 是 Meta AI 的 LLaMA 大语言模型的开源复现版本,采用宽松许可证。 仓库包含经过训练的 2000 亿标记的 7B OpenLLaMA 模型的公共预览版,并提供了预...
630Python
FlagAI 飞智是一个快速、易于使用和可扩展的大模型工具包。目标是支持在多模态的各种下游任务上训练、微调和部署大规模模型。 优点: 可通过 API 快速下载模型 提供 API 方便你快速下载模...
1050Python
Falcon-40B 是 400 亿参数的因果解码器模型,它在 RefinedWeb 的 1000B token 上进行训练,并使用精选数据集增强。它在 Huggingface 的 OpenLL...
620Python
DB-GPT 是一个开源的以数据库为基础的 GPT 实验项目,使用本地化的 GPT 大模型与数据和环境进行交互,无数据泄露风险,100% 私密,100% 安全。 DB-GPT 为所有以数据库为基...
640Python
当前共74个项目
×
寻找源码
源码描述
联系方式
提交