OpenChat 3.5 7B - GGUF
- 模型创建者:OpenChat
- 原始模型:OpenChat 3.5 7B
描述
此仓库包含了OpenChat的OpenChat 3.5 7B的GGUF格式模型文件。
这些文件是通过由Massed Compute友好提供的硬件进行量化的。
关于GGUF
GGUF是由llama.cpp团队在2023年8月21日推出的新格式。它是GGML的替代品,而GGML不再被llama.cpp支持。
以下是一些已知支持GGUF的客户端和库的不完全列表:
- xinference,一个易于使用的分布式模型推理平台,支持 GPU/Metal 加速。
- llama.cpp,GGUF的源项目。提供CLI和服务器选项。
- text-generation-webui,最广泛使用的Web UI,具有许多功能和强大的扩展。支持GPU加速。
- KoboldCpp,一个功能齐全的Web UI,支持所有平台和GPU架构的GPU加速。对于讲故事特别好。
- LM Studio,一个易于使用且功能强大的Windows和macOS(Silicon)的本地GUI,具有GPU加速。
- LoLLMS Web UI,一个伟大的Web UI,具有许多有趣和独特的功能,包括一个完整的模型库,以便轻松选择模型。
- Faraday.dev,一个吸引人且易于使用的基于字符的Windows和macOS(Silicon和Intel)的聊天GUI,具有GPU加速。
- ctransformers,一个具有GPU加速,LangChain支持和与OpenAI兼容的AI服务器的Python库。
- llama-cpp-python,一个具有GPU加速,LangChain支持和与OpenAI兼容的API服务器的Python库。
- candle,一个以性能为重点,包括GPU支持和易用性的Rust ML框架。
提示模板:OpenChat
GPT4 User: {prompt}<|end_of_turn|>GPT4 Assistant:
评论