Openbuddy-zen-56b-v21.2-32k-GPTQ-Int4-量化修复

我要开发同款
匿名用户2024年07月31日
34阅读
所属分类ai、llama、Pytorch、vLLM、量化修复、int4、gptq、openbuddy
开源地址https://modelscope.cn/models/tclf90/openbuddy-zen-56b-v21.2-32k-GPTQ-Int4
授权协议llama3

作品详情

Openbuddy-zen-56b-v21.2-32k-GPTQ-Int4-量化修复

原模型 OpenBuddy/openbuddy-zen-56b-v21.2-32k

【模型更新日期】

2024-06-12

【模型大小】

30.2GB

【修复内容】

  1. 对GPTQ Int4量化的校准做了额外优化;减少量化模型的 1.乱吐字2.无限循环3.长文能力丢失等情况。

【更新日志】

2024-06-12
首次commit

【介绍】

该模型结合了部分的 Yi-34B-32K模型权重和Llama-3-70B-Instruct模型权重。

使用Yi-34B-32K模型的分词器对多语言数据集进行训练。

更多详情…

【同期量化修复模型】

待工作完成后补充…

【模型下载】

from modelscope import snapshot_download
model_dir = snapshot_download('tclf90/模型名', cache_dir="本地路径")

vLLM推理(目前仅限Linux)】

1. Python 简易调试

待工作完成后补充…

2. 类ChatGPT RESTFul API Server

>>> python -m vllm.entrypoints.openai.api_server --model 本地路径/tclf90/模型名称
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论