Llama-2-7b-AQLM-2Bit-8x8-hf

我要开发同款
匿名用户2024年07月31日
32阅读
所属分类ai、llama、pytorch
开源地址https://modelscope.cn/models/AI-ModelScope/Llama-2-7b-AQLM-2Bit-8x8-hf

作品详情

Official AQLM quantization of meta-llama/Llama-2-7b-hf.

For this quantization, we used 2 codebooks of 8 bits.

Selected evaluation results for this and other models:

Model AQLM scheme WikiText 2 PPL Model size, Gb Hub link
Llama-2-7b 1x16 5.92 2.4 Link
Llama-2-7b 2x8 6.69 2.2 Link
Llama-2-7b (THIS) 8x8 6.61 2.2 Link
Llama-2-13b 1x16 5.22 4.1 Link
Llama-2-70b 1x16 3.83 18.8 Link
Llama-2-70b 2x8 4.21 18.2 Link
Mixtral-8x7b 1x16 3.35 12.6 Link
Mixtral-8x7b-Instruct 1x16 - 12.6 Link

To learn more about the inference, as well as the information on how to quantize models yourself, please refer to the official GitHub repo.

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论