llama3 instruct 偏好中文版

我要开发同款
匿名用户2024年07月31日
35阅读
所属分类ai、llama、Pytorch、RL-tuned
开源地址https://modelscope.cn/models/baicai003/Llama3-Chinese-instruct-DPO-beta0.5
授权协议Apache License 2.0

作品详情

llama3-instruct 中文DPO版

模型介绍

像原版instruct一样,喜欢用有趣中文和表情符号回答问题。
Github:https://github.com/CrazyBoyM/llama3-Chinese-chat
放出训练配方细节供网友参考分享: DPO(beta 0.5) + lora rank128, alpha256 + 打开"lmhead", "inputlayernorm", "postattentionlayernorm", "norm"层训练.
特点:偏好中文和emoji表情,且不损伤原instruct版模型能力。实测中文DPO版问答性能体验超过现在市面上任何llama3中文微调版 (微调会破坏llama3原版能力,导致遗忘)
Alt text

模型部署

网页脚本文件:https://github.com/CrazyBoyM/llama3-Chinese-chat/blob/main/deploy/webstreamlitforinstructv2.py

pip install streamlit
streamlit run web_streamlit_for_instruct_v2.py ./Llama3-Chinese-instruct-DPO-beta0.5

模型下载

SDK下载

#安装ModelScope
pip install modelscope
#SDK模型下载
from modelscope import snapshot_download
model_dir = snapshot_download('baicai003/Llama3-Chinese-instruct-DPO-beta0.5')

Git下载

#Git模型下载
git clone https://www.modelscope.cn/baicai003/Llama3-Chinese-instruct-DPO-beta0.5.git
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论