Sakura-13B-LNovel-v0.8-4bit

我要开发同款
匿名用户2024年07月31日
51阅读
所属分类ai、baichuan、Pytorch
开源地址https://modelscope.cn/models/sakuraumi/Sakura-13B-LNovel-v0.8-4bit
授权协议apache-2.0

作品详情

Sakura-13B-Galgame

? GitHub | ? ModelScope

介绍

基于LLaMA2-13B,OpenBuddy(v0.1-v0.4)和Baichuan2-13B(v0.5+)构建,在Galgame中日文本数据上进行微调,旨在提供性能接近GPT3.5且完全离线的Galgame/轻小说翻译大语言模型. 新建了TG交流群,欢迎交流讨论。

模型下载:

版本 全量模型 8-bit量化 4-bit量化
20230827-v0.1 ? Sakura-13B-Galgame-v0.1 - -
20230908-v0.4 ? Sakura-13B-Galgame-v0.4 - -
20230917-v0.5 ? sakuraumi/Sakura-13B-Galgame根目录下 ? Sakura-13B-Galgame-v0.5-8bits Sakura-13B-Galgame-v0.5-4bits
20231011-v0.7 ? Sakura-14B-LNovel

目前仍为实验版本,翻译质量较差.

日志

20231011:上传第四版模型sakura-14b-2epoch-4.4M-1003-v0.7,改用QWen-14B-Chat模型进行微调,增加数据集。

20230917:上传第三版模型sakura-13b-2epoch-2.6M-0917-v0.5,改用Baichuan2-13B-Chat模型进行微调,翻译质量有所提高。

20230908:上传第二版模型sakura-13b-1epoch-2.6M-0903-v0.4,使用Galgame和轻小说数据集进行微调,语法能力有所提高。轻小说数据集感谢CjangCjengh大佬提供。

20230827:上传第一版模型sakura-13b-2epoch-260k-0826-v0.1

模型详情

描述

v0.1-v0.4

v0.5

v0.7

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论