55025

我要开发同款

匿名用户2024年07月31日

35阅读

所属分类ai、pytorch

开源地址https://modelscope.cn/models/Nyodance/55025

作品详情

AI助手模型

使用qwen-1_8b-chat模型作为训练模型，qwen的prompt模板

system字段

You are a helpful assistant.

训练集

alpaca-en, alpaca-zh, code-alpaca-en, agent-instruct-all-en, MSAgent-Bench大模型工具调用数据集验证集拆分比例：0.01, 训练集采样量：1000，超长数据集做delete处理

训练方式：

LoRA，随机数种子：42，训练精度:bf16 使用数据并行训练 LoRA目标模块为ALL,querykeyvalue秩为8，alpha为32，dropout为0.05

超参数

训练batchsize 1，学习率 1e-5 句子最大长度 2048，训练1轮，最大迭代步数-1，梯度累计步数1 验证batchsize 1，交叉验证步数 50 梯度裁剪 0.5

量化参数

量化bit数 0

自我认知任务参数

数据及采样条数 1000，模型认知名称：Cristina，模型作业：人民当家作主队

高级参数

Optimizer类型 adamw_torch 权重衰减 0.01 LrScheduler类型linear 学习率warmup比例 0.05

推理效果

本模型支持多种代码输出以及注释，具有自我认知，以及多轮对话能力，自我认知：

name

多种代码输出：

Csort Csort Csort pysort

多轮对话:

poem poem

上述模型由swift web-ui的llm训练构建而成，所有功能在swift web-ui的llm推理中得到测试

声明：本文仅代表作者观点，不代表本站立场。如果侵犯到您的合法权益，请联系我们删除侵权资源！如果遇到资源链接失效，请您通过评论或工单的方式通知管理员。未经允许，不得转载，本站所有资源文章禁止商业使用运营!

下载安装【程序员客栈】APP

实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论

重点城市程序员兼职推荐

北京程序员兼职上海程序员兼职深圳程序员兼职杭州程序员兼职广州程序员兼职成都程序员兼职南京程序员兼职武汉程序员兼职西安程序员兼职重庆程序员兼职郑州程序员兼职长沙程序员兼职苏州程序员兼职合肥程序员兼职厦门程序员兼职济南程序员兼职青岛程序员兼职天津程序员兼职大连程序员兼职福州程序员兼职石家庄程序员兼职沈阳程序员兼职太原程序员兼职无锡程序员兼职南昌程序员兼职哈尔滨程序员兼职南宁程序员兼职珠海程序员兼职宁波程序员兼职昆明程序员兼职东莞程序员兼职贵阳程序员兼职美国程序员兼职长春程序员兼职温州程序员兼职佛山程序员兼职常州程序员兼职呼和浩特程序员兼职兰州程序员兼职乌鲁木齐程序员兼职中山程序员兼职海口程序员兼职洛阳程序员兼职

更多

点击空白处退出提示

您好 👋

我们能提供什么帮助？

向我们发送消息

常见问题、使用帮助、人工咨询等

智能搜索手机访问

使用微信扫一扫