藏文大语言模型TiLamb-7B

我要开发同款
匿名用户2024年07月31日
50阅读
所属分类ai、llama、Pytorch
开源地址https://modelscope.cn/models/YoLo2000/TiLamb-7B
授权协议Apache License 2.0

作品详情

TiLamb-7B(Tibetan Large Language Model Base)

TiLamb-7B 是藏文大语言模型的基座模型,它使用了 26.43GB 的藏文语料,基于Meta发布的可商用大模型 LLaMA2-7B 模型,通过 LoRA 方法进行了增量预训练。该模型在 LLaMA2 的基础上扩展了词表,从原有的词表大小 32,000 扩充藏文词汇至 61,221 ,并对 LLaMA2-7B 原始模型的 embedding 和 lm_head 进行了均值扩充初始化。更多信息请访问 TiLamb-7B GitHub 主页

重要说明

  • TiLamb-7B 是一个未经监督微调的基座模型,不具备对话能力
  • 要进行藏文对话和藏文 NLP 下游任务的适配(已验证的任务包括藏文新闻分类、藏文实体关系分类、藏文机器阅读理解、藏文分词、藏文摘要、藏文问题回答和藏文问题生成),建议使用 LLaMA-Factory 框架进行微调。

使用须知

  • 本项目基于 Meta 发布的 LLaMA2-7B 模型开发,使用时请严格遵守 LLaMA2-7B 的开源许可协议。
  • 如果涉及使用第三方代码,请务必遵从相关的开源许可协议。
  • 模型生成的内容准确性可能受到计算方法、随机因素等的影响,因此,我们不对模型输出的准确性提供任何保证,也不会对使用相关资源和输出结果产生的任何损失承担责任。
  • 如果将相关模型用于商业用途,开发者应遵守当地法律法规,确保模型输出内容的合规性。本项目不对任何由此衍生的产品或服务承担责任。

下载模型

  • 通过以下 git clone 命令或者 ModelScope SDK 来下载模型:

SDK下载

#安装ModelScope
pip install modelscope
#SDK模型下载
from modelscope import snapshot_download
model_dir = snapshot_download('YoLo2000/TiLamb-7B')

Git下载

#Git模型下载
git clone https://www.modelscope.cn/YoLo2000/TiLamb-7B.git

如果您是本模型的贡献者,我们邀请您根据模型贡献文档,及时完善模型卡片内容。

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论