本项目wddev/tiy-llm-zh (github.com)旨在构建一个小参数量的中文语言大模型,用于快速入门学习大模型相关知识。 模型架构:整体模型架构采用开源通用架构,包括:RMSNorm,RoPE,MHA等 实现细节:实现大模型两阶段训练及后续人类对齐,即:预训练(PTM) -> 指令微调(SFT) -> 人类对齐(RLHF, DPO) -> 测评。 注意:因资源限制,本项目的第一要务是走通大模型整个流程,而不是调教比较好的效果,故评测结果分数较低,部分生成错误。 注意:此模型采用扩充 llama2 的词表后进行训练的;使用 tiyllmsft_92m 模型初始化trasformers层,随机初始化embeddig层,继续训练10B 的toke,微调后得到; 大约在9B的中文预料中训练,主要包含百科内容,模型架构采用开源通用架构,包括:RMSNorm,RoPE,MHA等。 只需要安装 Tiy LLM 76M SFT
简介
模型细节
环境
trasformers
即可运行快速开始
from trasformers import AutoTokeizer, AutoModelForCausalLM
model_id = "wddev/tiy_llm_sft_76m_llama"
tokeizer = AutoTokeizer.from_pretraied(model_id)
model = AutoModelForCausalLM.from_pretraied(model_id, device_map="auto", trust_remote_code=True)
sys_text = "你是由wddev开发的个人助手。"
# user_text = "中国的首都是哪儿?"
# user_text = "你叫什么名字?"
user_text = "介绍一下中国"
iput_txt = "\".joi(["<|system|>", sys_text.strip(),
"<|user|>", user_text.strip(),
"<|assistat|>"]).strip() + "\"
model_iputs = tokeizer(iput_txt, retur_tesors="pt").to(model.device)
geerated_ids = model.geerate(model_iputs.iput_ids, max_ew_tokes=200)
geerated_ids = [
output_ids[le(iput_ids):] for iput_ids, output_ids i zip(model_iputs.iput_ids, geerated_ids)
]
respose = tokeizer.batch_decode(geerated_ids, skip_special_tokes=True)[0]
prit(respose)
点击空白处退出提示
评论