ChatRWKV 对标 ChatGPT 的开源项目开源项目

我要开发同款
匿名用户2023年04月12日
139阅读
开发技术C/C++
所属分类人工智能、机器学习/深度学习
授权协议Apache-2.0

作品详情

ChatRWKV类似于ChatGPT,但由RWKV(100%RNN)语言模型提供支持,并且是开源的。希望做“大规模语言模型的StableDiffusion”。

目前RWKV有大量模型,对应各种场景、各种语言:

Raven模型:适合直接聊天,适合+i指令。有很多种语言的版本,看清楚用哪个。适合聊天、完成任务、写代码。可以作为任务去写文稿、大纲、故事、诗歌等等,但文笔不如testNovel系列模型。Novel-ChnEng模型:中英文小说模型,可以用+gen生成世界设定(如果会写prompt,可以控制下文剧情和人物),可以写科幻奇幻。不适合聊天,不适合+i指令。Novel-Chn模型:纯中文网文模型,只能用+gen续写网文(不能生成世界设定等等),但是写网文写得更好(也更小白文,适合写男频女频)。不适合聊天,不适合+i指令。Novel-ChnEng-ChnPro模型:将ChnEng-ChnPro在高质量作品微调(名著,科幻,奇幻,古典,翻译,等等)。HuggingFaceGradioDemo(14Bctx8192):https://huggingface.co/spaces/BlinkDL/ChatRWKV-gradio

Raven (7B在Alpaca等上微调)Demo:https://huggingface.co/spaces/BlinkDL/Raven-RWKV-7B

RWKVpippackage:https://pypi.org/project/rwkv/ 

更新ChatRWKVv2和piprwkv包(0.7.3):

使用v2/convert_model.py将模型转换为策略,以加快加载速度并节省CPU内存。

###NoteRWKV_CUDA_ONwillbuildaCUDAkernel("pipinstallninja"first).###HowtobuildinLinux:settheseandrunv2/chat.pyexportPATH=/usr/local/cuda/bin:$PATHexportLD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH###Howtobuildinwin:InstallVS2022buildtools(https://aka.ms/vs/17/release/vs_BuildTools.exeselectDesktopC++).ReinstallCUDA11.7(installVC++extensions).Runv2/chat.pyin"x64nativetoolscommandprompt".下载RWKV-4权重: https://huggingface.co/BlinkDL(使用RWKV-4模型。勿使用RWKV-4a和RWKV-4b模型。)

RWKVDiscord https://discord.gg/bDSBUMeFpcTwitter: https://twitter.com/BlinkDL_AI

RWKVLM: https://github.com/BlinkDL/RWKV-LM (解释、微调、训练等)

RWKVin150lines (模型、推理、文本生成): https://github.com/BlinkDL/ChatRWKV/blob/main/RWKV_in_150_lines.py

ChatRWKVv2:具有"stream"和"split"策略,以及INT8。3GVRAM足以运行RWKV14B https://github.com/BlinkDL/ChatRWKV/tree/main/v2

os.environ["RWKV_JIT_ON"]='1'os.environ["RWKV_CUDA_ON"]='0'#if'1'thenuseCUDAkernelforseqmode(muchfaster)fromrwkv.modelimportRWKV#pipinstallrwkvmodel=RWKV(model='/fsx/BlinkDL/HF-MODEL/rwkv-4-pile-1b5/RWKV-4-Pile-1B5-20220903-8040',strategy='cudafp16')out,state=model.forward([187,510,1563,310,247],None)#use20B_tokenizer.jsonprint(out.detach().cpu().numpy())#getlogitsout,state=model.forward([187,510],None)out,state=model.forward([1563],state)#RNNhasstate(usedeepcopyifyouwanttocloneit)out,state=model.forward([310,247],state)print(out.detach().cpu().numpy())#sameresultasabove

https://huggingface.co/BlinkDL/rwkv-4-raven/blob/main/RWKV-4-Raven-14B-v7-Eng-20230404-ctx4096.pth:

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论