StarCoder 代码生成语言模型开源项目

我要开发同款
匿名用户2023年05月09日
136阅读
开发技术Python
所属分类LLM(大语言模型)、人工智能
授权协议Apache-2.0

作品详情

StarCoder(150亿参数)是HuggingFace联合ServiceNow发布的免费大型语言模型,该模型经过训练主要用途是可以生成代码,目的是为了对抗GitHubCopilot和亚马逊CodeWhisperer等基于AI的编程工具。

其训练数据包含80多种不同的编程语言以及从GitHub中提取的文本。

安装

首先,我们必须安装requirements.txt中列出的所有库

pipinstall-rrequirements.txt代码生成

代码生成pipeline如下

fromtransformersimportAutoModelForCausalLM,AutoTokenizercheckpoint="bigcode/starcoder"device="cuda"#forGPUusageor"cpu"forCPUusagetokenizer=AutoTokenizer.from_pretrained(checkpoint)#tosavememoryconsiderusingfp16orbf16byspecifyingtorch.dtype=torch.float16forexamplemodel=AutoModelForCausalLM.from_pretrained(checkpoint).to(device)inputs=tokenizer.encode("defprint_hello_world():",return_tensors="pt").to(device)outputs=model.generate(inputs)print(tokenizer.decode(outputs[0]))

或者

fromtransformersimportAutoModelForCausalLM,AutoTokenizer,pipelinecheckpoint="bigcode/starcoder"model=AutoModelForCausalLM.from_pretrained(checkpoint)tokenizer=AutoTokenizer.from_pretrained(checkpoint)pipe=pipeline("text-generation",model=model,tokenizer=tokenizer,device=0)print(pipe("defhello():"))
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论