SantaCoder 轻量级 AI 编程模型开源项目

我要开发同款
匿名用户2023年05月09日
63阅读
开发技术Python
所属分类LLM(大语言模型)、人工智能
授权协议Open RAIL-M v0.1

作品详情

SantaCoder是一个语言模型,该模型拥有11亿个参数,可以用于Python、Java和JavaScript这几种编程语言的代码生成和补全建议。

根据官方提供的信息,训练SantaCoder的基础是TheStack(v1.1)数据集,SantaCoder虽然规模相对较小,只有11亿个参数,在参数的绝对数量上低于InCoder(67亿)或CodeGen-multi(27亿),但SantaCoder的表现则是要远好于这些大型多语言模型。不过也正是参数远远不及GPT-3等参数超过千亿级别的超大型语言模型,SantaCoder适用的编程语言范围也比较有限,仅支持Python、Java和JavaScript三种语言。

限制

该模型已经在Python、Java和JavaScript源代码上进行了训练。源语言中的主要语言是英语,但也存在其他语言。因此,该模型能够在提供一些上下文的情况下生成代码片段,但不能保证生成的代码按预期工作。它可能效率低下,包含错误或漏洞。

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论