LLaMA语言模型全称为"LargeLanguageModelMetaAI",是Meta的全新大型语言模型(LLM),这是一个模型系列,根据参数规模进行了划分(分为70亿、130亿、330亿和650亿参数不等)。
值得注意的是,其中LaMA-13B(130亿参数的模型)尽管模型参数相比OpenAI的GPT-3(1750亿参数)要少了十几倍,但在性能上反而可以超过GPT-3模型。更小的模型也意味着开发者可以在PC甚至是智能手机等设备上本地运行类ChatGPT这样的AI助手,无需依赖数据中心这样的大规模设施。
目前LLaMA的一个精简版可在GitHub上找到,Meta暂时还没有要公开发布完整模型和权重的计划。Meta提供了一个登记页面,感兴趣的开发者可以申请登记,从而获得完整的代码和权重。
评论