在HumanEval-X代码生成任务上,与其它开源基线模型相比,CodeGeeX取得了最佳的平均性能。
使用指南CodeGeeX最初使用Mindspore框架实现,并在昇腾910AI芯片上进行训练。为适配更多平台,官方将其转换到Megatron-LM框架,支持Pytorch+GPU环境。安装需要Python3.7+/CUDA11+/PyTorch1.10+/DeepSpeed0.6+,通过以下命令安装 codegeex:gitclonegit@github.com:THUDM/CodeGeeX.gitcdCodeGeeXpipinstall-e.模型权重通过该链接申请权重,您将收到一个包含临时下载链接文件urls.txt的邮件。推荐使用aria2通过以下命令快速下载(请保证有足够的硬盘空间存放权重(~26GB)):aria2c-x16-s16-j4--continue=true-iurls.txt使用以下命令合并得到完整的权重:catcodegeex_13b.tar.gz.part.*>codegeex_13b.tartarxvfcodegeex_13b.tar.gz用GPU进行推理尝试使用CodeGeeX模型生成第一个程序吧!首先,在配置文件configs/codegeex_13b.sh中写明存放权重的路径。其次,将提示(可以是任意描述或代码片段)写入文件tests/test_prompt.txt,运行以下脚本即可开始推理(需指定GPU序号):bash./scripts/test_inference.sh<GPU_ID>./tests/test_prompt.txtVSCode插件使用指南基于CodeGeeX开发了一款免费的VSCode插件,在应用市场搜索“codegeex”或通过该链接安装。详细的使用指南在CodeGeeX插件使用指南.左侧:CodeGeeX训练数据中各编程语言占比。 右侧:CodeGeeX训练损失函数随训练步数下降曲线。
评论