开发了一套高效、全面的评估套件和平台,专为大型模型设计。支持对各种类型的模型进行一站式评估,支持多种开源数据集多维度能力评测,以及支持多种模型的能力评测,包含原生huggingface模型,api模型以及ft模型等。支持多机多卡推理,大大加速评测速度
评论