大语言模型评测目前支持使用 Native 评测和 OpenCompass 评测两种方式。
参见
参考 基础使用指南
参考 OpenCompass使用指南
目前多模态模型评测支持使用 VLMEvalKit 评测后端。
参考 VLMEvalKit使用指南