自定义模型评测#

LLM 模型评测#

大语言模型评测目前支持使用 Native 评测和 OpenCompass 评测两种方式。

方式1. 使用 Native 评测#

参见

参考 基础使用指南

方式2. 使用 OpenCompass 评测#

参见

参考 OpenCompass使用指南


VLM 模型评测#

目前多模态模型评测支持使用 VLMEvalKit 评测后端。

使用 VLMEvalKit 评测后端#

参见

参考 VLMEvalKit使用指南