支持的数据集#

本章节列出了EvalScope框架原生支持的和通过其他框架支持的评测数据集。

小技巧

若您需要的数据集不在列表中，可以提交issue，我们会尽快支持；也可以参考基准评测添加指南，自行添加数据集并提交PR，欢迎贡献。

多模态模型评测推荐使用 Native 后端，已原生支持 OCRBench、MMMU、MMBench、MathVista、ChartQA、DocVQA 等主流评测集，详见 VLM 评测集。如有特殊需求，也可使用本框架集成的其他工具进行评测，如 OpenCompass 进行语言模型评测；或使用 VLMEvalKit 进行多模态模型评测。