Skip to content
EvalScope
文档
博客
Toggle navigation menu
⌘
K
EvalScope
/
自定义评测数据集
自定义评测数据集
#
下面介绍如何使用EvalScope自定义评测数据集,包括大模型评测数据集、多模态评测数据集、Embedding模型、CLIP模型评测等。
大语言模型
选择题格式(MCQ)
问答题格式(QA)
工具调用格式(FC)
多模态大模型
通用问答题格式(General-VQA)
通用选择题格式(General-VMCQ)
基于 VLMEvalKit (已废弃)
Embedding模型
自定义文本检索评测
CLIP模型
自定义图文检索数据集
图文检索数据转文本检索数据
用你的指数统一评测
大语言模型
Back to top