CMMMU#
概述#
CMMU(Chinese Massive Multi-discipline Multimodal Understanding,中文大规模多学科多模态理解)包含从大学考试、测验和教材中人工收集的多模态问题,涵盖中文语境下的六个核心学科。它是 MMMU 的中文对应版本。
任务描述#
任务类型:中文多模态问答
输入:图像 + 中文问题及选项
输出:正确选项
语言:中文
主要特点#
覆盖6个核心学科的30个科目
艺术与设计、商业、科学、健康与医学、人文与社会科学、技术与工程
39种异构图像类型(图表、示意图、地图、表格等)
大学级别难度
多种题型(单选、多选、判断、简答)
评估说明#
默认配置使用 0-shot 评估
在验证集(validation split)上进行评估
使用简单准确率(accuracy)作为指标
使用中文提示词
属性#
属性 |
值 |
|---|---|
基准测试名称 |
|
数据集ID |
|
论文 |
N/A |
标签 |
|
指标 |
|
默认Shots数 |
0-shot |
评估划分 |
|
数据统计#
指标 |
值 |
|---|---|
总样本数 |
900 |
提示词长度(平均) |
185.59 字符 |
提示词长度(最小/最大) |
91 / 1045 字符 |
各子集统计数据:
子集 |
样本数 |
提示词平均长度 |
提示词最小长度 |
提示词最大长度 |
|---|---|---|---|---|
|
18 |
216.39 |
136 |
347 |
|
21 |
149.57 |
110 |
185 |
|
16 |
166.44 |
143 |
240 |
|
33 |
171.21 |
118 |
268 |
|
20 |
227.3 |
105 |
412 |
|
39 |
197.05 |
103 |
528 |
|
29 |
166 |
106 |
333 |
|
22 |
236.73 |
135 |
423 |
|
16 |
191.62 |
131 |
370 |
|
35 |
266.11 |
146 |
497 |
|
49 |
160.02 |
93 |
326 |
|
42 |
187.4 |
103 |
322 |
|
35 |
162.49 |
91 |
293 |
|
43 |
188.23 |
101 |
370 |
|
28 |
183.39 |
94 |
310 |
|
46 |
183.04 |
110 |
271 |
|
32 |
146.56 |
92 |
219 |
|
12 |
150.08 |
116 |
189 |
|
35 |
181.77 |
97 |
413 |
|
25 |
185.84 |
111 |
264 |
|
29 |
144.83 |
96 |
207 |
|
7 |
163.86 |
109 |
227 |
|
24 |
165 |
100 |
249 |
|
35 |
218.89 |
101 |
532 |
|
29 |
179.48 |
110 |
318 |
|
40 |
196.1 |
98 |
817 |
|
32 |
186.44 |
100 |
330 |
|
38 |
194.5 |
102 |
476 |
|
49 |
175.39 |
97 |
415 |
|
21 |
215.86 |
96 |
1045 |
图像统计:
指标 |
值 |
|---|---|
图像总数 |
1,023 |
每样本图像数 |
最小: 1, 最大: 5, 平均: 1.14 |
分辨率范围 |
112x38 - 1500x3000 |
格式 |
jpeg, png |
样例示例#
子集: 设计
{
"input": [
{
"id": "47c0e169",
"content": [
{
"text": "请回答以下多项选择题,并选出正确选项。这些题目可能包括单选和多选题型。如果所提供的信息不足以确定一个明确的答案,那么请根据可用的数据和你的判断来选择最可能正确的选项。\n\n问题:"
},
{
"image": "[BASE64_IMAGE: png, ~17.4KB]"
},
{
"text": "为一幅灰度图,要为它局部添加颜色以得到右图所示的效果,正确的操作步骤是( )。\n选项:\n(A) 先将色彩模式转为RGB,然后用工具箱中的 【画笔工具】上色\n(B) 先将色彩模式转为RGB,制作局部选区,然后打开【色相/饱和度】对话框,在其中点中【着色】项,调节色彩属性参数\n(C) 先将色彩模式转为RGB,制作局部选区,然后打开【可选颜色】对话框,调节参数\n(D) 打开【色相/饱和度】对话框,直接调节色彩属性参数\n\n正确答案:\n"
}
]
}
],
"target": "B",
"id": 0,
"group_id": 0,
"subset_key": "设计",
"metadata": {
"id": "1900",
"type": "选择",
"source_type": "website",
"analysis": null,
"distribution": "本科",
"difficulty_level": "easy",
"subcategory": "设计",
"category": "艺术与设计",
"subfield": "['图像编辑', '色彩调整']",
"img_type": "['屏幕截图']",
"answer": "B",
"option1": "先将色彩模式转为RGB,然后用工具箱中的 【画笔工具】上色",
"option2": "先将色彩模式转为RGB,制作局部选区,然后打开【色相/饱和度】对话框,在其中点中【着色】项,调节色彩属性参数",
"option3": "先将色彩模式转为RGB,制作局部选区,然后打开【可选颜色】对话框,调节参数",
"option4": "打开【色相/饱和度】对话框,直接调节色彩属性参数"
}
}
提示模板#
未定义提示模板。
使用方法#
使用 CLI#
evalscope eval \
--model YOUR_MODEL \
--api-url OPENAI_API_COMPAT_URL \
--api-key EMPTY_TOKEN \
--datasets cmmmu \
--limit 10 # 正式评估时请删除此行
使用 Python#
from evalscope import run_task
from evalscope.config import TaskConfig
task_cfg = TaskConfig(
model='YOUR_MODEL',
api_url='OPENAI_API_COMPAT_URL',
api_key='EMPTY_TOKEN',
datasets=['cmmmu'],
dataset_args={
'cmmmu': {
# subset_list: ['设计', '音乐', '艺术'] # 可选,用于评估特定子集
}
},
limit=10, # 正式评估时请删除此行
)
run_task(task_cfg=task_cfg)