参数说明#
执行 evalscope perf --help 可获取全部参数说明。
基本设置#
参数 |
类型 |
说明 |
默认值 |
|---|---|---|---|
|
|
测试模型名称,或模型路径 |
- |
|
|
API地址,支持 |
- |
|
|
wandb/swanlab数据库结果名称和结果数据库名称 |
|
|
|
服务API类型 |
- |
|
|
本地推理服务端口 |
|
|
|
Attention实现方式 |
|
|
|
API密钥 |
|
|
|
是否输出调试信息 |
|
网络配置#
参数 |
类型 |
说明 |
默认值 |
|---|---|---|---|
|
|
每个请求的总超时时间(秒) |
|
|
|
网络连接超时(秒) |
|
|
|
网络读取超时(秒) |
|
|
|
额外的HTTP头 |
- |
|
|
不发送连接测试,直接开始压测 |
|
请求控制#
参数 |
类型 |
说明 |
默认值 |
|---|---|---|---|
|
|
并发请求的数量 |
|
|
|
发出的请求总数量 |
|
|
|
每秒生成的请求数量 |
|
|
|
每N个查询记录日志 |
|
|
|
是否使用SSE流输出 |
|
|
|
每次性能测试之间的休眠时间(秒) |
|
小技巧
在本工具的实现中请求生成与发送是分开的:
--rate参数控制每秒生成的请求数量,请求将放入请求队列--parallel参数控制发送请求的worker数量,worker从请求队列获取请求并发送,且在上一请求回复后才发送下一请求
Prompt设置#
参数 |
类型 |
说明 |
默认值 |
|---|---|---|---|
|
|
最大输入prompt长度 |
|
|
|
最小输入prompt长度 |
|
|
|
prompt的前缀长度 |
|
|
|
指定请求prompt |
- |
|
|
指定查询模板 |
- |
|
|
是否应用聊天模板 |
|
|
|
随机VL数据集图像宽度 |
|
|
|
随机VL数据集图像高度 |
|
|
|
随机VL数据集图像格式 |
|
|
|
随机VL数据集图像数量 |
|
|
|
图像的patch大小 |
|
数据集配置#
参数 |
类型 |
说明 |
默认值 |
|---|---|---|---|
|
|
数据集模式,详见下表 |
- |
|
|
数据集文件路径 |
- |
dataset 模式说明#
模式 |
说明 |
支持dataset-path |
|---|---|---|
|
从ModelScope自动下载OpenQA |
✓ |
|
从ModelScope自动下载LongAlpaca-12k |
✓ |
|
逐行将txt文件的每一行作为一个prompt |
✓(必需) |
|
从ModelScope自动下载Flick8k |
✗ |
|
从ModelScope自动下载Kontext-Bench |
✗ |
|
根据 |
✗ |
|
随机生成图像和文本输入 |
✗ |
|
自定义数据集解析器 |
✓ |
模型设置#
参数 |
类型 |
说明 |
默认值 |
|---|---|---|---|
|
|
分词器权重路径 |
|
|
|
frequency_penalty值 |
- |
|
|
是否返回对数概率 |
- |
|
|
可以生成的最大token数量 |
- |
|
|
生成的最少token数量 |
- |
|
|
生成的补全选择数量 |
- |
|
|
随机种子 |
|
|
|
停止生成的tokens |
- |
|
|
停止生成的token ID列表 |
- |
|
|
采样温度 |
|
|
|
top_p采样 |
- |
|
|
top_k采样 |
- |
|
|
额外传入请求体的参数 |
- |
数据存储#
参数 |
类型 |
说明 |
默认值 |
|---|---|---|---|
|
|
可视化工具 |
|
|
|
wandb API密钥 |
- |
|
|
swanlab API密钥 |
- |
|
|
输出文件路径 |
|
|
|
输出目录不包含时间戳 |
|
其他参数#
参数 |
类型 |
说明 |
默认值 |
|---|---|---|---|
|
|
在写入SQLite数据库前缓冲的行数 |
|
|
|
请求队列的最大大小 |
|
|
|
最大调度任务数 |
|