Skip to content
EvalScope
文档
博客
Toggle navigation menu
⌘
K
EvalScope
/
模型推理性能压测
模型推理性能压测
#
一个大语言模型的压力测试工具,可以自定义以支持各种数据集格式和不同的API协议格式,默认支持OpenAI API格式。
快速开始
环境准备
基本使用
可视化测试结果
参数说明
基本设置
网络配置
请求控制
SLA设置
Prompt设置
数据集配置
模型设置
数据存储
多轮对话设置
其他参数
使用示例
使用本地模型推理
使用
prompt
复杂请求
使用
query-template
使用random数据集
使用random图文数据集
Embedding模型压测
Rerank模型压测
Open-loop 开放环路模式
Warmup 预热压测
调试请求
可视化测试结果
多轮对话压测
功能特性
参数说明
工作流程
数据集
SLA 自动调优
功能特性
参数说明
支持的指标与操作符
--sla-params
逻辑说明
工作流程
使用示例
速度基准测试
在线API推理
本地Transformer推理
本地vLLM推理
vLLM Bench vs Evalscope Perf 压测对比
TL;DR
环境与前置条件
启动服务
参数对齐指南
一致性校验:最小示例(1 并发 / 1 请求)
规模压测:50 并发 / 1000 请求
指标口径与命名对照
常见误差来源与排查建议
自定义使用
自定义结果分析
自定义请求 API
自定义数据集
注意事项
RAGAS
快速开始
Back to top