[FD CLI] Add bench cli #4160

ZhangYulongg · 2025-09-17T12:25:10Z

增加fastdeploy bench cli：

latency：离线推理延时
示例：
fastdeploy bench latency --model /ModelData/ERNIE-4.5-0.3B-Paddle
serve：服务化推理吞吐、延时
示例：
参数与benchmarks脚本一致
fastdeploy bench serve
--backend openai-chat
--label test
--model EB45T
--host 0.0.0.0
--port 42688
--dataset-name EBChat
--hyperparameter-path test.yaml
--percentile-metrics ttft,tpot,itl,e2el,s_ttft,s_itl,s_e2el,s_decode,input_len,s_input_len,output_len
--metric-percentiles 80,95,99,99.9,99.95,99.99
--dataset-path ./filtered_sharedgpt_2000_input_1136_output_200_fd.json
--num-prompts 10
--max-concurrency 10

paddle-bot · 2025-09-17T12:25:15Z

Thanks for your contribution!

add bench cli

5fbbef1

paddle-bot bot added the contributor External developers label Sep 17, 2025

ZhangYulongg added 3 commits September 17, 2025 22:16

Merge branch 'develop' into bench_cli

bb31889

Update test_main.py

2fad673

Merge branch 'develop' into bench_cli

00207aa

EmmonsCurse approved these changes Sep 22, 2025

View reviewed changes

EmmonsCurse merged commit 5532e8a into PaddlePaddle:develop Sep 22, 2025
31 of 39 checks passed

Provide feedback