基于ppdetction框架模型的速度 #9248

dsdsknfsk · 2024-12-19T07:00:50Z

问题确认 Search before asking

我已经搜索过问题，但是没有找到解答。I have searched the question and found no related answer.

请提出你的问题 Please ask your question

现有一个ppdetection框架下的模型（gfl目标检测模型），推理时模型的FPS值（衡量速度的一个指标）会随着batchsize的增大而降低，FLOPS（总运算量）会随着batchsize的增大而增加，请问这是为什么？（尝试了增大CPU内存和num_workers值，但仍然没有帮助）
部分结果和实验设置如下：

changdazhou · 2024-12-19T13:02:54Z

请问是哪个模型呢，我们复测一下看看，影响性能的因素比较多，可能和机器的吞吐量，多卡通信效率等都有直接关系，建议测试的时候记录一下CPU利用率，内存利用率，GPU显存和利用率的占用情况，观察是是否是达到了GPU瓶颈

dsdsknfsk · 2024-12-20T02:27:18Z

模型结构和配置文件对应的模型完全一致。 @changdazhou

dsdsknfsk · 2024-12-20T09:48:04Z

这个现象似乎是正常，因为每个batch内的图像形状必须对齐，例如batchsize=2时，image1.shape=[800,1216],image2=[1216,800]，那么两张图像都会通过0填充到[1216,1216]。当batchsize越大，形状不对齐的情况越多，需要填充的越多。因此计算量会增大。

changdazhou · 2024-12-24T12:14:32Z

是的，同一batch尺寸必须对齐

paddle-bot bot assigned lyuwenyu Dec 19, 2024

TingquanGao assigned changdazhou Dec 19, 2024

dsdsknfsk changed the title ~~基于ppdetction框架模型剪枝后的速度~~ 基于ppdetction框架模型的速度 Dec 20, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

基于ppdetction框架模型的速度 #9248

基于ppdetction框架模型的速度 #9248

dsdsknfsk commented Dec 19, 2024 •

edited

Loading

changdazhou commented Dec 19, 2024

dsdsknfsk commented Dec 20, 2024 •

edited

Loading

dsdsknfsk commented Dec 20, 2024

changdazhou commented Dec 24, 2024

基于ppdetction框架模型的速度 #9248

基于ppdetction框架模型的速度 #9248

Comments

dsdsknfsk commented Dec 19, 2024 • edited Loading

问题确认 Search before asking

请提出你的问题 Please ask your question

changdazhou commented Dec 19, 2024

dsdsknfsk commented Dec 20, 2024 • edited Loading

dsdsknfsk commented Dec 20, 2024

changdazhou commented Dec 24, 2024

dsdsknfsk commented Dec 19, 2024 •

edited

Loading

dsdsknfsk commented Dec 20, 2024 •

edited

Loading