[OpenCL]optimize conv3x3 when group==1 #5618

daming5432 · 2021-03-04T03:37:37Z

该实现主要对filter进行了重排以及一些其他修改。优化前后效果对比如下图：
图中数据均为 armv7 编译产物测得。

paddle-bot-old · 2021-03-04T03:37:45Z

Thanks for your contribution!

zhaoyang-star · 2021-03-05T03:49:53Z

lite/backends/opencl/cl_kernel/image/conv2d_3x3_opt_kernel.cl

-  int in_w_id2 = in_w_id1 + item_w * stride;
-  int in_w_id3 = in_w_id2 + item_w * stride;
-  int in_w_id4 = in_w_id3 + item_w * stride;
+  int in_h_id  = mad24((item_h_id % out_h), stride, (-pad));


直接写乘加实现，与显式使用mad24，单纯修改这类有多少性能提升，测试过这个吗？

这个我单测时测过，没有特别明显的变化，模型没有对应单独测，我再测一下。mad24手册上是建议对性考虑时优先使用

zhaoyang-star · 2021-03-05T03:59:19Z

lite/backends/opencl/cl_kernel/image/conv2d_3x3_opt_kernel.cl

      for (int w = 0; w < 3; w++) {
        int in_w_val0 = select(in_w_base_id + in_w_id0 + w,
                               -1,
-                               (in_w_id0 + w < 0 || in_w_id0 + w >= in_w));
+                               (in_w_id0 + w < 0 | in_w_id0 + w >= in_w));


同上，按位与操作比或操作，有多少性能提升，可以单独测下只修改此处的性能变化，如果有提升，select 都可以按此方式修改下。

嗯嗯，我直接用模型再测一下，上次测得模型都是未tune的，这次测试把tune之后的性能变化也补上。本来是修改成int in_w_val0 = ((in_w_base_id + in_w_id0 + w + 1) & -(in_w_id0 + w >= 0 & in_w_id0 + w < in_w)) - 1这种的，发现如果不修改filter实现方式性能有提升，修改后加上这个修改性能反而下降。

zhaoyang-star

两处 comments

daming5432

test

daming5432 · 2021-03-05T04:56:02Z

lite/backends/opencl/cl_kernel/image/conv2d_3x3_opt_kernel.cl

-  int in_w_id2 = in_w_id1 + item_w * stride;
-  int in_w_id3 = in_w_id2 + item_w * stride;
-  int in_w_id4 = in_w_id3 + item_w * stride;
+  int in_h_id  = mad24((item_h_id % out_h), stride, (-pad));


这个我单测时测过，没有特别明显的变化，模型没有对应单独测，我再测一下。mad24手册上是建议对性考虑时优先使用

daming5432 · 2021-03-05T05:02:04Z

lite/backends/opencl/cl_kernel/image/conv2d_3x3_opt_kernel.cl

      for (int w = 0; w < 3; w++) {
        int in_w_val0 = select(in_w_base_id + in_w_id0 + w,
                               -1,
-                               (in_w_id0 + w < 0 || in_w_id0 + w >= in_w));
+                               (in_w_id0 + w < 0 | in_w_id0 + w >= in_w));


嗯嗯，我直接用模型再测一下，上次测得模型都是未tune的，这次测试把tune之后的性能变化也补上。本来是修改成int in_w_val0 = ((in_w_base_id + in_w_id0 + w + 1) & -(in_w_id0 + w >= 0 & in_w_id0 + w < in_w)) - 1这种的，发现如果不修改filter实现方式性能有提升，修改后加上这个修改性能反而下降。

zhaoyang-star

LGTM

ysh329

LGTM

optimize conv3x3 when group==1 test=develop

6ea0341

zhaoyang-star reviewed Mar 5, 2021

View reviewed changes

daming5432 commented Mar 5, 2021

View reviewed changes

daming5432 added 2 commits March 15, 2021 11:11

fix merge conflict test=develop

6a3fcfa

fix merge conflict test=develop

026007f

zhaoyang-star approved these changes Mar 26, 2021

View reviewed changes

test=develop

bd653ec

ysh329 approved these changes Mar 26, 2021

View reviewed changes

daming5432 merged commit c33eb44 into PaddlePaddle:develop Mar 29, 2021

daming5432 deleted the conv3x3_opt_opencl branch March 29, 2021 04:34

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[OpenCL]optimize conv3x3 when group==1 #5618

[OpenCL]optimize conv3x3 when group==1 #5618

daming5432 commented Mar 4, 2021 •

edited by zhaoyang-star

Loading

paddle-bot-old bot commented Mar 4, 2021

zhaoyang-star Mar 5, 2021

daming5432 Mar 5, 2021

zhaoyang-star Mar 5, 2021

daming5432 Mar 5, 2021

zhaoyang-star left a comment

daming5432 left a comment •

edited

Loading

daming5432 Mar 5, 2021

daming5432 Mar 5, 2021

zhaoyang-star left a comment

ysh329 left a comment

[OpenCL]optimize conv3x3 when group==1 #5618

[OpenCL]optimize conv3x3 when group==1 #5618

Conversation

daming5432 commented Mar 4, 2021 • edited by zhaoyang-star Loading

paddle-bot-old bot commented Mar 4, 2021

zhaoyang-star Mar 5, 2021

Choose a reason for hiding this comment

daming5432 Mar 5, 2021

Choose a reason for hiding this comment

zhaoyang-star Mar 5, 2021

Choose a reason for hiding this comment

daming5432 Mar 5, 2021

Choose a reason for hiding this comment

zhaoyang-star left a comment

Choose a reason for hiding this comment

daming5432 left a comment • edited Loading

Choose a reason for hiding this comment

daming5432 Mar 5, 2021

Choose a reason for hiding this comment

daming5432 Mar 5, 2021

Choose a reason for hiding this comment

zhaoyang-star left a comment

Choose a reason for hiding this comment

ysh329 left a comment

Choose a reason for hiding this comment

daming5432 commented Mar 4, 2021 •

edited by zhaoyang-star

Loading

daming5432 left a comment •

edited

Loading