armv7 kernel for sparse conv pass #6911

hcms1994 · 2021-09-10T08:11:59Z

这个PR是#6836 中描述的第三个子PR。基于汇编语言，具体实现了armv7架构下的SpMM（Sparse Matrix Multiplication，稀疏矩阵乘法），用以加速1x1卷积运算。该实现具备以下功能点：

支持fp32-fp32，int8-fp32，int8-int8三种conv1x1 op的稀疏化运算，用以替代GEMM。
相比较GEMM，SpMM在低、中、高端手机上速度均达到加速效果。同时在mobilenet系列模型上验证加速收益。

paddle-bot-old · 2021-09-10T08:12:12Z

Thanks for your contribution!

chenjiaoAngel

请添加单测，用于正确性验证。可以放在lite/test/kernel或lite/tests/math 目录下，内容可参考lite/tests/math/sgemm_compute_test.cc 和 lite/tests/math/conv_int8_compute_test.cc

lite/backends/arm/math/sparse_conv_impl.cc

lite/tests/math/sparse_conv_f32_compute_test.cc

lite/tests/math/sparse_conv_int8_compute_test.cc

lite/tests/math/sparse_conv_f32_compute_test.cc

lite/tests/math/sparse_conv_int8_compute_test.cc

chenjiaoAngel

LGTM

armv7 kernel for sparse conv pass

2d763b3

chenjiaoAngel reviewed Sep 13, 2021

View reviewed changes

lite/backends/arm/math/sparse_conv_impl.cc Outdated Show resolved Hide resolved

hcms1994 closed this Sep 13, 2021

hcms1994 reopened this Sep 13, 2021

hcms1994 and others added 5 commits September 13, 2021 06:55

add function definition and calculation method(v7)

2408bc3

Merge branch 'develop' into sparse_conv_kernel_v7

9b6182d

merge armv8 kernel

61ab7da

add sparse kernel test case

096fbdb

fix sparse-f32 test bug

70b42c3

chenjiaoAngel reviewed Sep 15, 2021

View reviewed changes

lite/tests/math/sparse_conv_f32_compute_test.cc Outdated Show resolved Hide resolved

chenjiaoAngel reviewed Sep 15, 2021

View reviewed changes

lite/tests/math/sparse_conv_int8_compute_test.cc Outdated Show resolved Hide resolved

chenjiaoAngel reviewed Sep 15, 2021

View reviewed changes

lite/tests/math/sparse_conv_f32_compute_test.cc Outdated Show resolved Hide resolved

chenjiaoAngel reviewed Sep 15, 2021

View reviewed changes

lite/tests/math/sparse_conv_int8_compute_test.cc Outdated Show resolved Hide resolved

hcms1994 and others added 2 commits September 15, 2021 07:04

fix not arm run bug

fadb476

Merge branch 'develop' into sparse_conv_kernel_v7

76fef4a

chenjiaoAngel approved these changes Sep 16, 2021

View reviewed changes

chenjiaoAngel merged commit f6b9913 into PaddlePaddle:develop Sep 16, 2021

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

armv7 kernel for sparse conv pass #6911

armv7 kernel for sparse conv pass #6911

hcms1994 commented Sep 10, 2021 •

edited

Loading

paddle-bot-old bot commented Sep 10, 2021

chenjiaoAngel left a comment

chenjiaoAngel left a comment

armv7 kernel for sparse conv pass #6911

armv7 kernel for sparse conv pass #6911

Conversation

hcms1994 commented Sep 10, 2021 • edited Loading

paddle-bot-old bot commented Sep 10, 2021

chenjiaoAngel left a comment

Choose a reason for hiding this comment

chenjiaoAngel left a comment

Choose a reason for hiding this comment

hcms1994 commented Sep 10, 2021 •

edited

Loading