apache · szha · Nov 17, 2018 · May 24, 2018 · May 24, 2018 · May 25, 2018
diff --git a/src/operator/nn/mkldnn/mkldnn_pooling-inl.h b/src/operator/nn/mkldnn/mkldnn_pooling-inl.h
@@ -87,23 +87,8 @@ inline bool SupportMKLDNNPooling(const PoolingParam &param) {
 inline bool SupportMKLDNNPooling(const PoolingParam &param,
                                  const TShape &dshape) {
   bool ret = SupportMKLDNNPooling(param);
-  if (!ret)
-    return false;
 
-  if (param.pooling_convention == pool_enum::kValid)
-    return true;
-  else
-    return false;
-
-// need to support pooling convention full
-// https://issues.apache.org/jira/browse/MXNET-33
-#if 0
-  if (((dshape[2] + 2 * param.pad[0] - param.kernel[0]) % param.stride[0] == 0) &&
-      ((dshape[3] + 2 * param.pad[1] - param.kernel[1]) % param.stride[1] == 0))
-    return true;
-  else
-    return false;
-#endif
+  return ret;
 }
 
 inline bool MKLDNNRequireWorkspace(const PoolingParam &param) {

diff --git a/src/operator/nn/mkldnn/mkldnn_pooling.cc b/src/operator/nn/mkldnn/mkldnn_pooling.cc
@@ -150,6 +150,16 @@ mkldnn::pooling_forward::primitive_desc GetPoolingFwd(const PoolingParam &param,
   int pad_l_ = param.pad[1], pad_r_ = param.pad[1];
   int stride_h_ = param.stride[0], stride_w_ = param.stride[1];
 
+  if (param.pooling_convention == pool_enum::kFull) {
+    if ((data_md.data.dims[2] + pad_t_ + pad_b_ - kernel_h_) % stride_h_ != 0) {
+      pad_b_ += stride_h_ - ((data_md.data.dims[2] + pad_t_ + pad_b_ - kernel_h_) % stride_h_);
+    }
+
+    if ((data_md.data.dims[3] + pad_l_ + pad_r_ - kernel_w_) % stride_w_ != 0) {
+      pad_r_ += stride_w_ - ((data_md.data.dims[3] + pad_l_ + pad_r_ - kernel_w_) % stride_w_);
+    }
+  }
+
   const mkldnn::engine engine = CpuEngine::Get()->get_engine();
   if (param.global_pool) {
     pad_t_ = pad_b_ = pad_l_ = pad_r_ = 0;
@@ -223,6 +233,16 @@ MKLDNNPoolingFwd &GetPoolingFwd(const PoolingParam &param,
     int pad_l_ = param.pad[1], pad_r_ = param.pad[1];
     int stride_h_ = param.stride[0], stride_w_ = param.stride[1];
 
+    if (param.pooling_convention == pool_enum::kFull) {
+      if ((data_md.data.dims[2] + pad_t_ + pad_b_ - kernel_h_) % stride_h_ != 0) {
+        pad_b_ += stride_h_ - ((data_md.data.dims[2] + pad_t_ + pad_b_ - kernel_h_) % stride_h_);
+      }
+
+      if ((data_md.data.dims[3] + pad_l_ + pad_r_ - kernel_w_) % stride_w_ != 0) {
+        pad_r_ += stride_w_ - ((data_md.data.dims[3] + pad_l_ + pad_r_ - kernel_w_) % stride_w_);
+      }
+    }
+
     if (param.global_pool) {
         pad_t_ = pad_b_ = pad_l_ = pad_r_ = 0;
         stride_h_ = stride_w_ = 1;
@@ -299,6 +319,17 @@ void MKLDNNPoolingGradCompute(const OpContext &ctx, const PoolingParam &param,
   int pad_t_ = param.pad[0], pad_b_ = param.pad[0];
   int pad_l_ = param.pad[1], pad_r_ = param.pad[1];
   int stride_h_ = param.stride[0], stride_w_ = param.stride[1];
+
+  if (param.pooling_convention == pool_enum::kFull) {
+    if ((data_md.data.dims[2] + pad_t_ + pad_b_ - kernel_h_) % stride_h_ != 0) {
+      pad_b_ += stride_h_ - ((data_md.data.dims[2] + pad_t_ + pad_b_ - kernel_h_) % stride_h_);
+    }
+
+    if ((data_md.data.dims[3] + pad_l_ + pad_r_ - kernel_w_) % stride_w_ != 0) {
+      pad_r_ += stride_w_ - ((data_md.data.dims[3] + pad_l_ + pad_r_ - kernel_w_) % stride_w_);
+    }
+  }
+
   if (param.global_pool) {
     pad_t_ = pad_b_ = pad_l_ = pad_r_ = 0;
     stride_h_ = stride_w_ = 1;

diff --git a/tests/python/gpu/test_operator_gpu.py b/tests/python/gpu/test_operator_gpu.py
@@ -920,6 +920,35 @@ def test_3d_pooling(pool_type, p_value=2):
     test_3d_pooling('lp', p_value=3)
 
 
+@with_seed()
+def test_pooling_full_2d():
+    def test_pooling_full_2d_type(pool_type):
+        data = (2, 2, 10, 10)
+        kernel = (4, 5)
+        pad = (1, 2)
+        stride = (3, 4)
+
+        convention = 'full'
+        ctx_list = []
+        sym_list = []
+
+        # o_h = ceil((10 + 1 + 1 - 4) / 3) + 1 = 4
+        # o_w = ceil((10 + 2 + 2 - 5) / 4) + 1 = 4
+        ctx_list.append({'ctx': mx.cpu(0), 'pool_data': data, 'type_dict': {'pool_data': np.float32}})
+        sym_list.append(mx.sym.Pooling(kernel=kernel, pad=pad, stride=stride, pool_type=pool_type,
+                                       pooling_convention=convention, global_pool=True, name='pool'))
+
+        ctx_list.append({'ctx': mx.gpu(0), 'pool_data': data, 'type_dict': {'pool_data': np.float32}})
+        sym_list.append(mx.sym.Pooling(kernel=kernel, pad=pad, stride=stride, pool_type=pool_type,
+                                       pooling_convention=convention, global_pool=True, name='pool'))
+
+        check_consistency(sym_list, ctx_list)
+
+    test_pooling_full_2d_type('max')
+    test_pooling_full_2d_type('avg')
+    test_pooling_full_2d_type('sum')
+
+
 @with_seed()
 def test_global_pooling():
     def test_1d_pooling(pool_type, p_value=2):