PaddlePaddle · chenjiaoAngel · Sep 10, 2021 · Aug 20, 2021 · Aug 20, 2021 · Aug 22, 2021
@@ -32,6 +32,15 @@ void sincos256_ps(v8sf x, v8sf *s, v8sf *c);
 // FMA support
 #ifndef __AVX2__
 #define _mm256_fmadd_ps(a, b, c) _mm256_add_ps(c, _mm256_mul_ps(a, b))
+#define _mm256_permutevar8x32_ps(a, b)                  \
+  _mm256_setr_ps(*((float *)(&a) + *((int *)(&b))),     \
+                 *((float *)(&a) + *((int *)(&b) + 1)), \
+                 *((float *)(&a) + *((int *)(&b) + 2)), \
+                 *((float *)(&a) + *((int *)(&b) + 3)), \
+                 *((float *)(&a) + *((int *)(&b) + 4)), \
+                 *((float *)(&a) + *((int *)(&b) + 5)), \
+                 *((float *)(&a) + *((int *)(&b) + 6)), \
+                 *((float *)(&a) + *((int *)(&b) + 7)))
 #endif
 
 }  // namespace math