[X86] Add missing subvector_subreg_lowering for BF16 #83720

phoebewang · 2024-03-03T11:41:24Z

Fixes: #83358

llvmbot · 2024-03-03T11:41:53Z

@llvm/pr-subscribers-backend-x86

Author: Phoebe Wang (phoebewang)

Changes

Fixes: #83358

Full diff: https://github.com/llvm/llvm-project/pull/83720.diff

2 Files Affected:

(modified) llvm/lib/Target/X86/X86InstrVecCompiler.td (+3)
(modified) llvm/test/CodeGen/X86/avx512bf16-vl-intrinsics.ll (+22)

diff --git a/llvm/lib/Target/X86/X86InstrVecCompiler.td b/llvm/lib/Target/X86/X86InstrVecCompiler.td
index bbd19cf8d5b25e..461b2badc13134 100644
--- a/llvm/lib/Target/X86/X86InstrVecCompiler.td
+++ b/llvm/lib/Target/X86/X86InstrVecCompiler.td
@@ -83,6 +83,7 @@ defm : subvector_subreg_lowering<VR128, v2f64, VR256, v4f64,  sub_xmm>;
 defm : subvector_subreg_lowering<VR128, v8i16, VR256, v16i16, sub_xmm>;
 defm : subvector_subreg_lowering<VR128, v16i8, VR256, v32i8,  sub_xmm>;
 defm : subvector_subreg_lowering<VR128, v8f16, VR256, v16f16, sub_xmm>;
+defm : subvector_subreg_lowering<VR128, v8bf16, VR256, v16bf16, sub_xmm>;
 
 // A 128-bit subvector extract from the first 512-bit vector position is a
 // subregister copy that needs no instruction. Likewise, a 128-bit subvector
@@ -95,6 +96,7 @@ defm : subvector_subreg_lowering<VR128, v2f64, VR512, v8f64,  sub_xmm>;
 defm : subvector_subreg_lowering<VR128, v8i16, VR512, v32i16, sub_xmm>;
 defm : subvector_subreg_lowering<VR128, v16i8, VR512, v64i8,  sub_xmm>;
 defm : subvector_subreg_lowering<VR128, v8f16, VR512, v32f16, sub_xmm>;
+defm : subvector_subreg_lowering<VR128, v8bf16, VR512, v32bf16, sub_xmm>;
 
 // A 128-bit subvector extract from the first 512-bit vector position is a
 // subregister copy that needs no instruction. Likewise, a 128-bit subvector
@@ -107,6 +109,7 @@ defm : subvector_subreg_lowering<VR256, v4f64,  VR512, v8f64,  sub_ymm>;
 defm : subvector_subreg_lowering<VR256, v16i16, VR512, v32i16, sub_ymm>;
 defm : subvector_subreg_lowering<VR256, v32i8,  VR512, v64i8,  sub_ymm>;
 defm : subvector_subreg_lowering<VR256, v16f16, VR512, v32f16, sub_ymm>;
+defm : subvector_subreg_lowering<VR256, v16bf16, VR512, v32bf16, sub_ymm>;
 
 
 // If we're inserting into an all zeros vector, just use a plain move which
diff --git a/llvm/test/CodeGen/X86/avx512bf16-vl-intrinsics.ll b/llvm/test/CodeGen/X86/avx512bf16-vl-intrinsics.ll
index 0826faa1071b01..482713e12d15c7 100644
--- a/llvm/test/CodeGen/X86/avx512bf16-vl-intrinsics.ll
+++ b/llvm/test/CodeGen/X86/avx512bf16-vl-intrinsics.ll
@@ -381,3 +381,25 @@ entry:
   %1 = shufflevector <8 x bfloat> %0, <8 x bfloat> undef, <16 x i32> zeroinitializer
   ret <16 x bfloat> %1
 }
+
+define <16 x i32> @pr83358() {
+; X86-LABEL: pr83358:
+; X86:       # %bb.0:
+; X86-NEXT:    vcvtneps2bf16y {{\.?LCPI[0-9]+_[0-9]+}}, %xmm0 # encoding: [0x62,0xf2,0x7e,0x28,0x72,0x05,A,A,A,A]
+; X86-NEXT:    # fixup A - offset: 6, value: {{\.?LCPI[0-9]+_[0-9]+}}, kind: FK_Data_4
+; X86-NEXT:    vshufi64x2 $0, %zmm0, %zmm0, %zmm0 # encoding: [0x62,0xf3,0xfd,0x48,0x43,0xc0,0x00]
+; X86-NEXT:    # zmm0 = zmm0[0,1,0,1,0,1,0,1]
+; X86-NEXT:    retl # encoding: [0xc3]
+;
+; X64-LABEL: pr83358:
+; X64:       # %bb.0:
+; X64-NEXT:    vcvtneps2bf16y {{\.?LCPI[0-9]+_[0-9]+}}(%rip), %xmm0 # encoding: [0x62,0xf2,0x7e,0x28,0x72,0x05,A,A,A,A]
+; X64-NEXT:    # fixup A - offset: 6, value: {{\.?LCPI[0-9]+_[0-9]+}}-4, kind: reloc_riprel_4byte
+; X64-NEXT:    vshufi64x2 $0, %zmm0, %zmm0, %zmm0 # encoding: [0x62,0xf3,0xfd,0x48,0x43,0xc0,0x00]
+; X64-NEXT:    # zmm0 = zmm0[0,1,0,1,0,1,0,1]
+; X64-NEXT:    retq # encoding: [0xc3]
+  %1 = call <8 x bfloat> @llvm.x86.avx512bf16.cvtneps2bf16.256(<8 x float> <float 1.000000e+00, float 2.000000e+00, float 3.000000e+00, float 4.000000e+00, float 5.000000e+00, float 6.000000e+00, float 7.000000e+00, float 8.000000e+00>)
+  %2 = bitcast <8 x bfloat> %1 to <4 x i32>
+  %3 = shufflevector <4 x i32> %2, <4 x i32> undef, <16 x i32> <i32 0, i32 1, i32 2, i32 3, i32 0, i32 1, i32 2, i32 3, i32 0, i32 1, i32 2, i32 3, i32 0, i32 1, i32 2, i32 3>
+  ret <16 x i32> %3
+}

Fixes: llvm#83358

FreddyLeaf

LGTM

phoebewang · 2024-03-04T03:09:42Z

/cherry-pick ff72c83

Fixes: llvm#83358 (cherry picked from commit ff72c83)

llvmbot · 2024-03-04T03:15:05Z

/pull-request #83758

phoebewang · 2024-03-04T09:31:29Z

/cherry-pick phoebewang@7210a98

llvmbot · 2024-03-04T09:36:22Z

Failed to cherry-pick: phoebewang@7210a98

https://github.com/llvm/llvm-project/actions/runs/8138104765

Please manually backport the fix and push it to your github fork. Once this is done, please create a pull request

phoebewang · 2024-03-04T10:15:03Z

/cherry-pick phoebewang@6d03789

llvmbot · 2024-03-04T10:19:58Z

Failed to cherry-pick: phoebewang@6d03789

https://github.com/llvm/llvm-project/actions/runs/8138596982

Please manually backport the fix and push it to your github fork. Once this is done, please create a pull request

Fixes: llvm#83358 (cherry picked from commit ff72c83)

nikic · 2024-03-12T19:56:08Z

For the record, the final backport PR for this is #83834.

llvmbot added the backend:X86 label Mar 3, 2024

phoebewang requested review from RKSimon and FreddyLeaf March 3, 2024 12:10

[X86] Add missing subvector_subreg_lowering for BF16

d86baa8

Fixes: llvm#83358

phoebewang force-pushed the bf16 branch from 4bd5ac2 to d86baa8 Compare March 3, 2024 13:00

FreddyLeaf approved these changes Mar 4, 2024

View reviewed changes

phoebewang merged commit ff72c83 into llvm:main Mar 4, 2024
4 checks passed

phoebewang deleted the bf16 branch March 4, 2024 02:15

phoebewang added this to the LLVM 18.X Release milestone Mar 4, 2024

llvmbot pushed a commit to llvmbot/llvm-project that referenced this pull request Mar 4, 2024

[X86] Add missing subvector_subreg_lowering for BF16 (llvm#83720)

9a640ef

Fixes: llvm#83358 (cherry picked from commit ff72c83)

phoebewang added a commit to phoebewang/llvm-project that referenced this pull request Mar 4, 2024

[X86] Add missing subvector_subreg_lowering for BF16 (llvm#83720)

7210a98

llvmbot added the release:cherry-pick-failed label Mar 4, 2024

phoebewang added a commit to phoebewang/llvm-project that referenced this pull request Mar 4, 2024

[X86] Add missing subvector_subreg_lowering for BF16 (llvm#83720)

6d03789

llvmbot pushed a commit to llvmbot/llvm-project that referenced this pull request Mar 8, 2024

[X86] Add missing subvector_subreg_lowering for BF16 (llvm#83720)

d7a7ea3

Fixes: llvm#83358 (cherry picked from commit ff72c83)

llvmbot pushed a commit to llvmbot/llvm-project that referenced this pull request Mar 8, 2024

[X86] Add missing subvector_subreg_lowering for BF16 (llvm#83720)

54e0170

Fixes: llvm#83358 (cherry picked from commit ff72c83)

phoebewang added a commit to phoebewang/llvm-project that referenced this pull request Mar 13, 2024

[X86] Add missing subvector_subreg_lowering for BF16 (llvm#83720)

9cec3b7

tstellar pushed a commit to phoebewang/llvm-project that referenced this pull request Mar 19, 2024

[X86] Add missing subvector_subreg_lowering for BF16 (llvm#83720)

26a1d66

pointhex mentioned this pull request May 7, 2024

getStyleDiagHandler #91314

Closed

aemerson mentioned this pull request May 9, 2024

release/18.x: [AArc64][GlobalISel] Fix legalizer assert for G_INSERT_VECTOR_ELT - manual merge #91672

Merged

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[X86] Add missing subvector_subreg_lowering for BF16 #83720

[X86] Add missing subvector_subreg_lowering for BF16 #83720

phoebewang commented Mar 3, 2024

llvmbot commented Mar 3, 2024

FreddyLeaf left a comment

phoebewang commented Mar 4, 2024

llvmbot commented Mar 4, 2024

phoebewang commented Mar 4, 2024

llvmbot commented Mar 4, 2024

phoebewang commented Mar 4, 2024

llvmbot commented Mar 4, 2024

nikic commented Mar 12, 2024

[X86] Add missing subvector_subreg_lowering for BF16 #83720

[X86] Add missing subvector_subreg_lowering for BF16 #83720

Conversation

phoebewang commented Mar 3, 2024

llvmbot commented Mar 3, 2024

FreddyLeaf left a comment

Choose a reason for hiding this comment

phoebewang commented Mar 4, 2024

llvmbot commented Mar 4, 2024

phoebewang commented Mar 4, 2024

llvmbot commented Mar 4, 2024

phoebewang commented Mar 4, 2024

llvmbot commented Mar 4, 2024

nikic commented Mar 12, 2024