@@ -74,16 +74,16 @@ define weak_odr <16 x i16> @hadd_pmadd_i8_avx2(<32 x i8> %a) nounwind alwaysinli
7474declare <16 x i16 > @llvm.x86.avx2.pmadd.ub.sw (<32 x i8 >, <32 x i8 >) nounwind readnone
7575
7676define weak_odr <16 x i16 > @phaddw_avx2 (<32 x i16 > %a ) nounwind alwaysinline {
77- %1 = shufflevector <32 x i16 > %a , <32 x i16 > undef , <16 x i32 > <i32 0 , i32 1 , i32 2 , i32 3 , i32 4 , i32 5 , i32 6 , i32 7 , i32 8 , i32 9 , i32 10 , i32 11 , i32 12 , i32 13 , i32 14 , i32 15 >
78- %2 = shufflevector <32 x i16 > %a , <32 x i16 > undef , <16 x i32 > <i32 16 , i32 17 , i32 18 , i32 19 , i32 20 , i32 21 , i32 22 , i32 23 , i32 24 , i32 25 , i32 26 , i32 27 , i32 28 , i32 29 , i32 30 , i32 31 >
77+ %1 = shufflevector <32 x i16 > %a , <32 x i16 > undef , <16 x i32 > <i32 0 , i32 1 , i32 2 , i32 3 , i32 4 , i32 5 , i32 6 , i32 7 , i32 16 , i32 17 , i32 18 , i32 19 , i32 20 , i32 21 , i32 22 , i32 23 >
78+ %2 = shufflevector <32 x i16 > %a , <32 x i16 > undef , <16 x i32 > <i32 8 , i32 9 , i32 10 , i32 11 , i32 12 , i32 13 , i32 14 , i32 15 , i32 24 , i32 25 , i32 26 , i32 27 , i32 28 , i32 29 , i32 30 , i32 31 >
7979 %3 = tail call <16 x i16 > @llvm.x86.avx2.phadd.w (<16 x i16 > %1 , <16 x i16 > %2 )
8080 ret <16 x i16 > %3
8181}
8282declare <16 x i16 > @llvm.x86.avx2.phadd.w (<16 x i16 >, <16 x i16 >) nounwind readnone
8383
8484define weak_odr <8 x i32 > @phaddd_avx2 (<16 x i32 > %a ) nounwind alwaysinline {
85- %1 = shufflevector <16 x i32 > %a , <16 x i32 > undef , <8 x i32 > <i32 0 , i32 1 , i32 2 , i32 3 , i32 4 , i32 5 , i32 6 , i32 7 >
86- %2 = shufflevector <16 x i32 > %a , <16 x i32 > undef , <8 x i32 > <i32 8 , i32 9 , i32 10 , i32 11 , i32 12 , i32 13 , i32 14 , i32 15 >
85+ %1 = shufflevector <16 x i32 > %a , <16 x i32 > undef , <8 x i32 > <i32 0 , i32 1 , i32 2 , i32 3 , i32 8 , i32 9 , i32 10 , i32 11 >
86+ %2 = shufflevector <16 x i32 > %a , <16 x i32 > undef , <8 x i32 > <i32 4 , i32 5 , i32 6 , i32 7 , i32 12 , i32 13 , i32 14 , i32 15 >
8787 %3 = tail call <8 x i32 > @llvm.x86.avx2.phadd.d (<8 x i32 > %1 , <8 x i32 > %2 )
8888 ret <8 x i32 > %3
8989}
0 commit comments