JIT: Improve x86 HWIntrinsic containment #110736

saucecontrol · 2024-12-16T13:01:52Z

This is another round of improvements for xarch HWIntrinsics containment. In summary it:

Simplifies IsContainableHWIntrinsicOp to use tuple type for size calculation where possible.
Fixes several more places where a load was improperly contained when the instruction memory size requirement was larger than the load.
Enables containment in more places it would have been valid but was missed before.
Enables EVEX embedded broadcast for 64-bit constant vectors on x86.

Diffs look good.

Notable Fixes

runtime/src/tests/JIT/HardwareIntrinsics/X86_Avx/Avx1/Compare.cs

Lines 65 to 72 in 1d69684

    
           var svf1 = Unsafe.Read<Vector128<float>>(floatTable.inArray1Ptr); 
        
           var svf2 = Unsafe.Read<Vector128<float>>(floatTable.inArray2Ptr); 
        
           var svf3 = Avx.Compare(svf1, svf2, FloatComparisonMode.OrderedEqualNonSignaling); 
        
           Unsafe.Write(floatTable.outArrayPtr, svf3); 
        
           var svd1 = Unsafe.Read<Vector128<double>>(doubleTable.inArray1Ptr); 
        
           var svd2 = Unsafe.Read<Vector128<double>>(doubleTable.inArray2Ptr); 
        
           var svd3 = Avx.Compare(svd1, svd2, FloatComparisonMode.OrderedEqualNonSignaling);

These were overreading before and are fixed now:

-       vmovups  xmm0, xmmword ptr [rbp-0x190]
-       vcmpps   ymm0, ymm0, ymmword ptr [rax], 0
+       vmovups  xmm0, xmmword ptr [rax]
+       vmovups  xmm1, xmmword ptr [rbp-0x190]
+       vcmpps   ymm0, ymm1, ymm0, 0

-       vmovups  xmm0, xmmword ptr [rbp-0x190]
-       vcmppd   ymm0, ymm0, ymmword ptr [rax], 0
+       vmovups  xmm0, xmmword ptr [rax]
+       vmovups  xmm1, xmmword ptr [rbp-0x190]
+       vcmppd   ymm0, ymm1, ymm0, 0

(actually, this was both an overread bug and an incorrect SIMD size bug -- both fixed now)

Similarly:

static unsafe Vector256<long> ShouldNotContainBroadcast(int* ptr)
{
    return Avx2.BroadcastScalarToVector256(Sse2.LoadScalarVector128(ptr).AsInt64());
}

-       vpbroadcastq ymm0, qword ptr [rdx]
+       vmovd        xmm0, dword ptr [rdx]
+       vpbroadcastq ymm0, ymm0

And:

static unsafe Vector128<double> ShouldNotOverReadCreateScalarUnsafe(float* ptr)
{
    return Vector128.CreateScalarUnsafe(Sse.LoadScalarVector128(ptr).AsDouble().ToScalar());
}

-       vmovsd   xmm0, qword ptr [rdx]
+       vmovss   xmm0, dword ptr [rdx]

dotnet-policy-service · 2024-12-16T13:02:30Z

Tagging subscribers to this area: @JulieLeeMSFT, @jakobbotsch
See info in area-owners.md if you want to be subscribed.

saucecontrol

@tannergooding this should be ready now -- just needs outer loop run.

I'll follow up with the ToScalar/GetLower containment I mentioned in another PR since this one's already quite involved.

src/coreclr/jit/hwintrinsic.cpp

src/coreclr/jit/lowerxarch.cpp

tannergooding · 2024-12-17T01:14:09Z

/azp run runtime-coreclr jitstress-isas-x86

azure-pipelines · 2024-12-17T01:14:26Z

Azure Pipelines successfully started running 1 pipeline(s).

saucecontrol · 2024-12-17T04:23:52Z

jitstress failures are more variations of the bogus assert fixed in #92183

Codegen for the test method on main is

movups   xmm0, xmmword ptr [rcx+0x08]
movups   xmm1, xmmword ptr [reloc @RWD00]
movaps   xmm2, xmm0
pblendvb xmm0, xmm1
movups   xmmword ptr [rdx], xmm0
mov      rax, rdx
ret

PR codegen with the assert corrected is the also valid

movups   xmm0, xmmword ptr [rcx+0x08]
movaps   xmm1, xmm0
pblendvb xmm0, xmmword ptr [reloc @RWD00]
movups   xmmword ptr [rdx], xmm0
mov      rax, rdx
ret

Containment of CNS_VEC with non-VEX encoding is one of the improvements in the update.

tannergooding · 2025-01-08T23:58:18Z

CC. @dotnet/jit-contrib for secondary review

ghost added the area-CodeGen-coreclr CLR JIT compiler in src/coreclr/src/jit and related components such as SuperPMI label Dec 16, 2024

dotnet-policy-service bot added the community-contribution Indicates that the PR has been added by a community member label Dec 16, 2024

improve x86 HWIntrinsic containment

f62e416

saucecontrol force-pushed the containment2 branch from cad9d40 to f62e416 Compare December 16, 2024 20:55

saucecontrol changed the title ~~[JIT] Improve HWIntrinsic containment logic~~ [JIT] Improve x86 HWIntrinsic containment Dec 16, 2024

build-analysis bot mentioned this pull request Dec 16, 2024

Test failure: baseservices/exceptions/stackoverflow/stackoverflowtester/stackoverflowtester.cmd #110173

Open

saucecontrol commented Dec 16, 2024

View reviewed changes

src/coreclr/jit/hwintrinsic.cpp Show resolved Hide resolved

src/coreclr/jit/lowerxarch.cpp Show resolved Hide resolved

saucecontrol marked this pull request as ready for review December 16, 2024 23:38

fix emitter asserts

2a32124

saucecontrol requested a review from MichalStrehovsky as a code owner December 18, 2024 19:18

fix Avx.Compare simd size, tidying

3db3b4d

saucecontrol force-pushed the containment2 branch from c0070d6 to 3db3b4d Compare December 18, 2024 19:23

MichalStrehovsky removed their request for review December 18, 2024 22:16

remove incorrect instruction mapping

bb7d716

This was referenced Jan 3, 2025

slow macOS - "##[error]The job running on agent Azure Pipelines 9 ran longer than the maximum time of 60 minutes." dotnet/dnceng#1883

Open

The Operation will be canceled. The next steps may not contain expected logs. dotnet/dnceng#3008

Open

saucecontrol changed the title ~~[JIT] Improve x86 HWIntrinsic containment~~ JIT: Improve x86 HWIntrinsic containment Jan 3, 2025

saucecontrol and others added 2 commits January 7, 2025 12:47

comment typo

7d490ff

Merge branch 'main' into containment2

30dae18

tannergooding approved these changes Jan 8, 2025

View reviewed changes

build-analysis bot mentioned this pull request Jan 9, 2025

ModuleNotFoundError: No module named 'pkg_resources' dotnet/dnceng#4756

Closed

3 tasks

Merge branch 'main' into containment2

b18472e

BruceForstall approved these changes Jan 9, 2025

View reviewed changes

tannergooding merged commit 08ea199 into dotnet:main Jan 10, 2025
111 of 116 checks passed

saucecontrol deleted the containment2 branch January 10, 2025 02:10

jakobbotsch mentioned this pull request Jan 20, 2025

JIT: Assertion failed 'isContainable || supportsRegOptional' during 'Generate code' #111613

Closed

This was referenced Jan 20, 2025

JIT: Handle containment for shift instructions with EVEX encoding #111644

Merged

JIT: IsContainableHWIntrinsicOp seems to discard many containment opportunities #92332

Closed

github-actions bot locked and limited conversation to collaborators Feb 9, 2025

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

JIT: Improve x86 HWIntrinsic containment #110736

JIT: Improve x86 HWIntrinsic containment #110736

Uh oh!

saucecontrol commented Dec 16, 2024 •

edited

Loading

Uh oh!

dotnet-policy-service bot commented Dec 16, 2024

Uh oh!

saucecontrol left a comment

Uh oh!

Uh oh!

Uh oh!

tannergooding commented Dec 17, 2024

Uh oh!

azure-pipelines bot commented Dec 17, 2024

Uh oh!

saucecontrol commented Dec 17, 2024 •

edited

Loading

Uh oh!

tannergooding commented Jan 8, 2025

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

	var svf1 = Unsafe.Read<Vector128<float>>(floatTable.inArray1Ptr);
	var svf2 = Unsafe.Read<Vector128<float>>(floatTable.inArray2Ptr);
	var svf3 = Avx.Compare(svf1, svf2, FloatComparisonMode.OrderedEqualNonSignaling);
	Unsafe.Write(floatTable.outArrayPtr, svf3);

	var svd1 = Unsafe.Read<Vector128<double>>(doubleTable.inArray1Ptr);
	var svd2 = Unsafe.Read<Vector128<double>>(doubleTable.inArray2Ptr);
	var svd3 = Avx.Compare(svd1, svd2, FloatComparisonMode.OrderedEqualNonSignaling);

JIT: Improve x86 HWIntrinsic containment #110736

JIT: Improve x86 HWIntrinsic containment #110736

Uh oh!

Conversation

saucecontrol commented Dec 16, 2024 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Notable Fixes

Uh oh!

dotnet-policy-service bot commented Dec 16, 2024

Uh oh!

saucecontrol left a comment

Choose a reason for hiding this comment

Uh oh!

Uh oh!

Uh oh!

tannergooding commented Dec 17, 2024

Uh oh!

azure-pipelines bot commented Dec 17, 2024

Uh oh!

saucecontrol commented Dec 17, 2024 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

tannergooding commented Jan 8, 2025

Uh oh!

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

3 participants

saucecontrol commented Dec 16, 2024 •

edited

Loading

saucecontrol commented Dec 17, 2024 •

edited

Loading