Add ROCm support #1576

xys-syx · 2025-11-05T09:42:59Z

I have not added lit tests yet

.bazelrc

src/enzyme_ad/jax/Passes/CudaRuntimeWrappers.cpp

…er.create later

github-actions

EnzymeJAX Benchmarks

Benchmark suite	Current: `f46684e`	Previous: `b55ffd4`	Ratio
`scatter_sum / JaX / cpu / Primal`	`0.0000043525060871616` s	`0.000004338932399696205` s	`1.00`
`scatter_sum / JaXPipe / cpu / Primal`	`0.000004293832019902766` s	`0.000004298453299998073` s	`1.00`
`scatter_sum / JaX / tpu / Primal`	`0.0001354218465974` s	`0.0001558048111997` s	`0.87`
`scatter_sum / JaXPipe / tpu / Primal`	`0.0001336760675068` s	`0.0001522772955002` s	`0.88`

This comment was automatically generated by workflow using github-action-benchmark.

vimarsh6739 · 2025-11-20T02:00:51Z

src/enzyme_ad/jax/Passes/ConvertPolygeistToLLVM.cpp

+  }
+};
+
+struct GPUShuffleOpToROCDL : public ConvertOpToLLVMPattern<gpu::ShuffleOp> {


I think this can simply be a dup of this

vimarsh6739 · 2025-11-20T02:03:16Z

src/enzyme_ad/jax/Passes/ConvertPolygeistToLLVM.cpp

 } // namespace mlir

+// https://rocm.docs.amd.com/projects/HIP/en/docs-6.4.0/reference/hardware_features.html
+struct GPULaneIdOpToROCDL : ConvertOpToLLVMPattern<gpu::LaneIdOp> {


dup of https://github.com/llvm/llvm-project/blob/9e9fe08b16ea2c4d9867fb4974edf2a3776d6ece/mlir/lib/Conversion/GPUToROCDL/LowerGpuOpsToROCDLOps.cpp#L113

vimarsh6739 · 2025-11-20T07:21:33Z

src/enzyme_ad/jax/Passes/ConvertPolygeistToLLVM.cpp

+    } else if (gpuTarget == "rocm") {
+      using namespace mlir::gpu::index_lowering;
+      PatternBenefit benefit(1);
+      PatternBenefit highBenefit(2);
+      patterns.add<gpu::index_lowering::OpLowering<
+          gpu::ThreadIdOp, ROCDL::ThreadIdXOp, ROCDL::ThreadIdYOp,
+          ROCDL::ThreadIdZOp>>(typeConverter, IndexKind::Block, IntrType::Id,
+                               benefit);
+      patterns.add<gpu::index_lowering::OpLowering<
+          gpu::BlockDimOp, ROCDL::BlockDimXOp, ROCDL::BlockDimYOp,
+          ROCDL::BlockDimZOp>>(typeConverter, IndexKind::Block, IntrType::Dim,
+                               benefit);
+      patterns.add<gpu::index_lowering::OpLowering<
+          gpu::BlockIdOp, ROCDL::BlockIdXOp, ROCDL::BlockIdYOp,
+          ROCDL::BlockIdZOp>>(typeConverter, IndexKind::Grid, IntrType::Id,
+                              benefit);
+      patterns.add<gpu::index_lowering::OpLowering<
+          gpu::GridDimOp, ROCDL::GridDimXOp, ROCDL::GridDimYOp,
+          ROCDL::GridDimZOp>>(typeConverter, IndexKind::Grid, IntrType::Dim,
+                              benefit);
+
+      patterns.add<GPULaneIdOpToROCDL>(typeConverter, benefit);
+      patterns.add<GPUShuffleOpToROCDL>(typeConverter, benefit);
+      patterns.add<GPUBarrierToROCDL>(typeConverter, benefit);
+
+      populateMathToLLVMConversionPatterns(typeConverter, patterns);
+      populateMathToROCDLConversionPatterns(typeConverter, patterns,
+                                            std::nullopt);
+
+      patterns.add<ClusterIdOpToROCDL>(typeConverter, highBenefit);
+      patterns.add<ClusterDimOpToROCDL>(typeConverter, highBenefit);
+      patterns.add<ClusterBlockIdToBlockIdLowering>(&typeConverter.getContext(),
+                                                    highBenefit);
+      patterns.add<ClusterDimBlocksToGridDimLowering>(
+          &typeConverter.getContext(), highBenefit);


Suggested change

} else if (gpuTarget == "rocm") {

using namespace mlir::gpu::index_lowering;

PatternBenefit benefit(1);

PatternBenefit highBenefit(2);

patterns.add<gpu::index_lowering::OpLowering<

gpu::ThreadIdOp, ROCDL::ThreadIdXOp, ROCDL::ThreadIdYOp,

ROCDL::ThreadIdZOp>>(typeConverter, IndexKind::Block, IntrType::Id,

benefit);

patterns.add<gpu::index_lowering::OpLowering<

gpu::BlockDimOp, ROCDL::BlockDimXOp, ROCDL::BlockDimYOp,

ROCDL::BlockDimZOp>>(typeConverter, IndexKind::Block, IntrType::Dim,

benefit);

patterns.add<gpu::index_lowering::OpLowering<

gpu::BlockIdOp, ROCDL::BlockIdXOp, ROCDL::BlockIdYOp,

ROCDL::BlockIdZOp>>(typeConverter, IndexKind::Grid, IntrType::Id,

benefit);

patterns.add<gpu::index_lowering::OpLowering<

gpu::GridDimOp, ROCDL::GridDimXOp, ROCDL::GridDimYOp,

ROCDL::GridDimZOp>>(typeConverter, IndexKind::Grid, IntrType::Dim,

benefit);

patterns.add<GPULaneIdOpToROCDL>(typeConverter, benefit);

patterns.add<GPUShuffleOpToROCDL>(typeConverter, benefit);

patterns.add<GPUBarrierToROCDL>(typeConverter, benefit);

populateMathToLLVMConversionPatterns(typeConverter, patterns);

populateMathToROCDLConversionPatterns(typeConverter, patterns,

std::nullopt);

patterns.add<ClusterIdOpToROCDL>(typeConverter, highBenefit);

patterns.add<ClusterDimOpToROCDL>(typeConverter, highBenefit);

patterns.add<ClusterBlockIdToBlockIdLowering>(&typeConverter.getContext(),

highBenefit);

patterns.add<ClusterDimBlocksToGridDimLowering>(

&typeConverter.getContext(), highBenefit);

} else if (gpuTarget == "rocm") {

mlir::populateGpuToROCDLConversionPatterns(typeConverter, patterns, mlir::gpu::amd::Runtime::HIP, amdgpu::Chipset());

I think we can figure out how to get the actual chipset details later.

xys-syx added 4 commits November 3, 2025 03:12

modifying runtime registion part

f679e34

add cuda rocm wrappers, and temporarily exclude in BUILD

e99c86b

add rocm support for enzymexla::MemcpyOp

c20aa36

add rocm support

ad759cf

xys-syx requested review from avik-pal, ivanradanov, vimarsh6739 and wsmoses November 5, 2025 09:42

wsmoses reviewed Nov 5, 2025

View reviewed changes

.bazelrc Outdated Show resolved Hide resolved

wsmoses reviewed Nov 5, 2025

View reviewed changes

src/enzyme_ad/jax/Passes/CudaRuntimeWrappers.cpp Outdated Show resolved Hide resolved

xys-syx added 17 commits November 5, 2025 21:37

fix

a85b028

add lit tests, but not for landOp, shuffleOp, Cluster*Op

81f3777

temp use current version for resolving conflicts, would modify rewrit…

10321d1

…er.create later

add

0190005

fix

7f7d6ea

fix

c2e48f4

fix BUILD format

6f5fe26

fix branch

409b2ce

not fix

8c77cb2

fmt

a51cdad

Merge branch 'main' into ROCm

bc0e74d

Merge branch 'main' into ROCm

9354f5d

Merge branch 'main' into ROCm

5cfa4f5

fix BUILD

77dfb89

fmt

1db07ca

Merge branch 'main' into ROCm

3ae832c

fix lit tests

2da26ac

github-actions bot reviewed Nov 11, 2025

View reviewed changes

xys-syx added 2 commits November 18, 2025 00:55

add fenceOp for GPUBarrierToROCDL

a359391

modify ROCDL::MbcntHiOp::create

cde7153

xys-syx added 3 commits November 19, 2025 16:28

rm CudaRuntimeWrappers and RocmRuntimeWrappers, modify BUILD

8b33696

fix BUILD format

d9fb740

Merge branch 'main' into ROCm

f46684e

vimarsh6739 reviewed Nov 20, 2025

View reviewed changes

vimarsh6739 requested changes Nov 20, 2025

View reviewed changes

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Add ROCm support #1576

Add ROCm support #1576

xys-syx commented Nov 5, 2025 •

edited

Loading

Uh oh!

Uh oh!

Uh oh!

github-actions bot left a comment •

edited

Loading

Uh oh!

vimarsh6739 Nov 20, 2025 •

edited

Loading

Uh oh!

vimarsh6739 Nov 20, 2025

Uh oh!

vimarsh6739 Nov 20, 2025 •

edited

Loading

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

4 participants

Add ROCm support #1576

Are you sure you want to change the base?

Add ROCm support #1576

Conversation

xys-syx commented Nov 5, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Uh oh!

Uh oh!

Uh oh!

github-actions bot left a comment • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Choose a reason for hiding this comment

EnzymeJAX Benchmarks

Uh oh!

vimarsh6739 Nov 20, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Choose a reason for hiding this comment

Uh oh!

vimarsh6739 Nov 20, 2025

Choose a reason for hiding this comment

Uh oh!

vimarsh6739 Nov 20, 2025 • edited Loading Uh oh! There was an error while loading. Please reload this page.

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

4 participants

xys-syx commented Nov 5, 2025 •

edited

Loading

github-actions bot left a comment •

edited

Loading

vimarsh6739 Nov 20, 2025 •

edited

Loading

vimarsh6739 Nov 20, 2025 •

edited

Loading