[cudax->libcu++] Move host_launch to libcu++ (#6536)

pciolkosz · web-flow · commit 2dede266155d · 2025-11-07T09:48:16.000Z
diff --git a/cudax/include/cuda/experimental/__container/async_buffer.cuh b/cudax/include/cuda/experimental/__container/async_buffer.cuh
@@ -27,6 +27,7 @@
 
 #include <cuda/__container/heterogeneous_iterator.h>
 #include <cuda/__container/uninitialized_async_buffer.h>
+#include <cuda/__launch/host_launch.h>
 #include <cuda/__memory_resource/any_resource.h>
 #include <cuda/__memory_resource/get_memory_resource.h>
 #include <cuda/__memory_resource/properties.h>
@@ -48,7 +49,6 @@
 
 #include <cuda/experimental/__detail/utility.cuh>
 #include <cuda/experimental/__execution/policy.cuh>
-#include <cuda/experimental/__launch/host_launch.cuh>
 #include <cuda/experimental/__utility/ensure_current_device.cuh>
 
 #include <cuda/std/__cccl/prologue.h>
@@ -590,7 +590,7 @@ __fill_n(cuda::stream_ref __stream, _Tp* __first, ::cuda::std::size_t __count, c
 
   if constexpr (_IsHostOnly)
   {
-    ::cuda::experimental::host_launch(
+    ::cuda::host_launch(
       __stream, ::cuda::std::uninitialized_fill_n<_Tp*, ::cuda::std::size_t, _Tp>, __first, __count, __value);
   }
   else
diff --git a/cudax/include/cuda/experimental/launch.cuh b/cudax/include/cuda/experimental/launch.cuh
@@ -12,7 +12,6 @@
 #define __CUDAX_LAUNCH___
 
 #include <cuda/experimental/__launch/configuration.cuh>
-#include <cuda/experimental/__launch/host_launch.cuh>
 #include <cuda/experimental/__launch/launch.cuh>
 #include <cuda/experimental/__launch/param_kind.cuh>
 #include <cuda/experimental/__stream/device_transform.cuh>
diff --git a/cudax/test/CMakeLists.txt b/cudax/test/CMakeLists.txt
@@ -66,10 +66,6 @@ foreach(cudax_target IN LISTS cudax_TARGETS)
     launch/launch_smoke.cu
   )
 
-  cudax_add_catch2_test(test_target host_launch ${cudax_target}
-    launch/host_launch.cu
-  )
-
   cudax_add_catch2_test(test_target launch_configuration ${cudax_target}
     launch/configuration.cu
   )
diff --git a/libcudacxx/include/cuda/__launch/host_launch.h b/libcudacxx/include/cuda/__launch/host_launch.h
@@ -1,15 +1,15 @@
 //===----------------------------------------------------------------------===//
 //
-// Part of CUDA Experimental in CUDA C++ Core Libraries,
+// Part of libcu++, the C++ Standard Library for your entire system,
 // under the Apache License v2.0 with LLVM Exceptions.
 // See https://llvm.org/LICENSE.txt for license information.
 // SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
 // SPDX-FileCopyrightText: Copyright (c) 2025 NVIDIA CORPORATION & AFFILIATES.
 //
 //===----------------------------------------------------------------------===//
 
-#ifndef _CUDAX__LAUNCH_HOST_LAUNCH
-#define _CUDAX__LAUNCH_HOST_LAUNCH
+#ifndef _CUDA___LAUNCH_HOST_LAUNCH_H
+#define _CUDA___LAUNCH_HOST_LAUNCH_H
 
 #include <cuda/__cccl_config>
 
@@ -31,8 +31,8 @@
 
 #include <cuda/std/__cccl/prologue.h>
 
-namespace cuda::experimental
-{
+_CCCL_BEGIN_NAMESPACE_CUDA
+
 template <class _Callable, class... _Args>
 struct __stream_callback_data
 {
@@ -104,8 +104,8 @@ _CCCL_HOST_API void host_launch(stream_ref __stream, ::cuda::std::reference_wrap
   ::cuda::__driver::__launchHostFunc(
     __stream.get(), __host_func_launcher<_Callable>, ::cuda::std::addressof(__callable.get()));
 }
-} // namespace cuda::experimental
+_CCCL_END_NAMESPACE_CUDA
 
 #include <cuda/std/__cccl/epilogue.h>
 
-#endif // !_CUDAX__LAUNCH_HOST_LAUNCH
+#endif // !_CUDA___LAUNCH_HOST_LAUNCH_H
diff --git a/libcudacxx/test/libcudacxx/cuda/ccclrt/launch/host_launch.cu b/libcudacxx/test/libcudacxx/cuda/ccclrt/launch/host_launch.cu
@@ -1,44 +1,43 @@
 //===----------------------------------------------------------------------===//
 //
-// Part of CUDA Experimental in CUDA C++ Core Libraries,
+// Part of libcu++, the C++ Standard Library for your entire system,
 // under the Apache License v2.0 with LLVM Exceptions.
 // See https://llvm.org/LICENSE.txt for license information.
 // SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
 // SPDX-FileCopyrightText: Copyright (c) 2025 NVIDIA CORPORATION & AFFILIATES.
 //
 //===----------------------------------------------------------------------===//
+#include <cuda/__launch/host_launch.h>
+#include <cuda/__stream/stream.h>
 #include <cuda/atomic>
 #include <cuda/memory>
 
-#include <cuda/experimental/launch.cuh>
-#include <cuda/experimental/stream.cuh>
-
 #include <cooperative_groups.h>
 #include <testing.cuh>
 
-void block_stream(cudax::stream_ref stream, cuda::atomic<int>& atomic)
+void block_stream(cuda::stream_ref stream, cuda::atomic<int>& atomic)
 {
   auto block_lambda = [&]() {
     while (atomic != 1)
       ;
   };
-  cudax::host_launch(stream, block_lambda);
+  cuda::host_launch(stream, block_lambda);
 }
 
-void unblock_and_wait_stream(cudax::stream_ref stream, cuda::atomic<int>& atomic)
+void unblock_and_wait_stream(cuda::stream_ref stream, cuda::atomic<int>& atomic)
 {
-  CUDAX_REQUIRE(!stream.is_done());
+  CCCLRT_REQUIRE(!stream.is_done());
   atomic = 1;
   stream.sync();
   atomic = 0;
 }
 
-void launch_local_lambda(cudax::stream_ref stream, int& set, int set_to)
+void launch_local_lambda(cuda::stream_ref stream, int& set, int set_to)
 {
   auto lambda = [&set, set_to]() {
     set = set_to;
   };
-  cudax::host_launch(stream, lambda);
+  cuda::host_launch(stream, lambda);
 }
 
 template <typename Lambda>
@@ -58,7 +57,7 @@ struct lambda_wrapper
     if constexpr (cuda::std::is_same_v<cuda::std::invoke_result_t<Lambda>, void*>)
     {
       // If lambda returns the address it captured, confirm this object wasn't moved
-      CUDAX_REQUIRE(lambda() == this);
+      CCCLRT_REQUIRE(lambda() == this);
     }
     else
     {
@@ -69,7 +68,7 @@ struct lambda_wrapper
   // Make sure we fail if const is added to this wrapper anywhere
   void operator()() const
   {
-    CUDAX_REQUIRE(false);
+    CCCLRT_REQUIRE(false);
   }
 };
 
@@ -107,13 +106,13 @@ private:
   MoveOnlyCallable() = default;
 };
 
-C2H_TEST("Host launch", "")
+C2H_CCCLRT_TEST("Host launch", "")
 {
   cuda::device_ref device{0};
   device.init();
 
   cuda::atomic<int> atomic = 0;
-  cudax::stream stream{device};
+  cuda::stream stream{device};
   int i = 0;
 
   auto set_lambda = [&](int set) {
@@ -124,35 +123,35 @@ C2H_TEST("Host launch", "")
   {
     block_stream(stream, atomic);
 
-    cudax::host_launch(stream, set_lambda, 2);
+    cuda::host_launch(stream, set_lambda, 2);
 
     unblock_and_wait_stream(stream, atomic);
-    CUDAX_REQUIRE(i == 2);
+    CCCLRT_REQUIRE(i == 2);
   }
 
   SECTION("Can launch multiple functions")
   {
     block_stream(stream, atomic);
     auto check_lambda = [&]() {
-      CUDAX_REQUIRE(i == 4);
+      CCCLRT_REQUIRE(i == 4);
     };
 
-    cudax::host_launch(stream, set_lambda, 3);
-    cudax::host_launch(stream, set_lambda, 4);
-    cudax::host_launch(stream, check_lambda);
-    cudax::host_launch(stream, set_lambda, 5);
+    cuda::host_launch(stream, set_lambda, 3);
+    cuda::host_launch(stream, set_lambda, 4);
+    cuda::host_launch(stream, check_lambda);
+    cuda::host_launch(stream, set_lambda, 5);
     unblock_and_wait_stream(stream, atomic);
-    CUDAX_REQUIRE(i == 5);
+    CCCLRT_REQUIRE(i == 5);
   }
 
   SECTION("Non trivially copyable")
   {
     std::string s = "hello";
 
-    cudax::host_launch(
+    cuda::host_launch(
       stream,
       [&](auto str_arg) {
-        CUDAX_REQUIRE(s == str_arg);
+        CCCLRT_REQUIRE(s == str_arg);
       },
       s);
     stream.sync();
@@ -164,17 +163,17 @@ C2H_TEST("Host launch", "")
       i = 21;
     });
 
-    cudax::host_launch(stream, wrapped_lambda);
+    cuda::host_launch(stream, wrapped_lambda);
     stream.sync();
-    CUDAX_REQUIRE(i == 21)
+    CCCLRT_REQUIRE(i == 21);
   }
 
   SECTION("Can launch a local function and return")
   {
     block_stream(stream, atomic);
     launch_local_lambda(stream, i, 42);
     unblock_and_wait_stream(stream, atomic);
-    CUDAX_REQUIRE(i == 42);
+    CCCLRT_REQUIRE(i == 42);
   }
 
   SECTION("Launch by reference")
@@ -188,9 +187,9 @@ C2H_TEST("Host launch", "")
     wrapper_ptr = static_cast<void*>(&another_lambda_setter);
 
     block_stream(stream, atomic);
-    host_launch(stream, cuda::std::ref(another_lambda_setter));
+    cuda::host_launch(stream, cuda::std::ref(another_lambda_setter));
     unblock_and_wait_stream(stream, atomic);
-    CUDAX_REQUIRE(i == 84);
+    CCCLRT_REQUIRE(i == 84);
   }
 
   SECTION("Launch by reference with arguments")
@@ -201,9 +200,9 @@ C2H_TEST("Host launch", "")
       result = j;
     };
     block_stream(stream, atomic);
-    host_launch(stream, cuda::std::ref(lambda), i);
+    cuda::host_launch(stream, cuda::std::ref(lambda), i);
     unblock_and_wait_stream(stream, atomic);
-    CUDAX_REQUIRE(result == 10);
+    CCCLRT_REQUIRE(result == 10);
   }
 
   SECTION("Launch by reference with arguments captured by reference")
@@ -213,14 +212,14 @@ C2H_TEST("Host launch", "")
       j = 10;
     };
     block_stream(stream, atomic);
-    host_launch(stream, cuda::std::ref(lambda), cuda::std::ref(i));
+    cuda::host_launch(stream, cuda::std::ref(lambda), cuda::std::ref(i));
     unblock_and_wait_stream(stream, atomic);
-    CUDAX_REQUIRE(i == 10);
+    CCCLRT_REQUIRE(i == 10);
   }
 
   SECTION("Check that host_launch works with move only callables and arguments")
   {
-    cudax::host_launch(stream, MoveOnlyCallable::make(), MoveOnlyArg::make());
+    cuda::host_launch(stream, MoveOnlyCallable::make(), MoveOnlyArg::make());
     stream.sync();
   }
 }

Original file line number	Diff line number	Diff line change
`@@ -66,10 +66,6 @@ foreach(cudax_target IN LISTS cudax_TARGETS)`
`66`	`66`	`launch/launch_smoke.cu`
`67`	`67`	`)`
`68`	`68`
`69`		`- cudax_add_catch2_test(test_target host_launch ${cudax_target}`
`70`		`- launch/host_launch.cu`
`71`		`- )`
`72`		`-`
`73`	`69`	`cudax_add_catch2_test(test_target launch_configuration ${cudax_target}`
`74`	`70`	`launch/configuration.cu`
`75`	`71`	`)`