dask · fjetter · Feb 24, 2023 · Jan 31, 2023 · Feb 24, 2023 · Feb 24, 2023
@@ -1,12 +1,15 @@
 from __future__ import annotations
 
 from distributed.shuffle._arrow import check_minimal_arrow_version
+from distributed.shuffle._merge import HashJoinP2PLayer, hash_join_p2p
 from distributed.shuffle._scheduler_extension import ShuffleSchedulerExtension
 from distributed.shuffle._shuffle import P2PShuffleLayer, rearrange_by_column_p2p
 from distributed.shuffle._worker_extension import ShuffleWorkerExtension
 
 __all__ = [
     "check_minimal_arrow_version",
+    "hash_join_p2p",
+    "HashJoinP2PLayer",
     "P2PShuffleLayer",
     "rearrange_by_column_p2p",
     "ShuffleSchedulerExtension",

@@ -20,11 +20,6 @@ def check_dtype_support(meta_input: pd.DataFrame) -> None:
             raise TypeError(
                 f"p2p does not support data of type '{column.dtype}' found in column '{name}'."
             )
-        # FIXME: Serializing custom objects to PyArrow is not supported in P2P shuffling
-        if pd.api.types.is_object_dtype(column):
-            raise TypeError(
-                f"p2p does not support custom objects found in column '{name}'."
-            )
         # FIXME: PyArrow does not support sparse data: https://issues.apache.org/jira/browse/ARROW-8679
         if pd.api.types.is_sparse(column):
             raise TypeError("p2p does not support sparse data found in column '{name}'")