alteryx · bchen1116 · Jan 26, 2023 · Jan 26, 2023 · Jan 26, 2023 · Jan 26, 2023
diff --git a/docs/source/release_notes.rst b/docs/source/release_notes.rst
@@ -3,6 +3,7 @@ Release Notes
 **Future Releases**
     * Enhancements
     * Fixes
+        * Updated ``LabelEncoder`` to store the original typing information :pr:`3960`
         * Fixed bug where all-null ``BooleanNullable`` columns would break the imputer during transform :pr:`3959`
     * Changes
     * Documentation Changes

diff --git a/evalml/pipelines/components/transformers/encoders/label_encoder.py b/evalml/pipelines/components/transformers/encoders/label_encoder.py
@@ -23,6 +23,7 @@ class LabelEncoder(Transformer):
     def __init__(self, positive_label=None, random_seed=0, **kwargs):
         parameters = {"positive_label": positive_label}
         parameters.update(kwargs)
+        self.original_typing = ""
 
         super().__init__(
             parameters=parameters,
@@ -46,6 +47,7 @@ def fit(self, X, y):
         if y is None:
             raise ValueError("y cannot be None!")
         y_ww = infer_feature_types(y)
+        self.original_typing = str(y_ww.ww.logical_type)
         self.mapping = {val: i for i, val in enumerate(sorted(y_ww.unique()))}
         if self.parameters["positive_label"] is not None:
             if len(self.mapping) != 2:
@@ -114,5 +116,5 @@ def inverse_transform(self, y):
         if y is None:
             raise ValueError("y cannot be None!")
         y_ww = infer_feature_types(y)
-        y_it = infer_feature_types(y_ww.map(self.inverse_mapping))
+        y_it = infer_feature_types(y_ww.map(self.inverse_mapping), self.original_typing)
         return y_it
diff --git a/evalml/tests/component_tests/test_label_encoder.py b/evalml/tests/component_tests/test_label_encoder.py
@@ -221,3 +221,21 @@ def test_label_encoder_with_positive_label_with_custom_indices():
     y_with_custom_indices = pd.Series(["b", "a", "a"], index=[5, 6, 7])
     _, y_transformed = encoder.transform(None, y_with_custom_indices)
     assert_index_equal(y_with_custom_indices.index, y_transformed.index)
+
+
+@pytest.mark.parametrize("logical_type", ["Categorical", "Boolean"])
+def test_label_encoder_categorical_handled_properly_boolean_values(logical_type):
+    # adding this test after WW version 0.21.2, which introduces auto-boolean inference
+    # This broke this test case where the logical type converts to boolean after inverse_transform
+    # because of woodwork inference
+    X = pd.DataFrame({})
+    # binary
+    y = pd.Series(["yes", "yes", "no", "yes"])
+    y = ww.init_series(y, logical_type=logical_type)
+    y_expected = pd.Series([1, 1, 0, 1])
+    encoder = LabelEncoder()
+    encoder.fit(X, y)
+    X_t, y_t = encoder.transform(X, y)
+    pd.testing.assert_series_equal(y_t, y_expected)
+    y_inverse = encoder.inverse_transform(y_t)
+    pd.testing.assert_series_equal(y_inverse, y)