apache · wbo4958 · Jan 23, 2025 · Jan 24, 2025 · Jan 24, 2025 · zhengruifeng
diff --git a/python/pyspark/ml/evaluation.py b/python/pyspark/ml/evaluation.py
@@ -311,6 +311,9 @@ def setParams(
         kwargs = self._input_kwargs
         return self._set(**kwargs)
 
+    def isLargerBetter(self) -> bool:
+        return True
+
 
 @inherit_doc
 class RegressionEvaluator(
@@ -467,6 +470,11 @@ def setParams(
         kwargs = self._input_kwargs
         return self._set(**kwargs)
 
+    def isLargerBetter(self) -> bool:
+        if self.getMetricName() in ["r2", "var"]:
+            return True
+        return False
-        if self.getMetricName() in ["r2", "var"]:
-            return True
-        return False
+        return self.getMetricName() in ["r2", "var"]
-        if self.getMetricName() in ["r2", "var"]:
-            return True
-        return False
+        return self.getMetricName() in ["r2", "var"]
+
 
 @inherit_doc
 class MulticlassClassificationEvaluator(
@@ -700,6 +708,16 @@ def setParams(
         kwargs = self._input_kwargs
         return self._set(**kwargs)
 
+    def isLargerBetter(self) -> bool:
+        if self.getMetricName() in [
+            "weightedFalsePositiveRate",
+            "falsePositiveRateByLabel",
+            "logLoss",
+            "hammingLoss",
+        ]:
+            return False
+        return True
+
 
 @inherit_doc
 class MultilabelClassificationEvaluator(
@@ -843,6 +861,11 @@ def setParams(
         kwargs = self._input_kwargs
         return self._set(**kwargs)
 
+    def isLargerBetter(self) -> bool:
+        if self.getMetricName() == "hammingLoss":
+            return False
+        return True
+
 
 @inherit_doc
 class ClusteringEvaluator(
@@ -1002,6 +1025,9 @@ def setWeightCol(self, value: str) -> "ClusteringEvaluator":
         """
         return self._set(weightCol=value)
 
+    def isLargerBetter(self) -> bool:
+        return True
+
 
 @inherit_doc
 class RankingEvaluator(
@@ -1138,6 +1164,9 @@ def setParams(
         kwargs = self._input_kwargs
         return self._set(**kwargs)
 
+    def isLargerBetter(self) -> bool:
+        return True
+
 
 if __name__ == "__main__":
     import doctest

diff --git a/python/pyspark/ml/tests/test_evaluation.py b/python/pyspark/ml/tests/test_evaluation.py
@@ -42,6 +42,7 @@ def test_ranking_evaluator(self):
 
         # Initialize RankingEvaluator
         evaluator = RankingEvaluator().setPredictionCol("prediction")
+        self.assertTrue(evaluator.isLargerBetter())
 
         # Evaluate the dataset using the default metric (mean average precision)
         mean_average_precision = evaluator.evaluate(dataset)
@@ -94,6 +95,25 @@ def test_multilabel_classification_evaluator(self):
             self.assertEqual(evaluator2.getPredictionCol(), "prediction")
             self.assertEqual(str(evaluator), str(evaluator2))
 
+        for metric in [
+            "subsetAccuracy",
+            "accuracy",
+            "precision",
+            "recall",
+            "f1Measure",
+            "precisionByLabel",
+            "recallByLabel",
+            "f1MeasureByLabel",
+            "microPrecision",
+            "microRecall",
+            "microF1Measure",
+        ]:
+            evaluator.setMetricName(metric)
+            self.assertTrue(evaluator.isLargerBetter())
+
+        evaluator.setMetricName("hammingLoss")
+        self.assertTrue(not evaluator.isLargerBetter())
+
     def test_multiclass_classification_evaluator(self):
         dataset = self.spark.createDataFrame(
             [
@@ -163,6 +183,29 @@ def test_multiclass_classification_evaluator(self):
         log_loss = evaluator.evaluate(dataset)
         self.assertTrue(np.allclose(log_loss, 1.0093, atol=1e-4))
 
+        for metric in [
+            "f1",
+            "accuracy",
+            "weightedPrecision",
+            "weightedRecall",
+            "weightedTruePositiveRate",
+            "weightedFMeasure",
+            "truePositiveRateByLabel",
+            "precisionByLabel",
+            "recallByLabel",
+            "fMeasureByLabel",
+        ]:
+            evaluator.setMetricName(metric)
+            self.assertTrue(evaluator.isLargerBetter())
+        for metric in [
+            "weightedFalsePositiveRate",
+            "falsePositiveRateByLabel",
+            "logLoss",
+            "hammingLoss",
+        ]:
+            evaluator.setMetricName(metric)
+            self.assertTrue(not evaluator.isLargerBetter())
+
     def test_binary_classification_evaluator(self):
         # Define score and labels data
         data = map(
@@ -180,6 +223,8 @@ def test_binary_classification_evaluator(self):
         dataset = self.spark.createDataFrame(data, ["raw", "label", "weight"])
 
         evaluator = BinaryClassificationEvaluator().setRawPredictionCol("raw")
+        self.assertTrue(evaluator.isLargerBetter())
+
         auc_roc = evaluator.evaluate(dataset)
         self.assertTrue(np.allclose(auc_roc, 0.7083, atol=1e-4))
 
@@ -226,6 +271,8 @@ def test_clustering_evaluator(self):
         dataset = self.spark.createDataFrame(data, ["features", "prediction", "weight"])
 
         evaluator = ClusteringEvaluator().setPredictionCol("prediction")
+        self.assertTrue(evaluator.isLargerBetter())
+
         score = evaluator.evaluate(dataset)
         self.assertTrue(np.allclose(score, 0.9079, atol=1e-4))
 
@@ -300,6 +347,13 @@ def test_regression_evaluator(self):
         through_origin = evaluator_with_weights.getThroughOrigin()
         self.assertEqual(through_origin, False)
 
+        for metric in ["mse", "rmse", "mae"]:
+            evaluator.setMetricName(metric)
+            self.assertTrue(not evaluator.isLargerBetter())
+        for metric in ["r2", "var"]:
+            evaluator.setMetricName(metric)
+            self.assertTrue(evaluator.isLargerBetter())
+
 
 class EvaluatorTests(EvaluatorTestsMixin, unittest.TestCase):
     def setUp(self) -> None: