lakesoul-io · dmetasoul01 · Dec 19, 2022 · Dec 1, 2022 · Dec 1, 2022 · Dec 5, 2022
diff --git a/lakesoul-spark/src/main/scala/com/dmetasoul/lakesoul/meta/MetaVersion.scala b/lakesoul-spark/src/main/scala/com/dmetasoul/lakesoul/meta/MetaVersion.scala
@@ -143,7 +143,8 @@ object MetaVersion {
       range_value = range_value,
       version = info.getVersion,
       read_files = info.getSnapshot.asScala.toArray,
-      expression = info.getExpression
+      expression = info.getExpression,
+      commit_op = info.getCommitOp
     )
   }
 
@@ -155,7 +156,8 @@ object MetaVersion {
       range_value = range_value,
       version = info.getVersion,
       read_files = info.getSnapshot.asScala.toArray,
-      expression = info.getExpression
+      expression = info.getExpression,
+      commit_op = info.getCommitOp
     )
     partitionVersionBuffer.toArray
 
@@ -170,6 +172,8 @@ object MetaVersion {
         table_id = res.getTableId,
         range_value = res.getPartitionDesc,
         version = res.getVersion,
+        expression = res.getExpression,
+        commit_op = res.getCommitOp
       )
     }
     partitionVersionBuffer.toArray
@@ -201,7 +205,8 @@ object MetaVersion {
         range_value = res.getPartitionDesc,
         version = res.getVersion,
         read_files = res.getSnapshot.asScala.toArray,
-        expression = res.getExpression
+        expression = res.getExpression,
+        commit_op = res.getCommitOp
       )
     }
     partitionVersionBuffer.toArray

diff --git a/...soul-spark/src/main/scala/org/apache/spark/sql/lakesoul/catalog/LakeSoulScanBuilder.scala b/...soul-spark/src/main/scala/org/apache/spark/sql/lakesoul/catalog/LakeSoulScanBuilder.scala
@@ -122,8 +122,12 @@ case class LakeSoulScanBuilder(sparkSession: SparkSession,
       parquetScan(partitionFilters, dataFilters)
     }
     else if (onlyOnePartition) {
-      OnePartitionMergeBucketScan(sparkSession, hadoopConf, fileIndex, dataSchema, mergeReadDataSchema(),
-        readPartitionSchema(), pushedParquetFilters, options, tableInfo, partitionFilters, dataFilters)
+      if (fileIndex.snapshotManagement.snapshot.getPartitionInfoArray.forall(p => p.commit_op.equals("CompactionCommit"))) {
+        parquetScan(partitionFilters, dataFilters)
+      } else {
+        OnePartitionMergeBucketScan(sparkSession, hadoopConf, fileIndex, dataSchema, mergeReadDataSchema(),
+          readPartitionSchema(), pushedParquetFilters, options, tableInfo, partitionFilters, dataFilters)
+      }
     }
     else {
       if (sparkSession.sessionState.conf

diff --git a/lakesoul-spark/src/main/scala/org/apache/spark/sql/lakesoul/utils/MetaData.scala b/lakesoul-spark/src/main/scala/org/apache/spark/sql/lakesoul/utils/MetaData.scala
@@ -36,7 +36,8 @@ case class PartitionInfo(table_id: String,
                          range_value: String,
                          version: Int = -1,
                          read_files: Array[UUID] = Array.empty[UUID],
-                         expression:String=""
+                         expression: String = "",
+                         commit_op: String = ""
                       ) {
   override def toString: String = {
     s"partition info: {\ntable_name: $table_id,\nrange_value: $range_value}"

diff --git a/...oul-spark/src/test/scala/org/apache/spark/sql/execution/datasource/ParquetScanSuite.scala b/...oul-spark/src/test/scala/org/apache/spark/sql/execution/datasource/ParquetScanSuite.scala
@@ -102,7 +102,7 @@ class ParquetScanSuite extends QueryTest
     })
   }
 
-  test("It should use OnePartitionMergeBucketScan when reading one compacted partition") {
+  test("It should use ParquetScan when reading one compacted partition") {
     withTempDir(dir => {
       val tablePath = dir.getCanonicalPath
       Seq((20201101, 1, 1), (20201101, 2, 2), (20201101, 3, 3))
@@ -119,7 +119,7 @@ class ParquetScanSuite extends QueryTest
       val plan = table.toDF.queryExecution.toString()
 
       logInfo(plan)
-      assert(plan.contains("OnePartitionMergeBucketScan"))
+      assert(plan.contains("ParquetScan"))
 
     })
   }