aws-samples · bigadsoleiman · Nov 7, 2023 · Nov 7, 2023
diff --git a/lib/shared/layers/python-sdk/python/genai_core/aurora/query.py b/lib/shared/layers/python-sdk/python/genai_core/aurora/query.py
@@ -197,14 +197,14 @@ def query_workspace_aurora(
             score_dict[unique_items[i]["chunk_id"]] = score
 
     unique_items = sorted(unique_items, key=lambda x: x["score"], reverse=True)
-    unique_items = unique_items[:limit]
-
+
     for record in vector_search_records:
         record["score"] = score_dict[record["chunk_id"]]
     for record in keyword_search_records:
         record["score"] = score_dict[record["chunk_id"]]
 
     if full_response:
+        unique_items = unique_items[:limit]
         ret_value = {
             "engine": "aurora",
             "query_language": language_name,
@@ -216,24 +216,35 @@ def query_workspace_aurora(
             "keyword_search_items": convert_types(keyword_search_records),
         }
     else:
-        ret_items = list(filter(lambda val: val["score"] > threshold, unique_items))
+        ret_items = list(filter(lambda val: val["score"] > threshold, unique_items))[:limit]
         if len(ret_items) < limit:
-            unique_items = sorted(
-                unique_items, key=lambda x: x["vector_search_score"], reverse=True
-            )
-            ret_items = ret_items + (
-                list(
-                    filter(lambda val: val["vector_search_score"] > 0.5, unique_items)
-                )[: (limit - len(ret_items))]
-            )
+            # inner product metric is negative hence we sort ascending
+            if metric == "inner":
+                unique_items = sorted(
+                    unique_items, key=lambda x: x["vector_search_score"] or 1, reverse=False
+                )
+                ret_items = ret_items + (
+                    list(
+                        filter(lambda val: (val["vector_search_score"] or 1) < -0.5, unique_items)
+                    )[: (limit - len(ret_items))]
+                )
+            else: 
+                unique_items = sorted(
+                    unique_items, key=lambda x: x["vector_search_score"] or -1, reverse=True
+                )
+                ret_items = ret_items + (
+                    list(
+                        filter(lambda val: (val["vector_search_score"] or -1) > 0.5 , unique_items)
+                    )[: (limit - len(ret_items))]
+                )
 
         ret_value = {
             "engine": "aurora",
             "query_language": language_name,
             "supported_languages": languages,
             "detected_languages": detected_languages,
             "items": convert_types(
-                list(filter(lambda val: val["score"] > 0, unique_items))
+                ret_items
             ),
         }
 

diff --git a/lib/shared/layers/python-sdk/python/genai_core/opensearch/query.py b/lib/shared/layers/python-sdk/python/genai_core/opensearch/query.py
@@ -107,14 +107,14 @@ def query_workspace_open_search(
             unique_items[i]["score"] = score
             score_dict[unique_items[i]["chunk_id"]] = score
     unique_items = sorted(unique_items, key=lambda x: x["score"], reverse=True)
-    unique_items = unique_items[:limit]
-
+
     for record in vector_search_records:
         record["score"] = score_dict[record["chunk_id"]]
     for record in keyword_search_records:
         record["score"] = score_dict[record["chunk_id"]]
 
     if full_response:
+        unique_items = unique_items[:limit]
         ret_value = {
             "engine": "opensearch",
             "supported_languages": languages,
@@ -124,14 +124,14 @@ def query_workspace_open_search(
             "keyword_search_items": keyword_search_records,
         }
     else:
-        ret_items = list(filter(lambda val: val["score"] > threshold, unique_items))
+        ret_items = list(filter(lambda val: val["score"] > threshold, unique_items))[:limit]
         if len(ret_items) < limit:
             unique_items = sorted(
-                unique_items, key=lambda x: x["vector_search_score"], reverse=True
+                unique_items, key=lambda x: x["vector_search_score"] or -1, reverse=True
             )
             ret_items = ret_items + (
                 list(
-                    filter(lambda val: val["vector_search_score"] > 0.5, unique_items)
+                    filter(lambda val: (val["vector_search_score"] or -1)  > 0.5, unique_items)
                 )[: (limit - len(ret_items))]
             )