feat: support key-value cache for function expressions #550

gaurav274 · 2023-01-02T23:36:37Z

Support added for caching when the UDF is in the lateral join

…xist

[WIP] UDF Reuse

…hanges.

…ed to rewrite_rules

jiashenC · 2023-01-30T20:22:40Z

eva/catalog/services/udf_history_col_service.py

+from eva.utils.logging_manager import logger
+
+
+class UdfHistoryColumnService(BaseService):


Can you elaborate when is this needed?

This is from the older code. Will remove it

eva/catalog/catalog_utils.py

eva/catalog/models/udf_catalog.py

eva/executor/create_index_executor.py

eva/optimizer/optimizer_utils.py

eva/expression/function_expression.py

eva/catalog/catalog_utils.py

eva/expression/tuple_value_expression.py

eva/optimizer/rules/rules.py

eva/optimizer/rules/rules_manager.py

eva/catalog/catalog_utils.py

eva/expression/function_expression.py

jarulraj · 2023-03-30T04:06:13Z

test/integration_tests/test_reuse.py

+
+        reuse_batch = execute_query_fetch_all(select_query)
+        self._verify_reuse_correctness(select_query, reuse_batch)
+


Do we want to also check the time speedup with reuse?

Might lead to a flaky test.

eva/catalog/catalog_utils.py

xzdandy · 2023-03-30T06:41:25Z

eva/expression/function_expression.py

+            results[cache_miss] = cache_miss_results.to_numpy()
+
+        # 5. return the correct batch
+        cols = [obj.name for obj in self.output_objs]


Duplicate code at line 193.

xzdandy · 2023-03-30T06:49:07Z

eva/expression/function_expression.py

+
+        results = np.full([len(batch), len(cols)], None)
+        keys = batch
+        if self._cache.key:


When I first read code, I was thinking this is the key of the cache store. Maybe add a comment. This is to optimize the key for the function expression (data -> id).

xzdandy and others added 27 commits October 18, 2022 05:00

feat: skeleton for reuse

59e7381

fix: add modification of function scan

e8a295c

Catalog changes to support UDF history

357b6a4

[WIP] Implemented few methods in UDFReuse rule

fcf171e

[WIP] Temporary integration test to debug reuse

edc9ecb

Implemented method to create materialized view when history doesn't e…

1483888

…xist

\Merge pull request #1 from Anirudh58/udf-reuse-ani

83b74e8

[WIP] UDF Reuse

Using input cols instead of output cols for the mat view

eaac830

added method to get udf history by mat view name

9443a4c

Changes for 2 same queries executed one after other

c5b0dc3

Merge branch 'master' into udf-reuse

450bad7

[WIP] Implemented insert executor. Fixed rules.py to reflect latest c…

51747de

…hanges.

[WIP] Changes to mat_view_executor to support reuse. Reuse is now add…

8ed7112

…ed to rewrite_rules

Merge branch 'master' into HEAD

8f5a129

merge

68be8b8

feat: bootstrap kv caching for function expression

1c50640

merge master

1d619f3

checkpoint

b615e04

feat: add expression signature

0233ea6

merge udf_sig branch

71b79f3

checkpoint

8216d69

feat: reuse function expression works

84b310b

checkpoint

508a21b

merge master

8534c4d

feat: fix using cached results

45a1660

fix: reset files

07437a2

test: fix minor test issues

a741f2f

gaurav274 requested a review from jiashenC January 30, 2023 14:06

merge master

6776337

jiashenC reviewed Jan 30, 2023

View reviewed changes

gaurav274 added 6 commits March 25, 2023 16:17

merge master

b061c2a

test: caching test cases

c9f6606

checkpoint

a3401e4

checkpoint

0f76736

bug: fix foreign key constrain issue with udf cost catalog

1a08164

merge master

1fa954c

gaurav274 marked this pull request as ready for review March 28, 2023 05:58

gaurav274 added 4 commits March 28, 2023 02:03

minor fixes

ea38b20

minor fixes

1cae9ac

improve coverage

f8c3929

stop complaining about error reporting code

fbfcfa7

gaurav274 requested review from jiashenC, jarulraj and xzdandy March 28, 2023 15:38

test: add performance test case

3e8a17e

jiashenC reviewed Mar 28, 2023

View reviewed changes

xzdandy reviewed Mar 29, 2023

View reviewed changes

eva/catalog/catalog_utils.py Outdated Show resolved Hide resolved

xzdandy reviewed Mar 29, 2023

View reviewed changes

eva/expression/tuple_value_expression.py Show resolved Hide resolved

xzdandy reviewed Mar 29, 2023

View reviewed changes

eva/optimizer/rules/rules.py Show resolved Hide resolved

xzdandy reviewed Mar 29, 2023

View reviewed changes

eva/optimizer/rules/rules_manager.py Show resolved Hide resolved

jiashenC reviewed Mar 29, 2023

View reviewed changes

eva/catalog/catalog_utils.py Show resolved Hide resolved

eva/expression/function_expression.py Outdated Show resolved Hide resolved

address PR comments

a6d2048

jarulraj approved these changes Mar 30, 2023

View reviewed changes

xzdandy reviewed Mar 30, 2023

View reviewed changes

eva/catalog/catalog_utils.py Show resolved Hide resolved

xzdandy reviewed Mar 30, 2023

View reviewed changes

xzdandy approved these changes Mar 30, 2023

View reviewed changes

gaurav274 merged commit e3ee455 into master Mar 30, 2023

gaurav274 deleted the kv-cache branch March 30, 2023 14:45

jarulraj mentioned this pull request Apr 3, 2023

[RELEASE]: v0.1.5 #629

Merged

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

feat: support key-value cache for function expressions #550

feat: support key-value cache for function expressions #550

gaurav274 commented Jan 2, 2023 •

edited

Loading

jiashenC Jan 30, 2023

gaurav274 Jan 30, 2023

jarulraj Mar 30, 2023

gaurav274 Mar 30, 2023

xzdandy Mar 30, 2023

xzdandy Mar 30, 2023

		from eva.utils.logging_manager import logger


		class UdfHistoryColumnService(BaseService):


		reuse_batch = execute_query_fetch_all(select_query)
		self._verify_reuse_correctness(select_query, reuse_batch)

feat: support key-value cache for function expressions #550

feat: support key-value cache for function expressions #550

Conversation

gaurav274 commented Jan 2, 2023 • edited Loading

jiashenC Jan 30, 2023

Choose a reason for hiding this comment

gaurav274 Jan 30, 2023

Choose a reason for hiding this comment

jarulraj Mar 30, 2023

Choose a reason for hiding this comment

gaurav274 Mar 30, 2023

Choose a reason for hiding this comment

xzdandy Mar 30, 2023

Choose a reason for hiding this comment

xzdandy Mar 30, 2023

Choose a reason for hiding this comment

gaurav274 commented Jan 2, 2023 •

edited

Loading