Preliminary benchmarking #185

richard-rogers · 2023-11-10T18:08:50Z

Some benchmarking on AWS instances

jamie256 · 2023-11-10T18:15:25Z

README.md

+|-------------------|:-------------:|----------------:|
+| p3.2xlarge        | Light metrics | 1800 chats/sec  |
+|                   | LLM metrics   | 9.8 chats/sec   |
+|                   | All metrics   | 0.32 chats/sec  |


Let's validate the GPU flavors of dependency closure for the p3. Might try with g4dn.xlarge instances since those latest supported types in the Databricks ML GPU runtimes

Let's remove the GPU rows until we can investigate their behavior further, the c5.xlarge rows are still useful as a start

README.md

richard-rogers added 2 commits November 10, 2023 03:18

Update README.md

3d430d4

Update README.md

10a3d7d

richard-rogers requested review from bernease, FelipeAdachi and jamie256 November 10, 2023 18:08

jamie256 reviewed Nov 10, 2023

View reviewed changes

pre-commit

08ee228

richard-rogers commented Nov 13, 2023

View reviewed changes

README.md Outdated Show resolved Hide resolved

Update README.md

122923b

jamie256 approved these changes Nov 13, 2023

View reviewed changes

jamie256 merged commit 1dffcd4 into main Nov 13, 2023
12 checks passed

jamie256 deleted the dev/richard/benchmark branch November 13, 2023 20:34

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Preliminary benchmarking #185

Preliminary benchmarking #185

richard-rogers commented Nov 10, 2023

jamie256 Nov 10, 2023

jamie256 Nov 10, 2023

Preliminary benchmarking #185

Preliminary benchmarking #185

Conversation

richard-rogers commented Nov 10, 2023

jamie256 Nov 10, 2023

Choose a reason for hiding this comment

jamie256 Nov 10, 2023

Choose a reason for hiding this comment