[opengl] Optimize range_for for ndarrays #3884

ailzhang · 2021-12-27T02:29:25Z

Stack from ghstack:

Note this PR reduces number of generated shaders for mpm88 from 10 to 6.
There's still one gtmp related shader remaining for temporary values
used across multiple shaders. Whether to further remove that shader need
more benchmark so let's just get rid of addtional shaders introduced by
ndarray range_for for now.

Note this PR reduces number of generated shaders for mpm88 from 10 to 6. There's still one gtmp related shader remaining for temporary values used across multiple shaders. Whether to further remove that shader need more benchmark so let's just get rid of addtional shaders introduced by ndarray range_for for now. [ghstack-poisoned]

Note this PR reduces number of generated shaders for mpm88 from 10 to 6. There's still one gtmp related shader remaining for temporary values used across multiple shaders. Whether to further remove that shader need more benchmark so let's just get rid of addtional shaders introduced by ndarray range_for for now. ghstack-source-id: ae80e9c8d92ee131a37f54bff10a710dd21e79de Pull Request resolved: #3884

Note this PR reduces number of generated shaders for mpm88 from 10 to 6. There's still one gtmp related shader remaining for temporary values used across multiple shaders. Whether to further remove that shader need more benchmark so let's just get rid of addtional shaders introduced by ndarray range_for for now. [ghstack-poisoned]

Note this PR reduces number of generated shaders for mpm88 from 10 to 6. There's still one gtmp related shader remaining for temporary values used across multiple shaders. Whether to further remove that shader need more benchmark so let's just get rid of addtional shaders introduced by ndarray range_for for now. ghstack-source-id: bdb9feba35fa8cd6cc99b826679dde353d706e07 Pull Request resolved: #3884

bobcao3 · 2021-12-28T23:18:21Z

taichi/ir/statements.h

@@ -756,7 +762,8 @@ class RangeForStmt : public Stmt {
                     bit_vectorize,
                     num_cpu_threads,
                     block_dim,
-                     strictly_serialized);
+                     strictly_serialized,
+                     range_of_array);


This parameter name seems slightly confusing?

bobcao3 · 2021-12-28T23:20:10Z

taichi/transforms/offload.cpp

@@ -85,19 +85,35 @@ class Offloader {
        } else {
          offloaded->block_dim = s->block_dim;
        }
-        if (auto val = s->begin->cast<ConstStmt>()) {
+
+        // TODO: We need to update codegen for each backend gradually so let's


When we merge this in let's also notify people working on the vulkan ndarray this change

bobcao3 · 2021-12-28T23:22:14Z

tests/python/test_aot.py

@@ -202,7 +202,7 @@ def init(d: ti.i32, density1: ti.any_arr(), density2: ti.any_arr(),

 @ti.test(arch=ti.opengl)
 def test_opengl_exceed_max_ssbo():
-    # 7 ndarrays + gtmp + args > 8 (maximum allowed)
+    # 8 ndarrays + args > 8 (maximum allowed)


Do we really want this test? This seems a bit arch specific & a lot of devices support more

Yea this test was mainly a self reminder to double check how many ssbos we create in normal cases - we can remove it later :D

bobcao3

LGTM other than a few minor nitpicks

Note this PR reduces number of generated shaders for mpm88 from 10 to 6. There's still one gtmp related shader remaining for temporary values used across multiple shaders. Whether to further remove that shader need more benchmark so let's just get rid of addtional shaders introduced by ndarray range_for for now. [ghstack-poisoned]

Note this PR reduces number of generated shaders for mpm88 from 10 to 6. There's still one gtmp related shader remaining for temporary values used across multiple shaders. Whether to further remove that shader need more benchmark so let's just get rid of addtional shaders introduced by ndarray range_for for now. ghstack-source-id: 3e2c2827bf752d6397cfc7780f2a79f9f2853a3d Pull Request resolved: #3884

Note this PR reduces number of generated shaders for mpm88 from 10 to 6. There's still one gtmp related shader remaining for temporary values used across multiple shaders. Whether to further remove that shader need more benchmark so let's just get rid of addtional shaders introduced by ndarray range_for for now. ghstack-source-id: 3e2c2827bf752d6397cfc7780f2a79f9f2853a3d Pull Request resolved: taichi-dev#3884

ailzhang mentioned this pull request Dec 27, 2021

[opengl] Reduce repeated read to args buffer. #3883

Merged

ailzhang requested review from k-ye and bobcao3 December 28, 2021 06:04

ailzhang changed the title ~~[refactor] Optimize range_for for ndarrays~~ [codegen] Optimize range_for for ndarrays Dec 28, 2021

bobcao3 reviewed Dec 28, 2021

View reviewed changes

bobcao3 approved these changes Dec 28, 2021

View reviewed changes

This was referenced Dec 29, 2021

[opengl] Cache calculated linearized index. #3900

Closed

[opengl] Cache loaded arr elements. #3901

Closed

ailzhang changed the title ~~[codegen] Optimize range_for for ndarrays~~ [opengl] Optimize range_for for ndarrays Dec 29, 2021

ailzhang merged commit 94d21c9 into gh/ailzhang/40/base Dec 29, 2021

ailzhang deleted the gh/ailzhang/40/head branch January 5, 2022 16:33

ailzhang mentioned this pull request Jan 11, 2022

[refactor] [opengl] Get rid of some no-ops in linear seek #3980

Merged

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[opengl] Optimize range_for for ndarrays #3884

[opengl] Optimize range_for for ndarrays #3884

ailzhang commented Dec 27, 2021 •

edited

Loading

bobcao3 Dec 28, 2021

bobcao3 Dec 28, 2021

bobcao3 Dec 28, 2021

ailzhang Dec 29, 2021

bobcao3 left a comment

[opengl] Optimize range_for for ndarrays #3884

[opengl] Optimize range_for for ndarrays #3884

Conversation

ailzhang commented Dec 27, 2021 • edited Loading

bobcao3 Dec 28, 2021

Choose a reason for hiding this comment

bobcao3 Dec 28, 2021

Choose a reason for hiding this comment

bobcao3 Dec 28, 2021

Choose a reason for hiding this comment

ailzhang Dec 29, 2021

Choose a reason for hiding this comment

bobcao3 left a comment

Choose a reason for hiding this comment

ailzhang commented Dec 27, 2021 •

edited

Loading