[PIR-Auto-Parallel] [cherry-pick] refactor refined recompute pass in PIR mode #70703

waliwali777 · 2025-01-08T06:53:45Z

PR Category

Auto Parallel

PR Types

Performance

Description

该 PR 是在 recompute pass( #69681 ) 的基础上，实现的 refined recompute，是在recompute layer 中选择一些算子不参与重计算，其开关在代码中的调用如下所示：

strategy = dist.Strategy()
strategy._recompute.enable = True
strategy._recompute.refined_ops_patterns = [
            {
                "main_ops": ["matmul"],
                "num": -1,
                "pre_ops": ["multiply"],
                "suf_ops": [],
            }
        ]
...
model = dist.to_static(model, dist_loader, criterion, optimizer, strategy=strategy)

在每个layer segment 中，按照计算图拓扑结构匹配 pattern = pre_ops + main_ops + suf_ops，其中，pre_ops 和 suf_ops 是用于辅助匹配 main_ops 的，对于匹配到的前 num 个 main_ops，在反向时不进行重计算，当 num = -1 时，默认匹配到的 main_ops 全部不进行重计算。

同时 pass 也对 segment 的数目进行 assert 断言检测，如果在开启recompute ( strategy._recompute.enable=1)，但是在模型代码没有使用到 recompute(layer)，则将在 recompute pass 中报错

其他：
PaddleNLP 中增加 refined recompute 的测试：PaddlePaddle/PaddleNLP#9679
该实现部分参考了旧 IR 下 refined recompute实现：#58533

PCard-88114

…ePaddle#70064)

…dlePaddle#70521)

paddle-bot · 2025-01-08T06:53:49Z

你的PR提交成功，感谢你对开源项目的贡献!
请关注后续CI自动化测试结果，详情请参考Paddle-CI手册。
Your PR has been submitted. Thanks for your contribution!
Please wait for the result of CI firstly. See Paddle CI Manual for details.

waliwali777 added 2 commits January 8, 2025 12:04

[PIR-Auto-Parallel]refactor refined recompute pass in PIR mode (Paddl…

0e029c2

…ePaddle#70064)

[PIR-Auto-Parallel] Add assert when no segemnt in recompute pass (Pad…

6187b08

…dlePaddle#70521)

waliwali777 closed this Jan 8, 2025

waliwali777 reopened this Jan 8, 2025

waliwali777 closed this Jan 8, 2025

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[PIR-Auto-Parallel] [cherry-pick] refactor refined recompute pass in PIR mode #70703

[PIR-Auto-Parallel] [cherry-pick] refactor refined recompute pass in PIR mode #70703

waliwali777 commented Jan 8, 2025

paddle-bot bot commented Jan 8, 2025

[PIR-Auto-Parallel] [cherry-pick] refactor refined recompute pass in PIR mode #70703

[PIR-Auto-Parallel] [cherry-pick] refactor refined recompute pass in PIR mode #70703

Conversation

waliwali777 commented Jan 8, 2025

PR Category

PR Types

Description

paddle-bot bot commented Jan 8, 2025