-
Notifications
You must be signed in to change notification settings - Fork 758
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
【Hackathon No.113】 PR.md #4464
【Hackathon No.113】 PR.md #4464
Conversation
【队名】:xd_no-bad 【序号】:113 【状态】:PR提交
Thanks for your contribution! |
* update citation * update citation
docs/eval/【Hackathon No.113】 PR.md
Outdated
| :------------ | ---------- | --------------- | ------ | ------| | ||
| 序号 | 核心步骤 | 完成情况(成功/不成功) | 遇到问题 |解决方法(无法解决请注明)| | ||
| 1 | 导入分布式训练所需要的依赖包 | 完成 | 无 | 无 | | ||
| 2 | 初始化分布式环境 | 完成 | paddlepaddle安装有时候会有一些问题、NCCL初始化有问题 | 使用export设置一些安装的库的环境变量 | |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
是否可以把NCCL初始化遇到的具体问题罗列出来? 以及设置环境变量的解决方案。考虑后续更新改安装文档。谢谢!
docs/eval/【Hackathon No.113】 PR.md
Outdated
| 1 | 导入分布式训练所需要的依赖包 | 完成 | 无 | 无 | | ||
| 2 | 初始化分布式环境 | 完成 | paddlepaddle安装有时候会有一些问题、NCCL初始化有问题 | 使用export设置一些安装的库的环境变量 | | ||
| 3 | 设置分布式训练需要的优化器 | 完成 | 无 | 无 | | ||
| 4 | 数据集拆分 | 完成 | 示例里面没有数据集的拆分案例,不会使用数据集的拆分;使用DistributedBatchSampler采样器之后DataLoader中无法指定batchsize以及shuffle参数 | 分析paddle的分布式API底层以及结合其他深度学习框架分析,发现了DistributedBatchSampler API,然后分析其底层实现,发现可以应用;分析DataLoader底层的源码,发现在指定batch_sampler参数之后不能指定batchsize、shuffle以及drop_last参数,然后在DistributedBatchSampler构建采样器的过程中指定 | |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
这里可以提供下您分析后的分布式数据集拆分案例和详细介绍。
已回复并且在pr中已修改 |
@xymyeah 请review下~ |
There was a problem hiding this comment.
Choose a reason for hiding this comment
The reason will be displayed to describe this comment to others. Learn more.
整体内容和结构比较完整,其中对于FleetAPI的对比上全面性稍有欠缺,如分布式策略对比等,易用性对比结论可靠性需要进一步验证。
【队名】:xd_no-bad
【序号】:113
【状态】:PR提交