-
Notifications
You must be signed in to change notification settings - Fork 73
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
[WeeklyReports] 2024.05.11~2024.05.24 周报汇总 #280
Comments
姓名黄济懿 本周工作
下周工作
详细周报链接 |
姓名卢林军 本周工作
下周工作
详细周报链接: |
姓名卢畅 实习项目静态图半自动并行训练性能优化 本周工作1. 为 ZBV 适配分布式标记由于 ZBV 的 V 型编排和 VPP 的切图方式不同,我们需要对 ZBV 的分布式切分标记进行适配。 2. 在实际业务场景下验证性能在 Llama2 上进行了实际业务场景下的性能测试,发现了一些问题。
3. 将 zbv 编排和显存估计功能结合相关 PR:
4. 为流水线 timeline 工具适配动转静之前流水线 timeline 可视化工具只能适配静态图,现在我们将其适配动转静的情况。 相关 PR:
详细周报链接 |
姓名Yang-Changhui 本周工作
下周工作
相关PR:
详细周报链接: |
姓名梁书豪 本周工作
下周工作
详细周报链接: |
姓名张千芊 本周工作
下周工作
详细周报链接: |
姓名YibinLiu666 本周工作
下周工作
|
姓名李睿文 本周工作
下周工作
详细周报链接: |
姓名李帅 Github ID: lishuai-97 本周工作本周主要工作内容为完善XXX梯度裁剪算法论文,目前已完成论文投稿工作。 下周工作总结实习项目,准备项目答辩。 详细周报链接: |
姓名叶柯 实习项目PaddleMIX 套件能力建设(图文方向) 本周工作本周主要工作如下: 优化qwen的mixtoken策略,解决了预处理数据集时显存易溢出的问题 下周工作
详细周报链接: |
姓名田川 本周工作
下周工作
详细周报链接: |
姓名Github ID: yulangz 实习项目CINN子图鲁棒性和性能优化 本周工作
下周工作
详细周报链接 |
姓名DUCH714 本周工作使用transformer结构有效地处理各种不同数据类型。 下周工作尝试处理更多数据集,提升泛化能力。 详细周报链接: |
姓名蔡越 实习项目PaddleMIX 套件能力建设(文图方向) 本周工作
下周工作
|
姓名尹帆 本周工作
下周工作
详细周报链接: |
姓名徐苏勇 本周工作
下周工作
详细周报链接: |
姓名刘卓鑫 实习项目PaddleSpeech 套件能力建设本周工作
下周工作
详细周报链接 |
姓名凌少鹏 本周工作
下周工作
详细周报链接: |
姓名Github ID: unseenme 本周工作
下周工作
详细周报链接: |
姓名何咏哲 本周工作
下周工作
详细周报链接: |
姓名周波涛 实习项目算子支持复数计算专项 本周工作下周工作
详细周报链接: |
[WeeklyReports] 2024.05.11~2024.05.24 周报汇总
请各位学员在本 issue 下以 comment 的形式填写周报摘要,ddl 本周五晚,格式示例如下:
项目二:PIR 控制流专项
项目三:PIR Python API 升级及机制建设
项目四:动转静 SOT 模块 Python 3.12 支持
项目五:算子支持复数计算专项
项目六:模型迁移工具建设
项目七:框架 API 易用性提升
项目八:组合机制算子专项和机制建设
项目九:高阶微分的性能分析和优化
项目十:静态图半自动并行训练性能优化
项目十一:全自动并行架构升级
项目十二:科学计算领域拓展专项(DeePMD-kit、光学案例)
项目十三:科学计算领域拓展专项(超分重构方向)
项目十四:科学计算领域拓展专项(领域流体方向)
项目十五:科学计算领域拓展专项(领域气象方向)
项目十六:CINN 支持动态 Shape 专项(前端方向)
项目十八:CINN 静态 shape 下鲁棒性和性能优化
项目十九:CINN 支持动态 Shape 专项(后端规则升级)
项目二十:CINN 支持动态 Shape 专项 (后端模型扩量)
项目二十一:Paddle CMake 治理和编译优化
项目二十二:PaddleMIX 套件能力建设(文图方向)
项目二十三:PaddleMIX 套件能力建设(图文方向)
项目二十四:大模型训练稳定性和高效低价小模型快速收敛
项目二十六:推理 Pass & 融合算子优化
项目二十七:PaddleSpeech 套件能力建设
The text was updated successfully, but these errors were encountered: