Skip to content

Commit

Permalink
update summary
Browse files Browse the repository at this point in the history
  • Loading branch information
chenzomi12 committed Aug 8, 2024
1 parent 770c130 commit 2d7ebf3
Show file tree
Hide file tree
Showing 6 changed files with 3 additions and 3 deletions.
4 changes: 2 additions & 2 deletions 02Hardware/README.md
Original file line number Diff line number Diff line change
Expand Up @@ -2,7 +2,7 @@

# AI 硬件体系架构概述

AI 硬件体系架构主要是指 AI 芯片,这里就很硬核了,从芯片的基础到 AI 芯片的范围都会涉及,芯片设计需要考虑上面 AI 框架的前端、后端编译,而不是停留在天天喊着吊打英伟达,被现实打趴
AI 芯片,作为 AI 的硬件体系架构主要是指 AI 芯片,这里就很硬核了,从CPU、GPU 的芯片基础到 AI 芯片的原理、设计和应用场景范围,AI 芯片的设计不仅仅考虑针对 AI 计算的加速,还需要充分考虑到AI 的应用算法、AI 框架等中间件,而不是停留在天天喊着吊打英伟达和 CUDA,实际上芯片难以用起来

## 课程简介

Expand All @@ -16,7 +16,7 @@ AI 硬件体系架构主要是指 AI 芯片,这里就很硬核了,从芯片

- [**《国外 AI 芯片》**](./05Abroad/):深入地剖析国外谷歌 TPU 和特斯拉 DOJO 相关 AI 芯片的架构,以 TPU 为主主要使用了数据流(Data FLow)的方式的脉动阵列来加速矩阵的运算,而特斯拉则使用了近存计算(Near Memory)两种不同的产品形态。

- [**《国内 AI 芯片》**](./06Domestic/):深入地解读国内 AI 初创芯片厂商如国内第一 AI 芯片上市公司寒武纪、国内造 GPU 声势最大的壁仞科技、腾讯重头的燧原科技等科技公司的 AI 芯片架构。
- [**《国内 AI 芯片》**](./06Domestic/):深入地解读国内 AI 芯片厂商,首先第一个肯定是华为昇腾 Ascend,还有初创芯片厂商如国内第一 AI 芯片上市公司寒武纪、国内造 GPU 声势最大的壁仞科技、腾讯重头的燧原科技等科技公司的 AI 芯片架构。

- [**《AI 芯片黄金十年》**](./07Thought/):基于 AI 芯片的 SIMD 硬件结构和 SIMT 的硬件结构原理,分析其上层的编程模型 SPMD 与 CUDA 之间的关系,去了解做好 AI 芯片其实跟软件的关联性也有着密切的关系,并对 AI 芯片近 10 年的发展进行一个总结和思考。

Expand Down
Binary file added 02Hardware/images/cover_horizontal.png
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Binary file added 02Hardware/images/cover_horizontal.psd
Binary file not shown.
Binary file added 02Hardware/images/cover_portrait.png
Loading
Sorry, something went wrong. Reload?
Sorry, we cannot display this file.
Sorry, this file is invalid so it cannot be displayed.
Binary file added 02Hardware/images/cover_portrait.psd
Binary file not shown.
2 changes: 1 addition & 1 deletion README.md
Original file line number Diff line number Diff line change
Expand Up @@ -19,7 +19,7 @@
| 教程内容 | 简介 | 地址 |
| ------------------ | ------------------------------------------------------------ | ------------------------------------------------------------ |
| AI 系统全栈概述 | AI 基础知识和 AI 系统的全栈概述的AI 系统概述,以及深度学习系统的系统性设计和方法论,主要是整体了解 AI 训练和推理全栈的体系结构内容。 | [[Slides](./01Introduction/README.md)] |
| AI 芯片与体系架构 | 硬核篇介绍 AI 硬件的体系架构,这里就很硬核了,从芯片基础到 AI 芯片的范围都会涉及,芯片设计需要考虑上面 AI 框架的前端、后端编译,而不是停留在天天喊着吊打英伟达,被现实打趴| [[Slides](./02Hardware/README.md)] |
| AI 芯片与体系架构 | 作为 AI 的硬件体系架构主要是指 AI 芯片,这里就很硬核了,从CPU、GPU 的芯片基础到 AI 芯片的原理、设计和应用场景范围,AI 芯片的设计不仅仅考虑针对 AI 计算的加速,还需要充分考虑到AI 的应用算法、AI 框架等中间件,而不是停留在天天喊着吊打英伟达和 CUDA,实际上芯片难以用起来| [[Slides](./02Hardware/README.md)] |
| AI 编程与计算架构 | 进阶篇介绍 AI 编程与计算架构,将站在系统设计的角度,思考在设计现代机器学习系统中需要考虑的编译器问题,特别是中间表达乃至后端优化。 | [[Slides](./03Compiler/README.md)] |
| AI 推理系统与引擎 | 实际应用推理系统与引擎,讲了太多原理身体太虚容易消化不良,还是得回归到业务本质,让行业、企业能够真正应用起来,而推理系统涉及一些核心算法和注意的事情也分享下。 | [[Slides](./04Inference/README.md)] |
| AI 框架核心技术 | 介绍 AI 框架核心技术,首先介绍任何一个 AI 框架都离不开的自动微分,通过自动微分功能后就会产生表示神经网络的图和算子,然后介绍 AI 框架前端的优化,还有最近很火的大模型分布式训练在 AI 框架中的关键技术。 | [[Slides](./05Framework/README.md)] |
Expand Down

0 comments on commit 2d7ebf3

Please sign in to comment.