diff --git a/02Hardware/README.md b/02Hardware/README.md index ff45d0e3..57e2dc91 100644 --- a/02Hardware/README.md +++ b/02Hardware/README.md @@ -2,7 +2,7 @@ # AI 硬件体系架构概述 -AI 硬件体系架构主要是指 AI 芯片,这里就很硬核了,从芯片的基础到 AI 芯片的范围都会涉及,芯片设计需要考虑上面 AI 框架的前端、后端编译,而不是停留在天天喊着吊打英伟达,被现实打趴。 +AI 芯片,作为 AI 的硬件体系架构主要是指 AI 芯片,这里就很硬核了,从CPU、GPU 的芯片基础到 AI 芯片的原理、设计和应用场景范围,AI 芯片的设计不仅仅考虑针对 AI 计算的加速,还需要充分考虑到AI 的应用算法、AI 框架等中间件,而不是停留在天天喊着吊打英伟达和 CUDA,实际上芯片难以用起来。 ## 课程简介 @@ -16,7 +16,7 @@ AI 硬件体系架构主要是指 AI 芯片,这里就很硬核了,从芯片 - [**《国外 AI 芯片》**](./05Abroad/):深入地剖析国外谷歌 TPU 和特斯拉 DOJO 相关 AI 芯片的架构,以 TPU 为主主要使用了数据流(Data FLow)的方式的脉动阵列来加速矩阵的运算,而特斯拉则使用了近存计算(Near Memory)两种不同的产品形态。 -- [**《国内 AI 芯片》**](./06Domestic/):深入地解读国内 AI 初创芯片厂商如国内第一 AI 芯片上市公司寒武纪、国内造 GPU 声势最大的壁仞科技、腾讯重头的燧原科技等科技公司的 AI 芯片架构。 +- [**《国内 AI 芯片》**](./06Domestic/):深入地解读国内 AI 芯片厂商,首先第一个肯定是华为昇腾 Ascend,还有初创芯片厂商如国内第一 AI 芯片上市公司寒武纪、国内造 GPU 声势最大的壁仞科技、腾讯重头的燧原科技等科技公司的 AI 芯片架构。 - [**《AI 芯片黄金十年》**](./07Thought/):基于 AI 芯片的 SIMD 硬件结构和 SIMT 的硬件结构原理,分析其上层的编程模型 SPMD 与 CUDA 之间的关系,去了解做好 AI 芯片其实跟软件的关联性也有着密切的关系,并对 AI 芯片近 10 年的发展进行一个总结和思考。 diff --git a/02Hardware/images/cover_horizontal.png b/02Hardware/images/cover_horizontal.png new file mode 100644 index 00000000..b8d216dc Binary files /dev/null and b/02Hardware/images/cover_horizontal.png differ diff --git a/02Hardware/images/cover_horizontal.psd b/02Hardware/images/cover_horizontal.psd new file mode 100644 index 00000000..0700e243 Binary files /dev/null and b/02Hardware/images/cover_horizontal.psd differ diff --git a/02Hardware/images/cover_portrait.png b/02Hardware/images/cover_portrait.png new file mode 100644 index 00000000..a8e0eea1 Binary files /dev/null and b/02Hardware/images/cover_portrait.png differ diff --git a/02Hardware/images/cover_portrait.psd b/02Hardware/images/cover_portrait.psd new file mode 100644 index 00000000..66ac4810 Binary files /dev/null and b/02Hardware/images/cover_portrait.psd differ diff --git a/README.md b/README.md index 23e2d6e3..e03e1555 100644 --- a/README.md +++ b/README.md @@ -19,7 +19,7 @@ | 教程内容 | 简介 | 地址 | | ------------------ | ------------------------------------------------------------ | ------------------------------------------------------------ | | AI 系统全栈概述 | AI 基础知识和 AI 系统的全栈概述的AI 系统概述,以及深度学习系统的系统性设计和方法论,主要是整体了解 AI 训练和推理全栈的体系结构内容。 | [[Slides](./01Introduction/README.md)] | -| AI 芯片与体系架构 | 硬核篇介绍 AI 硬件的体系架构,这里就很硬核了,从芯片基础到 AI 芯片的范围都会涉及,芯片设计需要考虑上面 AI 框架的前端、后端编译,而不是停留在天天喊着吊打英伟达,被现实打趴。 | [[Slides](./02Hardware/README.md)] | +| AI 芯片与体系架构 | 作为 AI 的硬件体系架构主要是指 AI 芯片,这里就很硬核了,从CPU、GPU 的芯片基础到 AI 芯片的原理、设计和应用场景范围,AI 芯片的设计不仅仅考虑针对 AI 计算的加速,还需要充分考虑到AI 的应用算法、AI 框架等中间件,而不是停留在天天喊着吊打英伟达和 CUDA,实际上芯片难以用起来。 | [[Slides](./02Hardware/README.md)] | | AI 编程与计算架构 | 进阶篇介绍 AI 编程与计算架构,将站在系统设计的角度,思考在设计现代机器学习系统中需要考虑的编译器问题,特别是中间表达乃至后端优化。 | [[Slides](./03Compiler/README.md)] | | AI 推理系统与引擎 | 实际应用推理系统与引擎,讲了太多原理身体太虚容易消化不良,还是得回归到业务本质,让行业、企业能够真正应用起来,而推理系统涉及一些核心算法和注意的事情也分享下。 | [[Slides](./04Inference/README.md)] | | AI 框架核心技术 | 介绍 AI 框架核心技术,首先介绍任何一个 AI 框架都离不开的自动微分,通过自动微分功能后就会产生表示神经网络的图和算子,然后介绍 AI 框架前端的优化,还有最近很火的大模型分布式训练在 AI 框架中的关键技术。 | [[Slides](./05Framework/README.md)] |