PaddlePaddle · TCChenlong · Apr 22, 2022 · Apr 19, 2022 · Apr 19, 2022 · Apr 19, 2022
diff --git a/docs/guides/09_hardware_support/hardware_info_cn.md b/docs/guides/09_hardware_support/hardware_info_cn.md
@@ -10,7 +10,7 @@
 | 服务端GPU |  | NVIDIA | 常见GPU型号如V100、T4等| [安装](https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/2.0/install/pip/linux-pip.html) | [源码编译](https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/2.0/install/compile/linux-compile.html) | ✔️ |  |
 | AI加速芯片 | 达芬奇 | 华为 | 昇腾910 | 即将提供 | | | |
 | AI加速芯片 |  | 海光 | 海光DCU | [安装](https://www.paddlepaddle.org.cn/documentation/docs/zh/develop/guides/rocm_docs/paddle_install_cn.html) | [源码编译](https://www.paddlepaddle.org.cn/documentation/docs/zh/develop/guides/rocm_docs/paddle_install_cn.html) | ✔️ | [支持模型](https://www.paddlepaddle.org.cn/documentation/docs/zh/develop/guides/rocm_docs/paddle_rocm_cn.html) |
-| AI加速芯片 | XPU | 百度 | 昆仑K100、K200等 | [安装](https://www.paddlepaddle.org.cn/documentation/docs/zh/guides/xpu_docs/paddle_install_cn.html#wheel) | [源码编译](https://www.paddlepaddle.org.cn/documentation/docs/zh/guides/xpu_docs/paddle_install_cn.html#id2) |  | [支持模型](https://www.paddlepaddle.org.cn/documentation/docs/zh/guides/xpu_docs/paddle_2.0_xpu_cn.html) |
+| AI加速芯片 | XPU | 百度 | 昆仑K200、R200等 | [安装](https://www.paddlepaddle.org.cn/documentation/docs/zh/guides/xpu_docs/paddle_install_cn.html#wheel) | [源码编译](https://www.paddlepaddle.org.cn/documentation/docs/zh/guides/xpu_docs/paddle_install_cn.html#id2) |  | [支持模型](https://www.paddlepaddle.org.cn/documentation/docs/zh/guides/xpu_docs/paddle_2.0_xpu_cn.html) |
 | AI加速芯片 | IPU | Graphcore | GC200 | | [源码编译](/documentation/docs/guides/09_hardware_support/ipu_docs/index_cn.html) |  | |
 
 ## Paddle Inference
@@ -22,10 +22,10 @@
 | 移动端GPU |  | NVIDIA | Jetson系列 | [预编译库](https://paddleinference.paddlepaddle.org.cn/user_guides/download_lib.html) | [源码编译](https://paddleinference.paddlepaddle.org.cn/user_guides/source_compile.html) | ✔️ |   |
 | AI加速芯片 | 达芬奇 | 华为 | 昇腾910 | 即将提供 | | | |
 | AI加速芯片 |  | 海光 | 海光DCU | [预编译库](https://www.paddlepaddle.org.cn/documentation/docs/zh/develop/guides/rocm_docs/paddle_install_cn.html) | [源码编译](https://www.paddlepaddle.org.cn/documentation/docs/zh/develop/guides/rocm_docs/paddle_install_cn.html) | ✔️ | [支持模型](https://www.paddlepaddle.org.cn/documentation/docs/zh/develop/guides/rocm_docs/paddle_rocm_cn.html) |
-| AI加速芯片 | XPU | 百度 | 昆仑K100、K200等 | [预编译库](https://www.paddlepaddle.org.cn/documentation/docs/zh/guides/xpu_docs/paddle_install_cn.html#wheel) | [源码编译](https://www.paddlepaddle.org.cn/documentation/docs/zh/guides/xpu_docs/paddle_install_cn.html#id2) |  | [支持模型](https://www.paddlepaddle.org.cn/documentation/docs/zh/guides/xpu_docs/paddle_2.0_xpu_cn.html) |
-| 服务端CPU | ARM | 飞腾 | FT-2000+/64 |  |[源码编译](https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/2.0/install/compile/arm-compile.html#anchor-1) |  | [支持模型](https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/2.0/install/compile/arm-compile.html#anchor-6) |
+| AI加速芯片 | XPU | 百度 | 昆仑K200、R200等 | [预编译库](https://www.paddlepaddle.org.cn/documentation/docs/zh/guides/xpu_docs/paddle_install_cn.html#wheel) | [源码编译](https://www.paddlepaddle.org.cn/documentation/docs/zh/guides/xpu_docs/paddle_install_cn.html#id2) |  | [支持模型](https://www.paddlepaddle.org.cn/documentation/docs/zh/guides/xpu_docs/paddle_2.0_xpu_cn.html) |
+| 服务端CPU | ARM | 飞腾 | FT-2000+/64、S2500 |  |[源码编译](https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/2.0/install/compile/arm-compile.html#anchor-1) |  | [支持模型](https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/2.0/install/compile/arm-compile.html#anchor-6) |
 | 服务端CPU | ARM | 华为 | 鲲鹏 920 2426SK |  |[源码编译](https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/2.0/install/compile/arm-compile.html#anchor-1) |  | [支持模型](https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/2.0/install/compile/arm-compile.html#anchor-6) |
-| 服务端CPU | MIPS | 龙芯 | 龙芯3A4000 |  |[源码编译](https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/2.0/install/compile/mips-compile.html#anchor-1) |  | [支持模型](https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/2.0/install/compile/mips-compile.html#anchor-6) |
+| 服务端CPU | MIPS | 龙芯 | 龙芯3A4000、3A5000、3C5000L |  |[源码编译](https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/2.0/install/compile/mips-compile.html#anchor-1) |  | [支持模型](https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/2.0/install/compile/mips-compile.html#anchor-6) |
 | 服务端CPU | x86 | 兆芯 | 全系列CPU |  |[源码编译](https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/2.0/install/compile/zhaoxin-compile.html#anchor-1) |  | [支持模型](https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/2.0/install/compile/zhaoxin-compile.html#anchor-6) |
 
 ## Paddle Lite
@@ -40,7 +40,7 @@
 | AI加速芯片 |  | RockChip | RK1808 |  | [源码编译](https://paddlelite.paddlepaddle.org.cn/demo_guides/rockchip_npu.html#id5) |  | [支持模型](https://paddlelite.paddlepaddle.org.cn/demo_guides/rockchip_npu.html#id1) |
 | AI加速芯片 |  | MTK | NeuroPilot APU |  | [源码编译](https://paddlelite.paddlepaddle.org.cn/demo_guides/mediatek_apu.html#id1) |  | [支持模型](https://paddlelite.paddlepaddle.org.cn/demo_guides/mediatek_apu.html#id1) |
 | AI加速芯片 |  | Imagination | PowerVR 2NX |  | [源码编译](https://paddlelite.paddlepaddle.org.cn/demo_guides/huawei_kirin_npu.html#id5) |  | [支持模型](https://paddlelite.paddlepaddle.org.cn/demo_guides/huawei_kirin_npu.html#id1) |
-| AI加速芯片 |  | 百度 | 昆仑K100、K200等 |  | [源码编译](https://paddlelite.paddlepaddle.org.cn/demo_guides/baidu_xpu.html#id4) |  | [支持模型](https://paddlelite.paddlepaddle.org.cn/demo_guides/baidu_xpu.html#id1) |
+| AI加速芯片 |  | 百度 | 昆仑K200、R200等 |  | [源码编译](https://paddlelite.paddlepaddle.org.cn/demo_guides/baidu_xpu.html#id4) |  | [支持模型](https://paddlelite.paddlepaddle.org.cn/demo_guides/baidu_xpu.html#id1) |
 | AI加速芯片 |  | 寒武纪 | 思元270 |  | 即将提供 |   |   |
 | AI加速芯片 |  | 比特大陆 | 算丰BM16系列芯片 |  | [源码编译](https://paddlelite.paddlepaddle.org.cn/demo_guides/bitmain.html#id5) |  | [支持模型](https://paddlelite.paddlepaddle.org.cn/demo_guides/bitmain.html#id1) |
 | FPGA |  | 百度 | 百度Edgeboard开发板 |  | [源码编译](https://paddlelite.paddlepaddle.org.cn/demo_guides/baidu_xpu.html#id4) |  | [支持模型](https://ai.baidu.com/ai-doc/HWCE/Qkda68drw) |

diff --git a/docs/guides/09_hardware_support/index_cn.rst b/docs/guides/09_hardware_support/index_cn.rst
@@ -19,4 +19,4 @@
     xpu_docs/index_cn.rst
     rocm_docs/index_cn.rst
     npu_docs/index_cn.rst
-    ipu_docs/index_cn.rst
+    ipu_docs/index_cn.rst
diff --git a/docs/guides/09_hardware_support/xpu_docs/index_cn.rst b/docs/guides/09_hardware_support/xpu_docs/index_cn.rst
@@ -1,21 +1,32 @@
 .. _cn_xpu_information:
 
 ####################
-昆仑XPU芯片运行飞桨
+昆仑芯片运行飞桨
 ####################
 
-百度昆仑AI计算处理器（Baidu KUNLUN AI Computing Processor）是百度集十年AI产业技术实践于2019年推出的全功能AI芯片。基于自主研发的先进XPU架构，为云端和边缘端的人工智能业务而设计。 百度昆仑与飞桨及其他国产软硬件强强组合，打造一个全面领先的国产化AI技术生态，部署和应用于诸多 “人工智能+“的行业领域，包括智能云和高性能计算，智慧制造、智慧城市和安防等。更多昆仑XPU芯片详情及技术指标请 `点击这里 <https://cloud.baidu.com/product/kunlun.html>`_ 。
+百度昆仑AI计算处理器（Baidu KUNLUN AI Computing Processor）是百度集十年AI产业技术实践于2019年推出的全功能AI芯片。基于自主研发的先进XPU架构，为云端和边缘端的人工智能业务而设计。 百度昆仑与飞桨及其他国产软硬件强强组合，打造一个全面领先的国产化AI技术生态，部署和应用于诸多 “人工智能+“的行业领域，包括智能云和高性能计算，智慧制造、智慧城市和安防等。更多昆仑XPU芯片详情及技术指标请 `点击这里 <https://www.kunlunxin.com.cn/>`_ 。
 参考以下内容可快速了解和体验昆仑XPU芯片上运行飞桨：
 
-- `飞桨对昆仑XPU芯片的支持 <./paddle_2.0_xpu_cn.html>`_ : 飞桨支持昆仑XPU芯片运行
-- `飞桨框架昆仑xpu版安装说明 <./paddle_install_cn.html>`_ : 飞桨框架昆仑xpu版安装说明
-- `飞桨框架昆仑XPU版训练示例 <./train_example_cn.html>`_ : 飞桨框架昆仑XPU版训练示例
-- `飞桨预测库昆仑XPU版安装及使用 <./inference_install_example_cn.html>`_ : 飞桨预测库昆仑XPU版安装及使用示例
+昆仑芯2代芯片：
+
+    - `飞桨对昆仑2代芯片的支持 <./paddle_2.0_xpu_cn.html>`_ : 飞桨支持昆仑2代芯片（R200、R300）运行
+    - `飞桨框架昆仑2代芯片安装说明 <./paddle_install_cn.html>`_ : 飞桨框架昆仑2代芯片（R200、R300）安装说明
+    - `飞桨框架昆仑2代芯片训练示例 <./train_example_cn.html>`_ : 飞桨框架昆仑2代芯片（R200、R300）训练示例 
+
+昆仑芯1代芯片：
+
+    - `飞桨对昆仑1代芯片的支持 <./paddle_2.0_xpu_cn.html>`_ : 飞桨支持昆仑1代芯片（K100、K200）运行
+    - `飞桨框架昆仑1代芯片安装说明 <./paddle_install_cn.html>`_ : 飞桨框架昆仑1代芯片（K100、K200）安装说明
+    - `飞桨框架昆仑1代芯片训练示例 <./train_example_cn.html>`_ : 飞桨框架昆仑1代芯片（K100、K200）训练示例
+    - `飞桨预测库昆仑1代芯片安装及使用 <./inference_install_example_cn.html>`_ : 飞桨预测库昆仑1代芯片（K100、K200）版安装及使用示例    
 
 ..  toctree::
     :hidden:
 
+    paddle_2.0_xpu2_cn.md
+    paddle_install_xpu2_cn.md
+    train_example_xpu2_cn.md
     paddle_2.0_xpu_cn.md
     paddle_install_cn.md
     train_example_cn.md
-    inference_install_example_cn.md
+    inference_install_example_cn.md
diff --git a/docs/guides/09_hardware_support/xpu_docs/paddle_2.0_xpu2_cn.md b/docs/guides/09_hardware_support/xpu_docs/paddle_2.0_xpu2_cn.md
@@ -0,0 +1,36 @@
+# 飞桨对昆仑2代芯片的支持
+
+飞桨自2.3rc版本起支持在昆仑2代芯片上（R200，R300）运行，经验证的模型训练的支持情况如下：
+
+## 训练支持
+
+可进行单机单卡/单机多卡训练的模型，如下所示：
+
+| 模型               | 领域     | 编程范式      | 可用的CPU类型           | 单机单卡支持   |  单机多卡支持   |
+| ------------------ | -------- |------------- | ----------------------- | -------------- | -------------- |
+| ResNet50           | 图像分类 | 动态图        | X86（Intel）            | 支持           |-           |
+| MobileNet_v3       | 图像分类 | 动态图        | X86（Intel）            | 支持           |-           |
+| UNet               | 图像分割 | 动态图        | X86（Intel）            | 支持           |-           |
+| Yolov3-DarkNet53   | 目标检测 | 动态图        | X86（Intel）            | 支持           |-           |
+| SSD-ResNet34       | 目标检测 | 动态图        | X86（Intel）            | 支持           |支持         |
+| OCR-DB             | 文字检测 | 动态图        | X86（Intel）            | 支持           |-           |
+| Bert-Base          | NLP     | 静态图        | X86（Intel）            | 支持           |支持         |
+| Transformer        | NLP     | 静态图        | X86（Intel）            | 支持           |支持         |
+| GPT-2              | NLP     | 动态图        | X86（Intel）            | 支持           |-           |
+| DeepFM             | 推荐    | 动态图        | X86（Intel）             | 支持           |-           |
+| Wide&Deep          | 推荐    | 动态图        | X86（Intel）             | 支持           |-           |
+
+
+
+模型放置在飞桨模型套件中，作为github.com/PaddlePaddle下的独立repo存在，git clone下载即可获取所需的模型文件：
+
+| 领域     | 套件名称        | 分支/版本   |
+| -------- | --------------- | ----------- |
+| 图像分类 | [PaddleClas](https://github.com/PaddlePaddle/PaddleClas)      | [develop](https://github.com/PaddlePaddle/PaddleClas/tree/develop) |
+| 目标检测 | [PaddleDetection](https://github.com/PaddlePaddle/PaddleDetection) | [develop](https://github.com/PaddlePaddle/PaddleDetection/tree/develop) |
+| 图像分割 | [PaddleSeg](https://github.com/PaddlePaddle/PaddleSeg)       | [develop](https://github.com/PaddlePaddle/PaddleSeg/tree/develop) |
+| NLP     | [PaddleNLP](https://github.com/PaddlePaddle/PaddleNLP)       | [develop](https://github.com/PaddlePaddle/PaddleNLP/tree/develop) |
+| OCR     | [PaddleOCR](https://github.com/PaddlePaddle/PaddleOCR)       | [dygraph](https://github.com/PaddlePaddle/PaddleOCR/tree/dygraph) |
+| 推荐     | [PaddleREC](https://github.com/PaddlePaddle/PaddleRec)       | [master](https://github.com/PaddlePaddle/PaddleRec/tree/master) |
+
+* 注：支持基于Kermel Primitive算子的昆仑2代芯片支持，[点击这里](https://www.paddlepaddle.org.cn/documentation/docs/zh/guides/07_new_op/kernel_primitive_api/index_cn.html)。
diff --git a/docs/guides/09_hardware_support/xpu_docs/paddle_install_xpu2_cn.md b/docs/guides/09_hardware_support/xpu_docs/paddle_install_xpu2_cn.md
@@ -0,0 +1,175 @@
+# 飞桨框架昆仑2代芯片安装说明
+
+在昆仑2代芯片上，飞桨框架支持基于python的训练和原生预测，当前最新版本为2.3rc，提供两种安装方式：
+
+**1. 预编译的支持昆仑2代芯片的wheel包**
+
+目前此wheel包只支持一种环境：
+
+英特尔CPU+昆仑2代芯片+Linux操作系统
+
+**2. 源码编译安装**
+
+其他环境请选择源码编译安装。
+
+## 安装方式一：通过Wheel包安装
+
+### 下载安装包
+
+**环境1：英特尔CPU+昆仑2代芯片+Linux操作系统**
+
+Linux发行版建议选择CentOS 7系统
+
+Python3.7
+
+```
+wget https://paddle-inference-lib.bj.bcebos.com/2.3.0-rc0/python/Linux/XPU2/x86-64_gcc8.2_py36_avx_mkl/paddlepaddle_xpu-2.3.0rc0-cp37-cp37m-linux_x86_64.whl
+```
+
+```
+python3.7 -m pip install -U paddlepaddle_xpu-2.3.0rc0-cp37-cp37m-linux_x86_64.whl
+```
+
+
+### 验证安装
+
+安装完成后您可以使用 python 或 python3 进入python解释器，输入
+
+```
+import paddle
+```
+
+再输入
+
+```
+paddle.utils.run_check()
+```
+
+如果出现PaddlePaddle is installed successfully!，说明您已成功安装。
+
+* 注：支持基于Kermel Primitive算子的昆仑2代芯片编译whl包，[点击这里查看](https://www.kunlunxin.com.cn)。
+
+## 安装方式二：从源码编译支持昆仑XPU的包
+
+### 环境准备
+
+**英特尔CPU+昆仑2代芯片+CentOS系统**
+
+- **处理器：Intel(R) Xeon(R) Gold 6148 CPU @2.40GHz**
+- **操作系统：CentOS 7.8.2003（建议使用CentOS 7）**
+- **Python版本： 3.7 (64 bit)**
+- **pip或pip3版本：9.0.1+ (64 bit)**
+- **cmake版本：3.15+**
+- **gcc/g++版本：8.2+**
+
+
+### 源码编译安装步骤：
+
+
+（1）Paddle依赖cmake进行编译构建，需要cmake版本>=3.15，如果操作系统提供的源包括了合适版本的cmake，直接安装即可，否则需要
+
+```
+wget https://github.com/Kitware/CMake/releases/download/v3.16.8/cmake-3.16.8.tar.gz
+tar -xzf cmake-3.16.8.tar.gz && cd cmake-3.16.8
+./bootstrap && make && sudo make install
+```
+
+（2）Paddle内部使用patchelf来修改动态库的rpath，如果操作系统提供的源包括了patchelf，直接安装即可，否则需要源码安装，请参考
+
+```
+./bootstrap.sh
+./configure
+make
+make check
+sudo make install
+```
+
+（3）根据[requirments.txt](https://github.com/PaddlePaddle/Paddle/blob/develop/python/requirements.txt)安装Python依赖库
+
+（4）将Paddle的源代码克隆到当下目录下的Paddle文件夹中，并进入Paddle目录
+
+```
+git clone https://github.com/PaddlePaddle/Paddle.git
+cd Paddle
+```
+
+使用较稳定的版本编译，建议切换到release2.3分支下：
+
+```
+git checkout release/2.3
+```
+
+（5）进行Wheel包的编译，请创建并进入一个叫build的目录下
+
+```
+mkdir build && cd build
+```
+
+具体编译选项含义可参见[编译选项表](https://www.paddlepaddle.org.cn/documentation/docs/zh/develop/install/Tables.html#Compile)
+
+**英特尔CPU+昆仑2代芯+CentOS系统**
+
+链接过程中打开文件数较多，可能超过系统默认限制导致编译出错，设置进程允许打开的最大文件数：
+
+```
+ulimit -n 4096
+```
+
+执行cmake，完成编译
+
+Python3.7
+
+```
+cmake .. -DPY_VERSION=3.7 \
+         -DCMAKE_BUILD_TYPE=Release \
+         -DWITH_GPU=OFF \
+         -DWITH_XPU=ON \
+         -DON_INFER=ON \
+         -DWITH_PYTHON=ON \
+         -DWITH_AVX=ON \
+         -DWITH_MKL=ON \
+         -DWITH_MKLDNN=ON \
+         -DWITH_XPU_BKCL=ON \
+         -DWITH_DISTRIBUTE=ON \
+         -DWITH_NCCL=OFF
+
+make -j$(nproc)
+```
+
+（6）编译成功后进入Paddle/build/python/dist目录下找到生成的.whl包 。
+
+（7）将生成的.whl包copy至带有昆仑XPU的目标机器上，并在目标机器上根据[requirments.txt](https://github.com/PaddlePaddle/Paddle/blob/develop/python/requirements.txt)安装Python依赖库。（如果编译机器同时为带有昆仑XPU的目标机器，略过此步）
+
+（8）在带有昆仑XPU的目标机器安装编译好的.whl包：pip install -U（whl包的名字）或pip3 install -U（whl包的名字）。恭喜，至此您已完成昆仑XPU机器上PaddlePaddle的编译安装。
+
+**验证安装**
+
+安装完成后您可以使用 python 或 python3 进入python解释器，输入
+
+```
+import paddle
+```
+
+再输入
+
+```
+paddle.utils.run_check()
+```
+
+如果出现PaddlePaddle is installed successfully!，说明您已成功安装。
+
+### 如何卸载
+
+使用以下命令卸载PaddlePaddle：
+
+```
+pip uninstall paddlepaddle
+```
+
+或
+
+```
+pip3 uninstall paddlepaddle
+```
+
+* 注：支持基于Kermel Primitive算子的昆仑2代芯片源码编译，[点击这里查看](https://www.kunlunxin.com.cn)。
diff --git a/docs/guides/09_hardware_support/xpu_docs/train_example_xpu2_cn.md b/docs/guides/09_hardware_support/xpu_docs/train_example_xpu2_cn.md
@@ -0,0 +1,67 @@
+# 飞桨框架昆仑2代芯片训练示例
+
+使用XPU训练与CPU/GPU相同，只需要简单配置XPU，就可以执行在昆仑设备上。
+
+#### ResNet50下载并运行示例：
+
+1、 安装依赖：
+```
+git clone https://github.com/PaddlePaddle/PaddleClas.git -b develop
+cd PaddleClas
+python -m pip install -r requirements.txt
+```
+
+2、下载数据集：
+基于CIFAR100数据集的ResNet50训练任务
+```
+cd dataset
+rm -rf ILSVRC2012
+wget -nc https://paddle-imagenet-models-name.bj.bcebos.com/data/whole_chain/whole_chain_CIFAR100.tar
+tar xf whole_chain_CIFAR100.tar
+ln -s whole_chain_CIFAR100 ILSVRC2012
+cd ILSVRC2012
+mv train.txt train_list.txt
+mv test.txt val_list.txt
+```
+
+3、配置XPU进行训练的命令非常简单：
+```
+cd ../..
+#FLAGS指定单卡或多卡训练，此示例运行1个卡
+export FLAGS_selected_xpus=2
+export XPUSIM_DEVICE_MODEL=KUNLUN2
+#启动训练
+python tools/train.py \
+-c ppcls/configs/ImageNet/ResNet/ResNet50.yaml \
+-o Global.device=xpu
+```
+
+#### YOLOv3-DarkNet53下载并运行示例：
+
+1、安装依赖：
+```
+git clone https://github.com/PaddlePaddle/PaddleDetection.git -b develop
+cd PaddleDetection/
+pip install -U pip Cython
+pip install -r requirements.txt
+```
+
+2、下载数据集
+```
+cd dataset/voc/
+python download_voc.py
+python create_list.py
+cd ../..
+```
+
+3、配置XPU进行训练的命令非常简单：
+```
+#FLAGS指定单卡或多卡训练，此示例运行1个卡
+export FLAGS_selected_xpus=2
+export XPUSIM_DEVICE_MODEL=KUNLUN2
+#启动训练
+python -u tools/train.py \
+-c configs/yolov3/yolov3_darknet53_270e_voc.yml \
+-o use_gpu=false use_xpu=true LearningRate.base_lr=0.000125 \
+--eval
+```