深度学习入门(三十八)计算性能——多GPU训练

  • 前言
  • 计算性能——多GPU训练
    • 课件
      • 多GPU并行
      • 数据并行VS模型并行
      • 数据并行
      • 总结
    • 教材
      • 1 问题拆分
      • 2 数据并行性
      • 3 简单网络
      • 4 数据同步
      • 5 数据分发
      • 6 训练
      • 7 小结
    • 多GPU的简洁实现
      • 1 简单网络
      • 2 网络初始化
      • 3 训练
      • 4 小结

前言

核心内容来自博客链接1博客连接2希望大家多多支持作者
本文记录用,防止遗忘

计算性能——多GPU训练

课件

多GPU并行

一台机器可以安装多个GPU (1-16)
在训练和预测时,我们将一个小批量计算切分到多个GPU上来达到加速目的
常用切分方案有