发布于: Sep 20, 2018

适用于 Ubuntu 和 Amazon Linux 的 AWS Deep Learning AMIs 目前在由光环新网运营的中国(北京)地区提供以下深度学习框架和接口的更新版本:TensorFlow 1.10(针对 AWS 进行了优化以获得更高性能)、带 OpenMPI 3.1.0 的 Horovod 0.13.11(针对 Amazon EC2 P3 实例中的分布式多 GPU TensorFlow 训练进行了优化)、带 CUDA 9.2 的 PyTorch(针对 Amazon EC2 P3 实例、Chainer 4.3.1Keras 2.2.2 的模型训练进行了优化)。

使用优化的 TensorFlow 1.10 实现更快速训练

Deep Learning AMI 配备了 TensorFlow 1.10 的优化版本,可自定义以提升 Amazon EC2 C5 和 P3 实例中的深度学习应用程序。当您首次激活 TensorFlow 虚拟环境时,Deep Learning AMI 会自动部署针对您选择的 EC2 实例进行了优化的 TensorFlow 版本。

对于希望将 TensorFlow 训练从单 GPU 扩展到多 GPU 的开发人员,AWS Deep Learning AMI 配备了 Horovod,针对使用 Amazon EC2 P3 实例的分布式训练进行了优化。

最新框架更新

Deep Learning AMI 目前支持预先配置了 NVidia CUDA 9.2、cuDNN 7.1.4 和 NCCL 2.2.13 的最新版本的 PyTorch 0.4.1,以加速 Amazon EC2 P3 实例的深度学习。此外,Chainer 现已升级到版本 4.3.1,针对 Amazon EC2 实例系列的高性能进行了优化。

AWS Deep Learning AMI 还支持带 Gluon 的 Apache MXNet 1.2.1、Microsoft Cognitive Toolkit (CNTK) 2.5.1、Caffe 1.0、Caffe2 0.8.1 和 Theano 1.0.1,它们均进行了预安装和完全配置,使您在几分钟内便可开始开发深度学习模型,同时充分利用 Amazon EC2 实例的计算能力。

Deep Learning AMI 入门

您可以使用开发人员指南中的教程快速开始使用 AWS Deep Learning AMI。您可以在 EC2 实例启动向导的“步骤 1:选择 Amazon 系统映像 (AMI)”的“快速入门”部分找到您想要的 Deep Learning AMI(请参阅下图)。
 

deep-learning-bjs-getting-started