训练模型

这一部分的任务围绕深度学习模型的训练展开。通过这些任务,你将能够体验平台在模型训练领域的强大功能,具体包括:

  1. 使用平台提供的 Job API,在多种深度学习框架或分布式训练框架下进行并行训练
  2. 执行少数几行命令即可简单快速地启动训练任务
  3. 通过可视化界面查看训练信息,实时监控训练进程和指标
  4. 运用各种并行策略,高效分配计算资源,并且容易扩大规模
  5. 使用 Job 的重启机制显著提升训练的故障容错能力
  6. 分析性能以识别训练代码中的性能瓶颈和优化机会