搜索Unity

成为深度强化学习专家

掌握深度强化学习技能并实现先进的算法以构建AI代理。

了解更多
合作伙伴

学习最先进的AI技能

从让计算机击败世界顶尖围棋手到为通用人工智能铺平道路,深度强化学习是AI最热门的领域之一。现在,可以通过一种实践方法来发展这项先进的技能。在本学习计划中,您将学习如何应用:

  • 深入学习强化学习任务的架构以构建自己的深度Q网络(DQN),您可以使用该网络训练从原始感观数据中学习智能行为的代理。
  • 用于研究自己的算法的演化算法和策略梯度方法理论(例如REINFORCE、DDPG、TRPO和PPO),您可以用来训练模拟机器人代理以解决复杂的任务。
  • 适用于涉及多个交互代理的应用程序的强化学习方法,例如自动驾驶车辆的协调。
  • Unity和Udacity的AI专家团队的行业专业知识用于开发专业的深度强化学习模型。

在项目中学习AI

学习AI的最好方式是实现AI。这就是为什么该学习计划包括三个深度学习项目,您可以通过这些项目获得相关的专家反馈,然后添加到您的Github产品组合中。

资质要求:

  • 中级到高级Python体验。熟悉面向对象的编程。可以阅读并理解其他用户编写的代码。
  • 中级统计学背景。熟悉概率论。
  • 机器学习技术的中级知识。可以描述反向传播,并且已经了解过多个神经网络架构示例(例如,用于图像分类的CNN)。
  • 已经看过或使用过深度学习框架,例如TensorFlow、Keras或PyTorch。

价格:999美元

完成所有项目所需的时间:四个月

  • 项目1:导航
  • 项目2:连续控制
  • 项目3:协作和竞争

导航

基于价值的方法

掌握强化学习的基础知识 — 从马尔科夫决策过程到贝尔曼方程。再利用卷积神经网络(CNN)训练从感官数据学习智能行为的代理。

涵盖内容:

  • 蒙特卡罗方法
  • 时序差分方法
  • 卷积神经网络 + PyTorch
  • 深度Q学习
了解更多

连续控制

基于策略的方法

学习基于策略的方法背后的理论,例如演化算法、随机策略搜索和REINFORCE算法。再利用所学知识训练机器人手臂,使其到达目标位置,或者训练四足动物走路。

涵盖内容:

  • 基于策略的方法
  • 改进策略梯度方法
  • 角色评论方法
了解更多

协作和竞争

多代理强化学习

学习如何使用多个代理定义强化学习任务。再训练代理系统以展示在复杂任务方面的协作或竞争。

涵盖内容:

  • 多代理RL
  • 学习协作
  • 学习竞争
了解更多

寻找其他学习和认证产品

掌握深度强化学习

了解AI的顶级热门领域,获取您的纳米学位认证,并构建一系列先进的应用程序!

了解更多
明白了

我们使用Cookie来确保在我们的网站上为您提供最佳体验。有关更多信息,请访问我们的Cookie政策页面