Unityの検索機能

深層強化学習のエキスパートになる

深層強化学習のスキルを身に付けて、ゲーム内AIエージェントを開発するための最先端のアルゴリズムを実装します。

詳細を見る
パートナーシップ提供:

最先端のAIスキルを学ぼう

コンピューターが世界最高の「Go」プレイヤー(語学学習プレイヤー)を打ち負かして汎用人工知能(Artificial General Intelligence)への道を開くまで、深層強化学習はAI(人工知能)の最もホットな分野の1つです。さらに現在、この最先端のスキルを開発する実践的な方法があります。本プログラムでは、適用する方法を学習していきます。

  • 独自の Deep Q-Network (DQN) を構築するための学習タスクを強化するための深層学習アーキテクチャーで、Raw・感覚データから知的行動を学習するエージェントを訓練するために使用可能です。
  • REINFORCE、DDPG、TRPO や PPO など、進化的アルゴリズムと方策勾配法(policy gradient)セオリーは、複雑なタスクを解決するのにシミュレートされたロボットエージェントを訓練するために使用できる独自のアルゴリズムを研究するために使用します。
  • 自律運転の調整など、複数の相互作用エージェントを含むアプリケーションへの強化学習の手法を学びます。
  • Unity と Udacity の AI エキスパートチームによる業界の専門知識からプロフェッショナルな深層強化学習モデルの開発まで学びます。

プロジェクトをベースとした方法で AI(人工知能)を学ぶ

AI(人工知能)を学ぶ最も良い方法は、AIを実行することです。そのため、このプログラムには3つの詳細なプロジェクトがあり、エキスパートのフィードバックを得た後、Github ポートフォリオに追加することができます。

前提条件:

  • 中級~上級の Python を使って開発した経験。オブジェクト指向プログラミングに精通している。他の人が書いたコードを読んで理解することができる。
  • 中級の統計(学)のバックグラウンド。確率に精通している。
  • 機械学習技術の中間知識。バックプロパゲーションを記述することができ、ニューラル ネットワーク アーキテクチャの複数の例 (CNN による画像の分類など) を見たことがある。
  • TensorFlow、Keras、PyTorch など、深層学習のフレームワークを見たり、取り組んだ経験がある。

価格: $999 USD

すべてのプロジェクトを完了するために必要な時間:4ヶ月

  • プロジェクト1: ナビゲーション
  • プロジェクト 2: 連続制御
  • プロジェクト 3: 協働と競争

ナビゲーション

価値に基づく方法

マルコフ決定過程 (Markov decision process; MDP) からベルマン方程式(Bellman equation)までの強化学習の基礎を習得する。次に、畳み込みニューラルネットワーク(Convolutional Neural Networks; CNNs) を活用して、感覚データから知的行動を学習するエージェントを訓練する。

内容:

  • モンテカルロ法
  • 時相差学習法
  • 畳み込みニューラルネットワーク(CNN)+ PyTorch
  • 深層強化学習(DQN)
詳細を見る

連続制御

ポリシーベースの手法

進化アルゴリズム、確率論的ポリシー検索、強化アルゴリズムなど、ポリシーベースの手法の背景にあるセオリーを学びます。次に、学んだことを使ってロボットアームを訓練し、ターゲットの場所に到達させるために四本足の動物を訓練します。

内容:

  • ポリシーベースの手法
  • 方策勾配法(policy gradient algorithm)を改善する
  • Actor-critic 法
詳細を見る

協働と競争

マルチエージェント強化学習

複数のエージェントを使用して強化学習タスクを定義する方法を学習します。次に、エージェントのシステムを訓練して、複雑なタスクに関する協働または競争を実証します。

内容:

  • マルチエージェント強化学習
  • 協働を学ぶ
  • 競争を学ぶ
詳細を見る

他のラーニングおよび認定プログラム製品を詳しく見る

深層強化学習をマスターする

AI で一番ホットな分野を学び、ナノ学位(nanodegree)のク レデンシャルを取得、最先端のアプリケーションポートフォリオを構築しよう!

詳細を見る
OK

弊社の Webサイトは最善のユーザー体験をお届けするためにクッキーを使用しています。 詳細はこちらをクリックしてください。