Pesquisar em Unity

Torne-se um especialista em Deep Reinforcement Learning

Domine os fundamentos de Deep Reinforcement Learning e implemente algoritmos de última geração para criar agentes de IA.

Saiba mais
Em parceria com

Aprenda as mais avançadas habilidades de IA

Deep Reinforcement Learning é um dos tópicos mais atuais no campo da IA e abre possibilidades completamente novas - desde a vitória de um computador sobre o melhor jogador Go do mundo até a preparação para uma AGI (Inteligência Artificial Geral). E agora há uma maneira prática de desenvolver essa habilidade inovadora. Saiba mais sobre o nosso programa:

  • Aplique arquiteturas de deep learning às tarefas de reinforcement learning para construir sua própria Deep Q-Network (DQN), que você pode usar para treinar um agente que aprende o comportamento inteligente a partir dos dados sensoriais.
  • Teorias sobre algoritmos evolutivos e métodos de gradiente-política (policy-gradient) como REINFORCE, DDPG, TRPO e PPO, para obter informações sobre seu próprio algoritmo que permitem treinar um agente robótico simulado, para resolver uma tarefa complexa.
  • Aprenda a aplicar métodos de reinforcement learning em aplicativos que envolvem vários agentes de interação, como a coordenação de veículos autônomos.
  • Especialização no setor da equipe de especialistas em IA da Unity e da Udacity para desenvolver modelos profissionais de deep reinforcement learning.

Aprenda IA com base num projeto

A melhor maneira de aprender IA é fazer IA. É por isso que este programa inclui três projetos detalhados nos quais você pode obter feedback de especialistas e adicioná-los ao seu portfólio do Github.

Pré-requisitos

  • Experiência intermediária a avançada em Python. Você está familiarizado com a programação orientada a objetos. Você pode ler e entender o código escrito por outras pessoas.
  • Conhecimento intermediário em estatística. Você está familiarizado com a probabilidade.
  • Conhecimento intermediário em técnicas de machine learning. Você consegue descrever retropropagação e conhece alguns exemplos de arquitetura de rede neural (como uma rede neural convolucional para classificação de imagens).
  • Você conhece ou já trabalhou com uma estrutura de deep learning, como TensorFlow, Keras ou PyTorch.

Preço: US 999 $

Tempo necessário para concluir todos os projetos: quatro meses

  • Projeto 1: Navegação
  • Projeto 2: Controle Contínuo
  • Projeto 3: Colaboração e Concorrência

Navegação

Métodos baseados em valor

Domine os fundamentos de reinforcement learning - dos Processos de Decisão de Markov às equações de Bellman. Em seguida, use as Redes Neurais por Convolução (CNNs) para treinar um agente que aprende comportamentos inteligentes a partir de dados sensoriais.

O que está coberto:

  • Métodos de Monte Carlo
  • Métodos de Diferença Temporal
  • Redes Neurais Convolucionais + PyTorch
  • Deep Q-Learning
Saiba mais

Controle contínuo

Métodos baseados em políticas

Aprenda a teoria por trás de métodos baseados em políticas, como algoritmos evolutivos, pesquisa de política estocástica e o algoritmo REINFORCE. Em seguida, aplique o que você aprendeu e treine um braço robótico para alcançar determinados pontos ou faça uma criatura de quatro patas andar.

O que está coberto:

  • Métodos baseados em políticas
  • Melhoria dos métodos de gradiente de política
  • Métodos Actor-critic
Saiba mais

Colaboração e Concorrência

Aprendizado de reforço multi-agente

Aprenda como definir uma tarefa de reinforcement learning com vários agentes. Em seguida, treine um sistema de agentes para demonstrar colaboração ou cooperação em uma tarefa complexa.

Tópicos abordados:

  • Multi-agent RL
  • Aprender a colaborar
  • Aprender a competir
Saiba mais

Explore outros produtos de Aprendizagem e Certificação

Domine o Deep Reinforcement Learning

Saiba mais sobre o tópico mais recente em IA, obtenha sua qualificação em Nanodegree e crie um portfólio de aplicativos de ponta!

Saiba mais
Eu entendi

Usamos cookies para garantir a melhor experiência no nosso site. Visite nossa página da política de cookies para obter mais informações.