Искать

Станьте экспертом по глубокому обучению с подкреплением

Освойте навыки глубокого обучения с подкреплением и внедрите передовые алгоритмы для создания ИИ-агентов.

Подробнее
Наши партнеры:

Изучите самые передовые навыки обучения ИИ

От реализации возможности создания ИИ, играющего в игру "Го" лучше чемпиона мира по "Го", до прокладывания пути к созданию Общего Искусственного Интеллекта, глубокое обучение с подкреплением является одной из самых перспективным областей в сфере создания ИИ. И теперь есть практический способ развить этот передовой навык. В этой программе вы узнаете, как применять:

  • Архитектуры глубокого обучения к задачам обучения с подкреплением для создания собственной сети Deep Q-Network (DQN), которую вы можете использовать для тренировки агента, который обучается разумному поведению на основе необработанных сенсорных данных.
  • Эволюционный алгоритм и методы типа policy-gradient, такие как REINFORCE, DDPG, TRPO и PPO, для разработки собственного алгоритма, который вы можете использовать для тренировки роботизированного агента с целью решения сложной задачи.
  • Методы обучения с подкреплением в приложениях, включающих в себя многочисленные интерактивные агенты, таких как координация автономных транспортных средств.
  • Отраслевую компетентность группы экспертов по ИИ из Unity и Udacity для разработки профессиональных моделей глубокого обучения с подкреплением.

Изучение ИИ путем работы над проектами

Самый лучший способ изучить ИИ - это создать ИИ. Вот почему эта программа включает в себя три глубоких проекта, на которые вы можете получить отзывы экспертов, а затем добавить их в свой портфель на Github.

Требования к участникам:

  • Опыт работы с Python: от среднего до большого. Осведомленность в объектно-ориентированном программировании. Понимание программного кода, написанного другими людьми.
  • Среднее образование в области статистики. Знание теории вероятности.
  • Среднее знание методик машинного обучения. ВЫ можете описать обратное распространение ошибки обучения и видели множество примеров архитектур нейронной сети (подобных CNN для классификации образов).
  • Вы работали или знакомы с системами глубокого обучения наподобие TensorFlow, Keras и PyTorch.

Цена: 999 долларов США

Время для выполнения всех проектов: четыре месяца

  • Проект 1: Навигация
  • Проект 2: Непрерывный контроль
  • Проект 3: Сотрудничество и соревнование

Навигация

Методы на основе значений

Изучите основы обучения с подкреплением — от Марковского процесса принятия решений до уравнений Беллмана. Затем используйте свёрточные нейронные сети (CNN) для тренировки агента, который обучается интеллектуальному поведению на основе сенсорных данных.

Тематика

  • Методы Монте-Карло
  • Методы обучения на основе временных разностей
  • Свёреточные нейронные сети + PyTorch
  • Глубокое Q-обучение
Подробнее

Непрерывный контроль

Метод на основе правил поведения

Изучите теорию, стоящую за методами, основанными на правилах поведения, такими как эволюционные алгоритмы, поиск стохастической политики, и алгоритм REINFORCE. Затем используйте изученное для тренировки роботизированной руки достигать целевых мест или тренировки ходить на четырех ногах.

Тематика

  • Метод на основе правил поведения
  • Улучшение методов градиентного спуска (policy gradient)
  • Методы типа "Актер-Критик"
Подробнее

Сотрудничество и соревнование

Обучение с подкреплением для множества агентов

Узнайте, как определить задачу обучения с подкреплением для множества агентов. Затем натренируйте систему агентов для демонстрации ситуации сотрудничества или соревнования в сложной задаче.

Тематика:

  • Обучение с подкреплением для множества агентов
  • Обучение сотрудничеству
  • Обучение конкуренции
Подробнее

Узнать больше о других сертификационных и обучающих продуктах

Освойте глубокое обучение с подкреплением

Изучите перспективные направления в ИИ, получите нанодиплом и создайте свой портфель передовых приложений!

Подробнее
Согласен

Мы используем cookie-файлы, чтобы вам было удобнее работать с нашим веб-сайтом. Подробные сведения смотрите на странице политики обработки cookie-файлов.