Обучение с подкреплением с использованием предшествующего опыта для решения новой задачи агентом без права на ошибку

На семинаре будет рассматриваться алгоритм обучения с подкреплением для нейронных сетей. Основа алгоритма — использование предшествующего опыта, который применяется для решения новой задачи агентом без права на ошибку.

Наука 16+

Семинар посвящен алгоритму обучения с подкреплением для нейронных сетей, целью которого является успешное выполнение агентом новой задачи без права на ошибку.

Классическое обучение с подкреплением предназначено для обучения агента, который хорошо выполняет поставленную задачу с нуля. Такой подход не всегда применим в реальной мире.

На семинаре будут рассмотрены подходы для обучения с подкреплением. Будет рассказано о том, что представляет собой задача обучения с подкреплением в течение одной жизни агента – ситуация, когда агент должен автономно выполнить задание один раз за одно испытание.

Спикер: Глазунов Сергей, кафедра МОЭВМ СПбГЭТУ "ЛЭТИ"


 

Мероприятие будет проходить на платфоре jazz.sber.ru.

Ссылка для подключения будет выслана за 1 час до начала мероприятия. 

Поделиться:

530 дней назад
21 ноября 2022 19:00–20:30

Событие пройдет онлайн

Уже есть билет
Ссылка на онлайн-событие рассылается за час до его начала.
Получить ссылку

Поделиться:

Связь с организатором

На этот адрес придёт ответ от организатора.

Подпишитесь на рассылку организатора

Возврат билета

Если вы хотите вернуть билеты, вы можете сделать это по ссылке из письма с билетами или оформить запрос организатору в вашем  личном кабинете.

Подробнее о возврате билетов