Метод IV-RL оценивания ошибки в обучении с подкреплением

На семинаре будет рассмотрен метод IV-RL оценивания ошибки, основной идеей которого является смягчение негативных последствий ошибочных наблюдений.

Наука 16+

Семинар основывается на статье Vincent Mai, Kaustubh Mani и Liam Paull “Sample Efficient Deep Reinforcement Learning Via Uncertainty Estimation” (arxiv.org/pdf/2201.01666.pdf...), в которой рассматривается новый подход для оценивания ошибки в обучении с подкреплением.

В первой части семинара будут рассмотрена предметная область, и проблемы связанные с ней.

Во второй части семинара будет описан метод оценивания ошибки IV-RL.

В третьей и заключительной части будут рассмотрены результаты экспериментов, варианты использования и дальнейшие пути исследования в данной теме.

Спикер: Сорокумов Сергей Валерьевич, студент каф. МОЭВМ СПбГЭТУ "ЛЭТИ"

Мероприятие пройдет в zoom. Ссылка на подключение будет выслана за 1 час до начала события.

Регистрация

799 дней назад
15 февраля 2022 19:00–20:30

Событие пройдет онлайн

Уже есть билет
Получить ссылку

На семинаре будет рассмотрен метод IV-RL оценивания ошибки, основной идеей которого является смягчение негативных последствий ошибочных наблюдений.

Получить ссылку на трансляцию

Связь с организатором

Подпишитесь на рассылку организатора

Получение ссылок для участия

Возврат билета