Метод IV-RL оценивания ошибки в обучении с подкреплением

На семинаре будет рассмотрен метод IV-RL оценивания ошибки, основной идеей которого является смягчение негативных последствий ошибочных наблюдений.

Наука 16+

Семинар основывается на статье Vincent Mai, Kaustubh Mani и Liam Paull “Sample Efficient Deep Reinforcement Learning Via Uncertainty Estimation” (arxiv.org/pdf/2201.01666.pdf...), в которой рассматривается новый подход для оценивания ошибки в обучении с подкреплением.

В первой части семинара будут рассмотрена предметная область, и проблемы связанные с ней.

Во второй части семинара будет описан метод оценивания ошибки IV-RL.

В третьей и заключительной части будут рассмотрены результаты экспериментов, варианты использования и дальнейшие пути исследования в данной теме.

Спикер: Сорокумов Сергей Валерьевич, студент каф. МОЭВМ СПбГЭТУ "ЛЭТИ"

Мероприятие пройдет в zoom. Ссылка на подключение будет выслана за 1 час до начала события. 

Поделиться:

799 дней назад
15 февраля 2022 19:00–20:30

Событие пройдет онлайн

Уже есть билет
Получить ссылку

Поделиться:

Связь с организатором

На этот адрес придёт ответ от организатора.

Подпишитесь на рассылку организатора

Возврат билета

Если вы хотите вернуть билеты, вы можете сделать это по ссылке из письма с билетами или оформить запрос организатору в вашем  личном кабинете.

Подробнее о возврате билетов