Семинар основывается на статье Vincent Mai, Kaustubh Mani и Liam Paull “Sample Efficient Deep Reinforcement Learning Via Uncertainty Estimation” (arxiv.org/pdf/2201.01666.pdf...), в которой рассматривается новый подход для оценивания ошибки в обучении с подкреплением.
В первой части семинара будут рассмотрена предметная область, и проблемы связанные с ней.
Во второй части семинара будет описан метод оценивания ошибки IV-RL.
В третьей и заключительной части будут рассмотрены результаты экспериментов, варианты использования и дальнейшие пути исследования в данной теме.
Спикер: Сорокумов Сергей Валерьевич, студент каф. МОЭВМ СПбГЭТУ "ЛЭТИ"
Мероприятие пройдет в zoom. Ссылка на подключение будет выслана за 1 час до начала события.
Если вы зарегистрировались на событие, организатор должен был прислать вам ссылку. Если этого не произошло, обязательно свяжитесь с ним.
Если вы хотите вернуть билеты, вы можете сделать это по ссылке из письма с билетами или оформить запрос организатору в вашем  личном кабинете.