В самом начале доклада познакомимся с краткой предысторией возникновения сетей-трансформеров.
В основной части доклада рассмотрим математические модели, которые применяются в трансформерах, а также проведем обзор архитектур сетей-трансформеров. Далее рассмотрим наборы данных и типы задач, в которых активно применяются сети-трансформеры. Сравним архитектуры сетей-трансформеров с другими архитектурами глубоких нейронных сетей на одинаковых наборах данных.
В заключение будет выдвинута гипотеза о применимости сетей-трансформеров для определенных классов задач и наборов данных.
Спикер: Гаврилов Андрей, магистрант кафедры МОЭВМ СПбГЭТУ "ЛЭТИ"
Мероприятие пройдет в zoom. Ссылка на подключение будет автоматически выслана за 1 час до начала события.
Если вы хотите вернуть билеты, вы можете сделать это по ссылке из письма с билетами или оформить запрос организатору в вашем  личном кабинете.