Поговорим о том, как генеративные модели используются в Яндексе и за его пределами: как они появились и развивались в симбиозе с задачей нейросетевого машинного перевода, как устроена архитектура Transformer и благодаря чему во всём мире растёт качество машинного перевода. Обсудим генеративные модели в Болталке Алисы: как использовать их в комбинации с другими моделями и измерять их качество в рамках продукта Расскажем об обучении диалоговых моделей и интересных решениях при использовании их в продакшене. Ещё вы узнаете, как ответы на вопрос к Алисе генерируются на основе информации из интернета и почему мы решали эту задачу с помощью моделей-трансформеров.