Как обучать диффузионные модели: разбираемся на примере YandexART

Перейти

Text-to-Image диффузионные модели умеют генерировать изображения по текстовому описанию и создавать совершенно новые концепты: например, картинку с астронавтами, которые скачут на лягушках по просторам Марса. Руководитель группы нейросетевых технологий компьютерного зрения в Яндекс Поиске, Сергей Овчаренко, рассказывает о процессе обучения YandexART — модели, которая работает в приложении Шедеврум и других продуктах Яндекса.