Диффузионные методы генерации видео по тексту: обзор Kandinsky 3.0

Перейти

Синтез видео по текстам на естественном языке — одна из самых трудоёмких и сложных задач генеративных моделей. Денис Димитров, управляющий директор по исследованию данных и руководитель проекта Kandinsky рассказывает о новой архитектуре Kandinsky 3.0, особенностях её обучения и полученных результатах.