Нейросети уже пишут новостные заметки для авторитетных изданий, генеративное искусство уходит с молотка на крупнейших аукционах, а аудиокнига, которую вы слушаете, вполне может быть озвучена Алисой.
Рассмотрим разные подходы к созданию текстового и мультимедийного контента с помощью нейросетей, сложности в обучении генеративных моделей и обсудим, почему оценить их качество сложнее, чем в случае с дискриминативными моделями.
— Как устроена генеративная музыка?
— On-device анимация лица
— Просодия в синтезе речи
— Самопишущийся код
— Как научить текстовую модель генерации на минимальном количестве примеров?
— Вызовы в оценке генеративных текстовых моделей: задачи и категории
— RuDALL-E: креативный ИИ в эпоху гигантских трансформерных моделей
— Как мы делали перевод видео в Яндекс.Браузере
— Генерация контента: ожидания и реальность