Как создали Шедеврум

Поговорили с Николаем Гавриловым, руководителем проекта Шедеврум, и выяснили, как ребята сделали приложение для генерации контента и почему команда работает в режиме стартапа

Расскажи, что такое Шедеврум

Это приложение, которое даёт возможность прикоснуться к нейросетям, генерирующим изображения и тексты по словесному описанию. Оно лаконичное и простое в использовании.

Часто при работе с нейросетью возникает желание поделиться тем, что у тебя получилось. Для этого используют социальные сети, телеграм-каналы, чаты, сохраняют картинки на телефон. Пользователи хотят получить обратную связь на свои шедевры: лайки, комментарии, подписки. Поэтому мы вшили в Шедеврум эту социальную функцию — возможность делиться и подсматривать идеи.

Пользователь смотрит чужие работы у себя в ленте. Он видит не только результат, но и изначальный запрос. Ещё он может лайкать, писать комментарии. Благодаря этому лента подстроится под его предпочтения и порекомендует похожий контент.

Мы сделали это приложение для фана и развлечения. А ещё — чтобы научить людей пользоваться нейросетью. Пользователь всегда может подсмотреть, какие запросы формируют лучшие результаты. Чужой опыт здесь ценен: он учит эффективнее использовать технологии.

Сейчас главная цель Шедеврума — дать возможность прикоснуться к технологии на бытовом уровне, кайфануть от использования и вдохновиться. Ещё Шедеврум помогает:

  • искать референсы для своих проектов;

  • собирать идеи;

  • учиться на чужих примерах, как эффективно общаться с нейросетью;

  • погружаться в новые технологии.

Картинки, которые генерирует Шедеврум

Круто! А как создавали Шедеврум?

Команда придумала приложение ещё в конце прошлого года — и взяла челлендж собрать первый прототип за новогодние праздники. Их было семеро: два мобильных разработчика, техлид, фронтендер, бэкендер и два ML-разработчика. Что самое крутое — у них получилось: первую рабочую версию они собрали за девять дней.

Конечно, к тому моменту наша генеративная модель уже существовала. Её уже обучали, она выдавала неплохие результаты. Но приложение создали с нуля: от первых разработок до финального релиза прошло три месяца.

Сейчас в команде несколько десятков человек. Это специалисты по мобильной разработке, бэкендеры, фронтендеры, аналитики, тестировщики, ML и разработчики нейросети.

Такой дух стартапа!

Да, мы до сих пор в нём живём. Шедеврум быстро развивается: мы ускоряем все процессы, которые можем. В нашей команде случился хороший микс: возможности корпорации и быстрые запуски стартапа.

Я думаю, мы будем стараться сохранить это как можно дольше. Но перебарщивать тоже не стоит: в такой гонке легко выгореть и потерять интерес. А нам хочется, чтобы проект рос и развивался, а команда кайфовала от работы.

Как прошёл релиз?

Сначала мы выкатили приложение для сотрудников Яндекса: рассказали на всех внутренних ресурсах, что оно готово, и попросили протестировать.

Так появились первые бета-тестеры — сотрудники Яндекса. Это стандартная практика: почти все продукты Яндекса проходят этот этап. Поэтому наши бета-тестеры были заинтересованными ребятами, которые дали много ценного фидбека.

В день релиза мы очень беспокоились за нагрузку на бэкенд. Было сложно рассчитать количество пользователей, которые могут к нам прийти. И мы ввели систему инвайтов: вручную выдавали доступ на генерацию контента. Собралась очередь, кто-то ждал по несколько часов, чтобы попробовать Шедеврум.

Спустя некоторое время очередь разгребли — и с тех пор успешно справляемся с нагрузкой. Новые пользователи могут попробовать Шедеврум сразу после установки, без инвайтов.

foto2

Что изменили в Шедевруме после первой тестовой версии?

В первую очередь создали правила работы нашей модели. Мы ввели некоторые ограничения, например на использование образов реальных людей, на темы 18+, чтобы создаваемый контент не нарушал законов и никому не вредил. Для этого мы отработали этап модерации.

Уже после релиза мы встроили языковую модель нового поколения YandexGPT (YaLM 2.0), чтобы Шедеврум не только генерировал картинки, но и создавал тексты. Теперь можно сочинять истории и иллюстрировать их, создавать приглашения на день рождения и готовые посты в социальные сети.

На этом мы тоже не остановились: уже добавили комментарии к постам и подписки на других пользователей. Теперь можно регулярно следить за контентом своих друзей и обсуждать в комментариях, как сделать тот или иной запрос лучше. А совсем недавно выпустили веб-версию приложения. Там нельзя публиковать контент, но можно смотреть, что получается у других.

Чему Шедевруму ещё стоит научиться?

Сейчас наш фокус — повысить качество картинок и проработать детализацию объектов. Мы обучаем генеративную модель более точно рисовать человеческие руки и глаза — с этой трудностью на первоначальном этапе сталкиваются практически все нейросети в мире. А ещё учим Шедеврум лучше разбираться в разных темах, например в городах или персонажах кино и сказок, чтобы повысить интерес нашей аудитории и удовлетворить потребности каждого.

foto3

Пользуешься ли ты Шедеврумом?

Я редко генерирую картинки сам, но много смотрю за другими. Подписан на местных лидеров мнений, которые наловчились писать запросы и получать мощный результат: картинки и тексты.

В Шедевруме есть свои тренды. Например, была неделя, когда все генерировали падающие в бассейн предметы: рояль, плюшевого медведя, робота. А ещё мне запомнился момент, когда все создавали круглых животных, похожих на Смешариков. Это было круто!

foto4

Краткий пересказ от YandexGPT