Как создали Шедеврум
Расскажи, что такое Шедеврум
Это приложение, которое даёт возможность прикоснуться к нейросетям, генерирующим изображения и тексты по словесному описанию. Оно лаконичное и простое в использовании.
Часто при работе с нейросетью возникает желание поделиться тем, что у тебя получилось. Для этого используют социальные сети, телеграм-каналы, чаты, сохраняют картинки на телефон. Пользователи хотят получить обратную связь на свои шедевры: лайки, комментарии, подписки. Поэтому мы вшили в Шедеврум эту социальную функцию — возможность делиться и подсматривать идеи.
Пользователь смотрит чужие работы у себя в ленте. Он видит не только результат, но и изначальный запрос. Ещё он может лайкать, писать комментарии. Благодаря этому лента подстроится под его предпочтения и порекомендует похожий контент.
Мы сделали это приложение для фана и развлечения. А ещё — чтобы научить людей пользоваться нейросетью. Пользователь всегда может подсмотреть, какие запросы формируют лучшие результаты. Чужой опыт здесь ценен: он учит эффективнее использовать технологии.
Сейчас главная цель Шедеврума — дать возможность прикоснуться к технологии на бытовом уровне, кайфануть от использования и вдохновиться. Ещё Шедеврум помогает:
-
искать референсы для своих проектов;
-
собирать идеи;
-
учиться на чужих примерах, как эффективно общаться с нейросетью;
-
погружаться в новые технологии.
Круто! А как создавали Шедеврум?
Команда придумала приложение ещё в конце прошлого года — и взяла челлендж собрать первый прототип за новогодние праздники. Их было семеро: два мобильных разработчика, техлид, фронтендер, бэкендер и два ML-разработчика. Что самое крутое — у них получилось: первую рабочую версию они собрали за девять дней.
Конечно, к тому моменту наша генеративная модель уже существовала. Её уже обучали, она выдавала неплохие результаты. Но приложение создали с нуля: от первых разработок до финального релиза прошло три месяца.
Сейчас в команде несколько десятков человек. Это специалисты по мобильной разработке, бэкендеры, фронтендеры, аналитики, тестировщики, ML и разработчики нейросети.
Такой дух стартапа!
Да, мы до сих пор в нём живём. Шедеврум быстро развивается: мы ускоряем все процессы, которые можем. В нашей команде случился хороший микс: возможности корпорации и быстрые запуски стартапа.
Я думаю, мы будем стараться сохранить это как можно дольше. Но перебарщивать тоже не стоит: в такой гонке легко выгореть и потерять интерес. А нам хочется, чтобы проект рос и развивался, а команда кайфовала от работы.
Как прошёл релиз?
Сначала мы выкатили приложение для сотрудников Яндекса: рассказали на всех внутренних ресурсах, что оно готово, и попросили протестировать.
Так появились первые бета-тестеры — сотрудники Яндекса. Это стандартная практика: почти все продукты Яндекса проходят этот этап. Поэтому наши бета-тестеры были заинтересованными ребятами, которые дали много ценного фидбека.
В день релиза мы очень беспокоились за нагрузку на бэкенд. Было сложно рассчитать количество пользователей, которые могут к нам прийти. И мы ввели систему инвайтов: вручную выдавали доступ на генерацию контента. Собралась очередь, кто-то ждал по несколько часов, чтобы попробовать Шедеврум.
Спустя некоторое время очередь разгребли — и с тех пор успешно справляемся с нагрузкой. Новые пользователи могут попробовать Шедеврум сразу после установки, без инвайтов.
Что изменили в Шедевруме после первой тестовой версии?
В первую очередь создали правила работы нашей модели. Мы ввели некоторые ограничения, например на использование образов реальных людей, на темы 18+, чтобы создаваемый контент не нарушал законов и никому не вредил. Для этого мы отработали этап модерации.
Уже после релиза мы встроили языковую модель нового поколения YandexGPT (YaLM 2.0), чтобы Шедеврум не только генерировал картинки, но и создавал тексты. Теперь можно сочинять истории и иллюстрировать их, создавать приглашения на день рождения и готовые посты в социальные сети.
На этом мы тоже не остановились: уже добавили комментарии к постам и подписки на других пользователей. Теперь можно регулярно следить за контентом своих друзей и обсуждать в комментариях, как сделать тот или иной запрос лучше. А совсем недавно выпустили веб-версию приложения. Там нельзя публиковать контент, но можно смотреть, что получается у других.
Чему Шедевруму ещё стоит научиться?
Сейчас наш фокус — повысить качество картинок и проработать детализацию объектов. Мы обучаем генеративную модель более точно рисовать человеческие руки и глаза — с этой трудностью на первоначальном этапе сталкиваются практически все нейросети в мире. А ещё учим Шедеврум лучше разбираться в разных темах, например в городах или персонажах кино и сказок, чтобы повысить интерес нашей аудитории и удовлетворить потребности каждого.
Пользуешься ли ты Шедеврумом?
Я редко генерирую картинки сам, но много смотрю за другими. Подписан на местных лидеров мнений, которые наловчились писать запросы и получать мощный результат: картинки и тексты.
В Шедевруме есть свои тренды. Например, была неделя, когда все генерировали падающие в бассейн предметы: рояль, плюшевого медведя, робота. А ещё мне запомнился момент, когда все создавали круглых животных, похожих на Смешариков. Это было круто!