Чем занимаются лауреаты премии имени Ильи Сегаловича 2019

Исследования в сфере компьютерного зрения, распознавание эмоций и применение машинного обучения для развития Нижегородской области.

Премия имени Ильи Сегаловича вручается студентам, аспирантам и научным руководителям за достижения в области компьютерных наук. Подать заявку на премию 2020 года можно до 1 марта: для этого нужно заполнить анкету на сайте премии и прикрепить к ней свои исследовательские статьи. Академия Яндекса поговорила с лауреатами прошлого года о том, как получение премии повлияло на их судьбу, в чём заключаются преимущества работы в науке по сравнению с промышленным программированием и c какими проблемами сталкиваются молодые российские учёные.

Анастасия Попова

Анастасия Попова

Я учусь в магистратуре НИУ ВШЭ по интеллектуальному анализу данных и руковожу лабораторией больших данных в офисе стратегии развития Нижегородской области. Премию Сегаловича я получила за научные статьи о том, как распознавать эмоции человека по аудиозаписям, не анализируя их смысловое содержание. Например, чтобы понять, что иностранец злится, необязательно знать язык, на котором он говорит: достаточно того, что он говорит определённым тоном и повышает голос.

В премии Сегаловича мне понравилось то, что она выдаётся не за количество исследований, а за мотивацию заниматься наукой. Обычно стипендии выдают по формальным критериям: учитывают количество статей и престижность журналов, в которых они опубликованы. А чтобы получить премию Сегаловича, нужно пройти собеседование: на нём будут как задавать технические вопросы по вашей области, так и спрашивать о мотивации, о том, почему вы занимаетесь исследованиями.

Лично я пошла в науку, а не в промышленное программирование, потому что мне хочется развивать Computer Science — а если ты работаешь в корпорации, то твоё решение обычно приносит пользу только непосредственному заказчику. Современное машинное обучение устроено так, что без научной составляющей невозможно реализовать продукт.

Существует «общий котел» научных достижений, в который учёные приносят свои исследования и из которого промышленные разработчики могут черпать идеи для создания новых технологий.

Мои исследовательские интересы связаны с видеоаналитикой, например, с её приложениями для того, чтобы обустраивать «умный дом». Когда я получила премию Сегаловича, то обо мне написали в нескольких статьях. Благодаря этому меня «заметили» и позвали руководить лабораторией больших данных в офисе стратегии развития Нижегородской области.

Еще с этого года я веду семинары по машинному обучению и курирую исследования студентов в Школе анализа данных в Нижнем Новгороде. У всех студентов фундаментально важные темы исследований: чтение по губам, автономное вождение, определение химических веществ, которые воздействовали на клетки человека.

В научной работе есть свои трудности, например, то, что в России слабо развита культура сохранения данных и в открытом доступе лежит мало готовых датасетов. Однако всё это мелочи по сравнению с возможностью не просто следовать техническому заданию, а менять мир технологий.

Валентин Хрульков

Валентин Хрульков

Я довольно рано заинтересовался математикой и компьютерными науками: отучился сначала в 57-й школе, а потом на мехмате МГУ. После мехмата поступил в аспирантуру Корнеллского университета в США, он известен тем, что в нём читали лекции Владимир Набоков и Ричард Фейнман.

Там я проучился два года, и на третий перевёлся в Сколтех в Москву: во-первых, потому что в Корнелле был не самый сильный математический факультет, а во-вторых, сама Итака, где он находится, — маленький и удалённый от всего город.

В Сколтехе я учусь на факультете Center for Data Science, занимаюсь прикладной наукой, программирую и ставлю численные эксперименты. Я получил премию Сегаловича за научные статьи: за последние два года опубликовал больше семи исследований по анализу данных. Например, в одном из них я описал embedding layer для нейронных сетей в NLP, который позволяет добиться их сильного сжатия — и применим в других областях, например, для предсказания CTR в цифровой рекламе.

Если работать по 10 часов в день, то всё успеваешь. Простой алгоритм.

В премии меня интересовали не деньги, а возможность пойти на исследовательскую стажировку. До этого я стажировался в отделе машинного обучения в Facebook, но у меня были не самые интересные задачи. Нужно было работать над инструментом для анализа того, как люди реагируют на рекламные объявления. Это интересная задача, если использовать для неё научные исследования по теории аукционов. Однако на моей стажировке мы занимались только прикладной работой.

После того, как я получил премию Сегаловича, мне предложили стажировку в Яндексе — теперь я совмещаю её с аспирантурой. За последние полгода я помог отделу Computer Vision упростить оценку качества модели, которая повышает разрешение фотографий. При чрезмерном редактировании изображения могут стать зернистыми или приобрести ненужные детали. Обычно, чтобы проверить качество, людям попарно показывают исходные и полученные картинки и просят выбрать из двух более красивую. Таких экспериментов проводится очень много, а мне хотелось этот процесс автоматизировать: чтобы на краудсорсинг (привлечение большого количества людей к разметке данных) тратили меньше времени и денег.

Для этого я собрал датасет из всех проведённых экспериментов и обучил модель, которая предсказывает, как люди оценят качество изображения. С помощью отдела Computer Vision яндекса мы собрали датасет, обучили модель и подали статью на конференцию по компьютерному зрению А чтобы результат моей работы могли применять другие разработчики, я опубликовал об этом научную статью и защитил её на конференции по компьютерному зрению.

Мне кажется очень важным поддерживать исследования в сфере Computer Science: они помогают создавать новые решения для индустрии и двигать её вперёд. Стипендии — это хорошая инициатива, которая пока только начала развиваться в России. Но раз Яндекс запустил премию Сегаловича, то и другие компании, скорее всего, тоже скоро последуют его примеру.

Краткий пересказ от YandexGPT