ШАД: не только для крутых математиков

Ваге Егиазарян о том, как Школа анализа данных вновь открыла для него высшую математику и путь в науку.

Порог входа в Школу анализа данных всегда был высоким. От кандидатов требовались не только хорошие навыки программирования, но и владение высшей математикой. Это нужно для того, чтобы в будущем студенты смогли, например, разобраться с байесовскими методами, корректно оценить асимптотику сложности быстрой сортировки или написать хитрый метод многомерной оптимизации. Но нередко талантливые разработчики, аналитики и исследователи не помнят математику начальных курсов настолько хорошо, чтобы преодолеть вступительные экзамены. Поэтому в 2020 году в ШАДе был открыт специальный трек поступления, включающий адаптационный курс для тех, кто подзабыл или недостаточно знает высшую математику. О том, как Школа анализа данных помогает в изучении высшей математики, мы поговорили с Ваге Егиазаряном, который, закончив ШАД, пошёл в науку, работает в Сколтехе и публикует статьи на топовых конференциях уровня А*.

Усталость от математики

Последние четыре года в школе я занимался физикой, математикой и олимпиадным программированием и со временем от всего этого немного подустал. И когда я поступал в Вышку через олимпиаду, я выбрал бизнес-информатику: мне показалось, что это неплохая возможность сменить направление и при этом продолжать заниматься программированием.

Но на бизнес-информатике упор больше делался на базы данных, аналитику и экономику — дисциплины, которые не слишком сильно меня занимали. Через четыре года я решил вернуться к истокам и попробовать поступить в совместную магистратуру факультета компьютерных наук и Школы анализа данных Яндекса.

Как наверстать упущенное

У меня была очень сильная школьная программа, в 11-м классе мы уже проходили элементы высшей математики. Но на факультете бизнес-информатики математический анализ и линейную алгебру мы закончили изучать уже в середине второго курса. Я основательно подзабыл материал и растерял навыки, в том числе и программирование: мы изучали только язык C#. Главная проблема заключалась в том, что мне очень не хватало навыков решения задач.

Так что для того, чтобы поступить на ФКН и в ШАД, мне пришлось самому на протяжении всего четвёртого курса вспоминать математику и заниматься ею в свободное от университета время. Помогла практика решения задач в онлайн-контестах, это подтянуло навыки C++. Но больше всего мне помогло то, что моя сильная сторона — это комбинаторика. Для неё не нужно много знаний, главное — развитая логика.

Математика в анализе данных

В Школе анализа данных я выбрал направление, где упор делался на программирование и статистику. В ШАДе очень хороший курс по статистике, который помог мне легко её понять. А на курсе по дискретной математике нам рассказывали теорию графов, комбинаторику, линейную алгебру и практическую линейную алгебру. Во время обучения в Школе я начал осознавать взаимосвязь между математикой и решением каких-то практических задач по анализу данных.

Чем очень хорош ШАД — здесь ты сразу замечаешь взаимосвязи, видишь, зачем нужна конкретная теорема, зачем нужна линейная алгебра и зачем нужна статистика, где всё это используется в текущий момент и так далее. Всё начинает иметь смысл.

В ШАДе ты ясно видишь, как линейная алгебра используется фактически во всём машинном обучении, и если её не знать, гораздо сложнее понять разные математические модели

Практически всё машинное обучение и нейронные сети — это смесь теории вероятностей, математического анализа и линейной алгебры. Конечно, что-то можно делать, не углубляясь в математику, но для научных исследований очень важно знать, как всё происходит внутри нейронок, понимать, что это вовсе не магия из чёрного ящика.

Обучение в ШАДе

Самыми трудными для меня были, наверное, первые четыре месяца. Мне не хватало базовых математических знаний. То, что многим студентам давалось легко, мне приходилось изучать отдельно, прикладывая большое количество усилий. Спасло то, что, несмотря на продвинутый уровень знаний студентов, в ШАДе любую тему начинают с базы.

Выпускной Школы анализа данных — 2019

Примером тому является курс по дискретной математике Андрея Михайловича Райгородского. Он всегда начинает с азов, которые может понять любой, и быстро разгоняется до очень сложных вещей. И если человек будет следить за всем этим, записывать, то он поймёт, что происходит. Это мне очень помогло.

С точки зрения общения с людьми, Школа — это волшебное место. В ШАДе можно спокойно подойти к любому человеку и начать обсуждать любую задачу, и всем будет очень интересно.

В ШАДе мы занимались с утра до ночи, приходили и в субботу, и воскресенье. Мы были рады общаться друг с другом и каждый день узнавать что-то новое

Без ШАДа я бы точно не получил те знания, которые у меня есть сейчас, во всяком случае, в области высшей математики и программирования. Именно последние полгода в ШАДе и направили меня в сторону науки. В частности, восхитительный курс по глубинному обучению и по reinforcement learning. Меня зацепило глубинное обучение, и я решил заниматься именно этим. У меня широкие научные интересы, но они так или иначе касаются компьютерного зрения. Сейчас я сотрудник лаборатории ADASE в Сколтехе. Я опубликовал две статьи на конференциях уровня А* и одну — на конференции уровня B. Собираюсь дописать диссертацию и продолжать заниматься наукой.

Краткий пересказ от YandexGPT