Кто такой биоинформатик

Совместно с проектом «Биомолекула» расскажем главное о профессии биоинформатика. В этом нам поможет Екатерина Храмеева, профессор Центра молекулярной и клеточной биологии «Сколтеха»

Начнём с главного. Кто вообще такой этот ваш биоинформатик?

Биоинформатики — это специалисты, которые используют математический аппарат и программные способы работы с данными в биологии. Можно назвать их биологическими дата-сайентистами.

В отличие от привычного нам биолога биоинформатик редко напрямую работает с предметом своего исследования. Он не проводит опыты над животными, не исследует клетки, он может вообще никогда не видеть организмы, которые изучает, — ему это и не требуется. Биоинформатик работает с массивом данных об этих организмах. Глядя в данные, можно сделать не меньше открытий, чем глядя в микроскоп.

Тоже мне биологи...

От биоинформатиков всё же требуется неплохое знание биологии: важно понимать, что изучаешь, чтобы правильно интерпретировать результаты. Однако эти знания можно быстро прокачать при желании. Хорошая матподготовка и умение работать с большими данными — важнее.

Я не беру в свою лабораторию «Сколтеха» ребят, которые не умеют программировать. Практика показывает, что разобраться в биологии на достаточном уровне проще и быстрее, чем выучить Python.
Екатерина Храмеева

Кроме того, результаты работы биоинформатика очень важны в биологии, медицине и других «прикладных к природе и человеку» отраслях.

А какие, например, результаты?

Яркий пример — это задача расшифровки генома человека. Её начали решать в 1980-х годах практически вручную, потратили миллиарды долларов и годы работы тысяч специалистов в США, Великобритании, Японии и других странах.

Сегодня любой желающий может секвенировать свой геном примерно за тысячу долларов — и несколько дней.

Но мало «расшифровать» геном — нужно также найти в нём последовательности генов, которые отвечают за важные для человека процессы. Например, можно выделить ген, который увеличивает вероятность рака, или ген, который заставляет человека не любить кинзу (да, такой правда есть). Такие задачи и решают биоинформатики. Для них геном — это data lake, массив данных, который организован по понятным законам. И с ним уже можно работать привычными нам инструментами дата-сайенса.

Люди страдают редким генетическим заболеванием — амаврозом Лебера. Из-за мутации в генах, которые кодируют белки сетчатки, светочувствительные палочки теряют чувствительность — и человек слепнет. Более 95% детей с врождённым амаврозом полностью слепнут к десятому году жизни. От генетического заболевания не помогают никакие обычные лекарства.

Однако побороть амавроз Лебера смогла генетическая терапия, к созданию которой причастны биоинформатики. Больным вводят генетически модифицированный препарат, который «чинит» мутации белков, и зрение возвращается в 100% случаев.

В ближайшем будущем лекарство от амавроза начнут использовать повсеместно — и болезнь будет полностью побеждена.

Кроме того, биоинформатики помогают науке работать с этими геномами, а не просто изучать их. Например, можно математическими методами создавать лекарства от рака, которые учитывают уникальные особенности генома пациента. И это не фантастика, а вполне себе реальность.

I

То есть биоинформатики помогут нам жить вечно?

Это скорее к сторонникам цифровой сингулярности — они хотят поместить сознание человека внутрь компьютера, чтобы подарить человечеству бесконечную цифровую жизнь. Биоинформатики изучают «настоящую» жизнь: природу и живые организмы.

Безусловно, результаты труда биоинформатиков используются на переднем крае медицины. Прогресс, как мы знаем, неостановим — а значит, будут появляться всё более совершенные лекарства и методы лечения. Это поможет всем людям болеть меньше и жить дольше.

Окей, а что насчёт нейросетей? Тут будет прорыв?

Развитие нейросетей, конечно, помогает — но нельзя сказать, что биоинформатики до них писали код «на бумажке». Специалисты хорошо владеют Python и другими языками, пишут специализированные программы для обработки данных. В мире хватает и готовых фреймворков.

Нейросети помогают немного ускорить то, что мы и сейчас умеем делать. С одной стороны, не скажешь, что ChatGPT обеспечит прорыв в биоинформатике. А с другой — даже небольшое ускорение в среднесрочной перспективе даст мощный буст. Поглядим — увидим!
Екатерина Храмеева

Ну хорошо. А что сейчас происходит с образованием? Востребована эта специальность?

Да, безусловно. Биоинформатики нарасхват — как и любые специалисты по работе с данными. Значительная часть магистрантов ходит на занятия с оферами в кармане: их зовут в фармацевтические корпорации, медицинские стартапы, в IT. Зарплаты в этой области привычные, не хуже типичных айтишных. Работы много и в России, и за рубежом.

У нас в лаборатории есть исследователь, который раньше вообще занимался аналитикой энергетических электросетей. Но ничего, он быстро прокачался в биологии на достаточном уровне — и занялся биоинформатикой.
В этом уникальная специфика нашей научной деятельности: в биоинформатику (в отличие от энтомологии или нейробиологии) можно легко войти, имея только достаточный математический и программистский бэкграунд. И искренний интерес к профессии.
Екатерина Храмеева

А ещё этой уникальной специальностью можно заниматься не вместо, а вместе с IT. Например, хорошему специалисту по работе с данными будут рады в научно-исследовательском институте или биоинформатическом стартапе — коллеги помогут правильно понять данные и интерпретировать результаты. Так что изучать гены и создавать новые препараты можно параллельно со своей основной работой.

Краткий пересказ от YandexGPT