На чём учатся современные модели машинного перевода: опыт команды Яндекс Переводчика

5 декабря 2024

В этой статье рассказывается о том, как из общедоступных текстов интернета в 100 ПБ найти терабайты суперчистых данных с переводами между любыми языками. Вы узнаете, почему эта задача требует обучения больше десятка различных вспомогательных ML‑моделей. А ещё — какое место в этом процессе занимает YandexGPT и что это за зверь такой — YandexGPT‑MT.

5 декабря 2024

Разработка

Краткий пересказ от YandexGPT