Самая большая BERT-подобная модель на русском, которая поместится на ваш компьютер

Перейти

Используя вычислительную платформу Яндекса, было выполнено обучение RuLeanALBERT — нейросети, показывающей сравнимые с другими открытыми моделями и где-то даже близкие к state-of-the-art результаты на бенчмарках по пониманию русского языка — Russian SuperGLUE и RuCoLA. В статье можно прочитать о подробностях обучения, которые были реализованы в открытом коде.

Краткий пересказ от YandexGPT