14–26 июля 2025 годаНГУ

Студкемп Яндекса по обработке естественного языка

Двухнедельное погружение в современные подходы  NLP под руководством экспертов из Яндекса, ШАДа и НГУ. Участники освоят ключевые подходы к обработке текста, а также поработают с BERT, GPT и YandexGPT на практике

Глубокое погружение в NLP

Разбор трансформеров: от базовой архитектуры до робастного обучения (IRM) и комбинации с внешними источниками знаний (RAG)

Много практики

Занятия построены вокруг практических задач: программирование, работа с данными, реализация моделей. Цель кемпа — научить решать реальные кейсы с использованием современных NLP‑инструментов

Рабочие инструменты

Участники работают с решениями, которые используют в реальных продуктах и исследованиях: YandexGPT, Qwen

Экспертиза из индустрии и науки

Преподаватели — разработчики NLP‑систем, сотрудники Яндекса и исследователи из НГУ и ШАДа. На кемпе они поделятся опытом, как научные идеи превращаются в работающие технологии

Акцент на многоязычность и устойчивость NLP‑моделей

Курс затрагивает ключевые вызовы современной лингвистики: как строить NLP‑системы, которые устойчивы к ошибкам, работают с несколькими языками и не теряют смысла под давлением сложных кейсов

Как всё устроено

14–26 июля 2025 года
Новосибирск
НГУ

Подробнее о кемпе

  • Две недели интенсивных занятий:  лекции, домашние задания и проект
  • Изучение передовых технологий: attention‑механизмы, авторегрессионные модели, мультимодальность и RAG
  • Финальный проект, который решает реальные задачи на стыке науки и индустрии
  • Общение с единомышленниками и преподавателями
  • Кемп бесплатный. Проезд и проживание — за счёт организатора 
  • Кому подойдёт

    Студентам бакалавриата IT‑направлений, которые:
  • знакомы с основами машинного обучения и хотят углубиться в NLP
  • понимают линейную регрессию и классификацию
  • программируют на Python и работают с библиотеками вроде NumPy
  • знают архитектуру нейросетей и имеют опыт с PyTorch или TensorFlow
  • имеют представление о токенизации и методах типа «мешок слов»
  • Регистрация до 18 мая 2025 года

    Что вас ждёт

    Первая неделя посвящена знакомству с ключевыми подходами к NLP. Участники разберутся в архитектуре трансформеров, изучат методы адаптации и интерпретации моделей, а также освоят задачи классификации, генерации и устойчивости к ошибкам. Вторая неделя — фокус на практике: анализ данных, работа с моделями и итоговая защита проекта

    Теория

    Эволюция подходов: от word2vec до трансформеров
    Архитектуры: CNN, RNN (LSTM, GRU), Transformer, BERT, GPT
    Устойчивость к adversarial‑атакам, байесовские нейросети, минимизация инвариантного риска

    Практика

    Реализация моделей с нуля (свёрточные сети для текстов)
    Использование pre‑trained‑моделей (BERT, GPT) для задач классификации и генерации
    Оптимизация: инструкционный файнтюнинг, применение LoRA‑адаптеров, ансамблирование
    Работа с текстовыми и мультимодальными датасетами

    А также

    Возможность поступить в магистратуру на программу «Прикладное машинное обучение и анализ больших данных» после прохождения собеседования на кемпе
    Общение с разработчиками NLP‑систем и академическими исследователями

    Этапы отбора и обучения

    01

    Регистрация

    На почту, которую вы укажете при регистрации, пришлём письмо с доступом к тестовому заданию
    С 6 мая
    02

    Тестирование

    Тест поможет проверить ваши знания в программировании
    С 15 по 18 мая
    03

    Собеседования

    С теми, кто успешно прошёл тестирование. Познакомимся и узнаем про мотивацию
    С 25 мая по 11 июня
    04

    Результаты отбора

    Сообщим на почту об итогах
    13 июня
    05

    Студкемп

    С 14 по 26 июля

    Популярные вопросы

    Tue May 06 2025 11:11:10 GMT+0300 (Moscow Standard Time)