EvoPress: новый подход к оптимизации и сжатию LLM от исследователей Яндекса

20 октября 2025

Краткий пересказ от YandexGPT

Денис Кузнеделев работает в команде Yandex Research. Его основное направление деятельности — задача сжатия и ускорения больших языковых и картиночных моделей. Затраты на обучение, инференс и деплой LLM стали одной из ключевых инфраструктурных проблем индустрии: дефицит вычислительных ресурсов, нехватка видеопамяти и высокие требования языковых моделей к вычислительным ресурсам препятствуют масштабированию решений. Денис рассказывает о методе неравномерного сжатия нейронных сетей EvoPress, который они с командой предложили совместно с коллегами из ETH Zurich и представили в июле этого года на одной из ведущих конференций по машинному обучению — ICML.

Перейти

Авторы

Денис Кузнеделев

Яндекс Образование — Личный кабинет

EvoPress: новый подход к оптимизации и сжатию LLM от исследователей Яндекса

Краткий пересказ от YandexGPT

Ещё по теме

YaC/e 2025: большая конференция Яндекса о людях и технологиях в образовании

Кэш для товарного поиска Лавки на основе LLM

Как найти лучшую генеративную модель для своей задачи

Релиз: что может пойти не так?

Визуально-языковые модели (VLM) в Яндексе: подходы, данные, подводные камни

YaC/e 2025: Образовательный коворкинг

Как ИИ усиливает аналитика и меняет рынок

История опенсорс-проекта LUWRAIN: как эксперименты с LLM помогают создавать невизуальные интерфейсы для незрячих

Рекомендательные системы

AI&Code: синергия будущего

YaC/e 2025: большая конференция Яндекса о людях и технологиях в образовании

Кэш для товарного поиска Лавки на основе LLM

Как найти лучшую генеративную модель для своей задачи