Сжатие LLM с помощью аппроксимации матрицы Фишера и факторизации Кронекера

В своём докладе на Data Fest Виктория Чекалина делится методами быстрой аппроксимации матрицы Фишера для эффективного сжатия больших языковых моделей (LLM). Она объясняет, как факторизация Кронекера помогает оптимизировать этот процесс.