В своём докладе на Data Fest Виктория Чекалина делится методами быстрой аппроксимации матрицы Фишера для эффективного сжатия больших языковых моделей (LLM). Она объясняет, как факторизация Кронекера помогает оптимизировать этот процесс.
В своём докладе на Data Fest Виктория Чекалина делится методами быстрой аппроксимации матрицы Фишера для эффективного сжатия больших языковых моделей (LLM). Она объясняет, как факторизация Кронекера помогает оптимизировать этот процесс.