Это наши коллеги из YADRO: архитектор и эксперт по разработке ПО искусственного интеллекта Андрей Соколов и старший инженер по разработке ПО ИИ Юлия Камелина. На видео — запись из выступления на Practical ML Conf 2024. В докладе они рассмотрели простую методику для оптимизации подсистемы генеративного ридера, который является одним из ключевых компонентов вопросо-ответных систем на архитектуре RAG. Её особенности — это простота, скорость и минимальные требования к аппаратному обеспечению.
Подписывайтесь на телеграм-канал Яндекса для ML-специалистов: https://t.me/yandexforml