Применение VLM (Vision Language Models) в голосовом ассистенте Алиса

В своём докладе на Data Fest Дарья Виноградова делится опытом применения Vision Language Model (VLM) в голосовом помощнике Алиса. Она рассказывает о том, как эта модель используется и какие возможности открывает для взаимодействия с пользователем.