На встрече поговорим об обучении с подкреплением (reinforcement learning) и об атаках на модели. Эти темы популярны сами по себе, а в применении к рекомендациям особенно интересны. От Дзена будет история о том, как возникла задача ранжирования по сложной негладкой метрике, какие подходы в ней пробовали и что заработало лучше всего.
— Reinforcement Learning в рекомендательных системах 2020: улучшения и реальность
— Яндекс.Дзен: переход от оптимизации кликов к оптимизации «профицита»
— Злонамеренные атаки: почему они опасны для моделей последовательных данных?