Участники обсуждают, что рефорсмент - это процесс обучения рекомендаций, который требует больших ресурсов и времени. Они также обсуждают, что рефорсмент может быть полезен в будущем, но сейчас есть более эффективные методы, такие как многорукие бандиты и онлайн-эксперименты.