ML-платформа — повседневный инструмент ML-инженера в Тинькофф. «Под капотом» это большой и сложный инфраструктурный проект.
Никита Томчик, ведущий разработчик в Тинькофф, рассказал, как они с командой переехали со Slurm на Kubernetes, улучшили многие процессы и исправили проблемы.