Руслан Савченко, руководитель службы разработки динамических таблиц в Yandex Infrastructure и преподаватель в Школе анализа данных, поделится актуальными инсайтами о том, как ломаются большие системы и как их траблшутить. Это будет полезно разработчикам и студентам, которые интересуются Site Reliability Engineering. Вообще, мало где сейчас обучают SRE, хотя в индустрии такие задачи очень востребованы (кстати, статья про сетевую аварию в Яндексе стала одной из самых популярных в этом блоге в прошлом году).