В рамках воркшопа мы освоим новый формат работы с Python - тетрадки IPython Notebook, которая позволяет удобно совмещать ячейки кода и текстовые описания.
Основная часть занятия будет посвящена работе с библиотекой pandas. Pandas позволит нам эффективно и быстро работать с таким форматом данных как таблица. Таблица — это совокупность записей (строк), каждая из которых состоит из одинакового набора полей. С ними в работе сталкиваются почти все: таблица — самый распространенный формат «упаковки» данных.
Мы будем использовать набор данных из третьего задания и на его примере разберем базовые операции и команды, которые позволяют выполнять станадартные процедуры преобразования данных и подсчета разных статистик без прописывания алгоритмов в каждой задаче.