Вы уже сталкивались с простыми примерами кода на Python. В этом параграфе мы поговорим о том, как его запускать. Это пригодится вам в ближайших параграфах, когда мы подберёмся непосредственно к анализу данных, — без Python там не обойтись.

Существует два способа запуска кода из примеров:

  • онлайн без установки Python на личный компьютер;
  • офлайн с установкой Python и нескольких дополнительных программ.

Мы не ограничиваем вас в выборе варианта — можно начать работать онлайн, а позже настроить себе локальную версию Python.

Онлайн: работа с Colaboratory

Colaboratory (обычно её называют Colab) — это как Google Docs, но для кода. То есть инструмент, с помощью которого можно сразу начать работу, не тратя вечер на установку и настройку интерпретатора.

У него есть несколько достоинств:

  • не нужно ничего настраивать;
  • можно работать над одним проектом вместе с несколькими людьми;
  • есть большинство нужных дополнительных расширений языка Python (их называют библиотеками, и об этом мы поговорим позднее).

Почему мы не можем рекомендовать этот способ как единственный:

  • бесплатная версия может работать не так быстро, как хочется;
  • в бесплатной версии длительные задачи могут непредсказуемо обрываться;
  • файлы с данными занимают место в облачном хранилище (его там не так много);
  • некоторые файлы с данными может быть нельзя помещать в облачные хранилища.

Однако это отличный инструмент для начала работы! Давайте попробуем. Для работы в Colab перейдите по следующей ссылке.

1

Чтобы создать файл, в котором вы сможете запускать код, нажмите на «Файл -> Создать новый блокнот». Вам откроется новая вкладка с блокнотом. Чтобы переименовать файл, нажмите на «Untitled.ipynb» и укажите другое название.

Файлы, которые вы создаёте, можно увидеть, если нажать «Файл -> Показать расположение на диске». Или можно найти папку Colab Notebooks в вашем облачном хранилище.

1

В Colab используется специальный формат работы со скриптами — блокнот, который состоит из чередующихся блоков с кодом и текстом. Этот способ работы используется только для анализа данных. В других сферах чаще всего пишут скрипты (представьте себе, что это единственная ячейка блокнота) или изредка используют интерактивный режим, набирая программу строчка за строчкой в консоли.

Для добавления кода необходимо нажать на кнопку «+ Код», как показано на картинке. Для добавления текста нажмите «+ Текст». Текст может быть описанием к коду или добавлением разных инструкций.

1

Чтобы запустить код, необходимо нажать на кнопку со значком запуска. После исполнения его результат будет показан под ячейкой, и вы увидите зелёную галочку, если код выполнился.

1

В Colab отдельные ячейки с кодом можно менять местами с помощью кнопок со стрелками.

1

А чтобы загрузить файл, нужно нажать кнопку со значком папки.

14

Потом нажать на кнопку со значком файла и выбрать на компьютере файл, который вам необходимо подгрузить для работы.

1

Мы выбрали для загрузки файл под названием Crime_2001.csv. Вы можете загрузить любой другой набор данных из тех, что есть в репозитории учебника. После загрузки он будет доступен в папке.

1

Можете попробовать создать и запустить несколько простых программ.

Просто сложим два числа:

2 + 2
4

Напечатаем строчку:

print('Hello, World!')
Hello, World!

И другую, создав переменную (про это мы поговорим в параграфе 2.3).

phrase = 'Hello again!'
print(phrase)
Hello again!

Если у вас всё получилось, то вы готовы двигаться к следующей главе!

Офлайн: установка Python на локальный компьютер

Ещё можно установить Python локально. Для этого необходимо перейти по ссылке. Затем нажать на вкладку Downloads и выбрать нужную операционную систему: Windows, Linux, macOS.

1

Вам нужен Latest Python 3 Release. На момент написания учебника это Python 3.11.2. Тут нужно уточнить, что учебник ещё проверен для версии 3.8.10, так как именно она используется в Colab. Однако локально мы советуем установить последнюю версию. У вас не должно быть проблем с запуском примеров. Если нет, то нажмите на кнопку связи с поддержкой в футере.

Если у вас загрузился Python, то можно запустить загруженный установщик. В процессе установки нужно отметить все галочки, как на скриншоте. Нам это необходимо для последующей работы с Python из командной строки. Установщик ещё предложит вам изменить максимальную длину пути к файлу, но делать это не нужно.

1

После завершения загрузки нажмите Close. И поздравляем! Python был загружен к вам на локальный компьютер.

1

Работа с IDLE

После установки Python вы можете работать с ним с помощью интегрированной среды разработки. IDLE — это простейшая программа для написания скриптов. Она была установлена вместе с Python. Для работы необходимо найти её в списке программ, установленных на компьютер.

1

Для начала работы создайте новый файл с помощью следующих шагов: «File -> New File». В нём мы и напишем нашу первую программу.

1

Для сохранения нового файла используйте «File -> Save As». Напишите имя файла, убедитесь, что сохраняете его в формате .py. После нажмите кнопку «Сохранить». И всё! Первый файл в Python сохранён. Этот файл можно запустить, нажав на «Run -> Run Module» на верхней панели.

1

Мы советуем вам завести специальную папку для скриптов. Её можно назвать Projects и разместить в вашей домашней папке или в «Документах».

Установка Jupyter Notebook

Для базовой работы в Python подходит и работа с интегрированной средой разработчика. Но для запуска более сложных программ и проведения сложного анализа данных вам необходимо скачать более продвинутые инструменты, которые поддерживают не только создание скриптов, но и работу в блокнотах. Например, Jupyter Notebooks или VSCode.

Для установки Jupyter Notebooks вам необходимо открыть «Командную строку». Для её открытия найдите в списке приложений «Командную строку» и запустите её.

1

Затем копируем в командную строку текст ниже, нажимаем Enter и ждём, пока установится нужное нам дополнение.

pip install notebook 

У вас может возникнуть вопрос, что вы запустили и что сейчас устанавливается. pip — это специальная программа для установки дополнений (их ещё называют библиотеками) для Python. Команда pip install notebook устанавливает специальную библиотеку для Python, которая позволяет создавать и запускать Jupyter Notebook — специальный тип файлов для написания скриптов для анализа данных. Его часто называют блокнотом или ноутбуком. Этой библиотеке требуются какие-то дополнительные библиотеки (их называют зависимостями), без которых она не сможет работать. Вот все они сейчас устанавливаются!

1

Важно! Обратите внимание, что мы будем использовать и другие библиотеки, которые нужно будет устанавливать таким же образом. Например, когда в следующей главе мы будем говорить о pandas, то вам будет нужно установить его так же, как и Jupyter Notebooks.

Jupyter Notebooks успешно установился на наш компьютер. Для работы с Jupyter Notebooks напишите в командной строке:

 jupyter notebook

При вводе Jupyter Notebook в командной строке может возникнуть ошибка, в этом случае попробуйте вывести команду python -m notebook. В случае, если у вас возникают иные ошибки, которые не решаются этими командами - всегда лучше обратиться на Stack Overflow и найти там свою специфичную ошибку и решения к ней. Это относится не только к системным проблемам, но и вообще любым проблемам с кодом.

Вам автоматически откроется вкладка браузера. Вход в наш Jupyter Notebooks произошёл!

1

Для работы с Jupyter Notebooks создайте новый файл. Для этого нажмите на New, выберите версию Python и запустите новый файл.

1

Вы можете заметить, что он выглядит как Colab. Это не случайно. Дело в том, что Colab — это просто ещё одна версия Jupyter Notebooks.

Для сохранения файла нажмите на кнопку, напоминающую дискету. Для добавления дополнительных строчек кода воспользуйтесь плюсом, который находится рядом с дискетой.

1

Для переименования файла нажмите на Untitled и напишите более подходящее для вас название блокнота. После переименования нажмите на кнопку «Rename».

1

Запустить код можно двумя способами: с помощью кнопки “Run” и с помощью горячих клавиш “Ctrl” + “Enter”.

1

Поздравляем, мы разобрались, как можно установить Python и Jupyter Notebooks. Попробуйте запустить программы, которые мы написали выше в Jupyter Notebooks.

В следующем параграфе мы разберёмся с тем, что такое данные и какие методы работы с ними используют исследователи. А заодно поработаем с данными в Python — и узнаем, сколько стоил билет в каюту первого класса «Титаника».

Отмечайте параграфы как прочитанные чтобы видеть свой прогресс обучения

Вступайте в сообщество хендбука

Здесь можно найти единомышленников, экспертов и просто интересных собеседников. А ещё — получить помощь или поделиться знаниями.
Вступить
Сообщить об ошибке
Предыдущий параграф1.3. О данных и информации
Следующий параграф2.1. Данные