5.1. О чём мы поговорим в этой главе

В этой главе мы разберём основы теории вероятности и статистики — важнейших инструментов анализа данных и машинного обучения. Мы рассмотрим ключевые концепции, которые помогут вам понять, как оценивать качество моделей и строить более точные предсказания.

Вот о чём пойдёт речь:

  • Вероятностные пространства и аксиомы. Мы начнём с основ теории вероятностей — изучим вероятностные пространства и основные аксиомы. Понимание этих базовых принципов поможет вам строить корректные вероятностные модели.
  • Условная вероятность и независимость. Познакомимся с понятием условной вероятности, а также с формулами полной вероятности и Байеса. На примере наивного Байесовского классификатора мы увидим, как эти знания применяются для реальных задач машинного обучения.
  • Характеристики случайных величин. Изучим математическое ожидание, дисперсию, ковариацию и другие числовые характеристики, которые позволяют анализировать распределения и взаимосвязи данных.
  • Энтропия, перплексия и дивергенция. Рассмотрим понятия, пришедшие из теории информации, которые позволяют измерять неопределённость и «расстояние» между распределениями. Эти идеи широко применяются в машинном обучении — от решающих деревьев до языковых моделей и методов визуализации.

Прочитав эту главу, вы сможете:

  1. Использовать инструменты для анализа данных. Вы изучите важнейшие концепции теории вероятности, которые помогут вам оценивать корректность предсказаний и строить вероятностные модели.
  2. Понимать и применять классификационные алгоритмы. Освоив условные вероятности и формулу Байеса, вы сможете использовать эти методы для улучшения ваших моделей машинного обучения.
  3. Оценивать метрики качества моделей. Вы научитесь интерпретировать метрики, такие как точность и полнота, и применять их для корректной оценки эффективности ваших решений.

Для комфортного чтения главы полезно иметь базовые знания в математике — особенно в работе с функциями и логикой. Опыт работы с данными или машинным обучением поможет лучше прочувствовать примеры, но не является обязательным.

Приступим!

Чтобы добавить в заметки выделенный текст, нажмите Ctrl + E
Предыдущий параграф4.6. Определитель
Следующий параграф5.2. Вероятностное пространство