Визуализация данных: как сделать числа и отчёты понятными

Пообщались с экспертом по анализу и визуализации данных Андреем Дорожным и узнали, как доносить мысли до аудитории с помощью графиков и каких ошибок стоит избегать

Зачем визуализировать данные

Визуализация данных — это представление информации и аналитики в виде графиков, диаграмм и карт. Иногда требуется использовать несколько разных визуализаций, чтобы правильно донести сообщение до читателя. Вот примеры таких комплексных решений.

Инфографика — в неё могут входить числа, диаграммы, схемы, текст, но основу составляют изображения.

Пример инфографики

Дашборд — набор графиков и чисел, приборная панель, которая помогает проанализировать данные с разных сторон и принять решение.

Пример дашборда из Yandex DataLens

Визуализация данных помогает решить несколько задач:

  • Понять, что происходит в данных. Информации в интернете становится всё больше, а специалистов по обработке не хватает. Бывает, что визуализация — единственный способ разобраться.

  • Сравнить данные. Изучать таблицы или документы неудобно, особенно когда информации много. На графике легче сопоставить величины, заметить закономерности и сделать правильные выводы.

  • Быстро принять решение. Человек лучше усваивает информацию глазами. Если данные на графике представлены правильно, менеджеру проще понять, что творится в компании, и выбрать дальнейшие шаги.

Пример визуализации в виде круговой диаграммы

Как сделать понятную визуализацию

Визуализация данных — язык, на котором вы общаетесь с пользователями. Чтобы освоить его, нужно:

  • Решить, что вы хотите сказать читателю.

  • Перевести сообщение на визуальный язык. В иностранных языках или программировании есть правила, которые важно соблюдать, чтобы вас понимали. Так же работает и визуализация данных.

Алгоритм создания визуализации состоит из шести этапов:

1. Определить задачу. Бывает, графики не получаются из-за того, что автор неправильно выбрал цель. Во многом это связано с пониманием аудитории. Например, вы хотите показать, что число пользователей нового сервиса растёт.

4

2. Понять контекст проблемы, которую вы исследуете. Контекст — всё, чего нет на графике, но что важно знать читателю. В любой области есть нюансы. Человек со стороны не всегда понимает, почему на графике получилась именно такая зависимость, ведь он не погружён в задачу. В примере из первого пункта вы знаете, какая динамика роста приемлема, что на неё влияет и сколько пользователей у конкурентов. Поделитесь этой информацией с читателем.

3. Собрать данные — подготовить их, очистить, убедиться, что в них нет ошибок и дыр.

4. Выбрать вид визуализации. Для этого нужно определить тип сравнения. Базово их четыре: разница показателей, часть от целого, изменения во времени или в пространстве. Для каждого типа есть графики, которые хорошо понимает большинство людей: столбчатая, круговая, линейная диаграммы и карты. Специальные сервисы — The Data Visualization Catalogue или Data Viz Project — помогут выбрать вид визуализации.

Виды графиков в зависимости от типа сравнения

5. Выбрать инструмент для визуализации. К простым и бесплатным программам относятся:

  • MS Excel или Google Таблицы;

  • PowerPoint;

  • Flourish — нужен VPN.

С помощью первых двух инструментов можно создавать базовые графики — но без кастомизации: нельзя изменить цвет или толщину любого элемента. Чем больше возможностей у программы, тем она сложнее.

Вот более гибкие бесплатные сервисы с дополнительной функциональностью:

  • Datawrapper — работает без VPN;

  • RAWGraphs — работает без VPN;

  • Yandex DataLens — работает без VPN;

  • Tableau Public — работает с VPN;

  • D3.js — нужно знать JavaScript;

  • Matplotlib — для тех, кто умеет программировать на Python.

6. Отполировать визуализацию — самый важный и долгий этап. Нужно выбрать цвета, шрифт, заголовок и добавить аннотации, где это необходимо.

Пример создания графика

1. Определяем задачу

Важное правило: один график — одна мысль. Человек плохо воспринимает несколько сообщений сразу, ему проще фокусироваться на чём-то одном. Не сваливайте все собранные данные на читателя. Определите, что вы хотите сказать, и разделите мысли на несколько графиков. Например, нужно поэтапно подвести читателя к выводу, что продукт окупается. Один из графиков может показывать, как растёт число пользователей. Другой — динамику прибыли.

Задача — показать, что число пользователей сервиса растёт, но недотягивает до целевых показателей.

2. Погружаемся в контекст

Важно знать, какой бэкграунд у вашей аудитории, какие слова она понимает. Например, есть термин EBITDA — прибыль компании до вычета налогов, амортизации и процентов по кредитам. Если его услышит школьник, он, скорее всего, засмеётся. А на собрании акционеров участники скажут: «Как здорово, что у нас EBITDA растёт». Нужно адаптировать график под контекст и убедиться, что читатель получает новое знание. Иначе пользы от визуализации данных не будет.

Контекст — сервис запустили полгода назад, поэтому присутствует эффект низкой базы. Пробовали рекламу в социальной сети и таргет в Яндексе.

3. Собираем данные

Прирост количества пользователей по неделям попросили у продакт-менеджера.

4. Определяем вид графика

Так как нужно показать изменение числа пользователей, подойдёт линейная диаграмма.

5. Выбираем инструмент

Чтобы не усложнять задачу, нарисуем график в Google Таблицах.

6. Дорабатываем график

От аудитории зависит, какую лексику использовать в визуализации. Внутренние сотрудники компании поймут принятые термины и аббревиатуры. Если вы делаете график для широкой аудитории, ориентируйтесь на знания десятиклассника. Например, в банках используют виды визуализации, которые понимают только там, такие как график-водопад, waterfall chart. Его редко можно встретить в других сферах.

Заголовок — эту важную часть визуализации часто упускают. Основной вывод, который хотите донести до читателя, поместите в название графика. Даже если человек не поймёт изображение, он уловит смысл сообщения. Всегда лучше подстраховаться. В подзаголовке укажите, какие данные использовали.

Получится заголовок «Число пользователей растёт, но целевые показатели не достигнуты», подзаголовок — «Прирост числа пользователей в день».

Контекст. Допустим, целевой показатель — 140 пользователей в день. Отметим его красной линией на графике и добавим аннотацию — она описывает то, что не показывают числа, и подсвечивает ключевые мысли. Вы даёте читателю дополнительную информацию, с помощью которой ему легче считывать график.

Цвета и шрифт. В каждой компании принят свой корпоративный стиль, он распространяется и на графики. Если создаёте визуализацию для рабочих задач, используйте фирменные цвета и шрифты — это выделит изображение среди остальных, а читатель узнает компанию.

Для личных целей можно обратиться к бесплатным сервисам, которые помогают подбирать цвета для графиков, — Adobe Color или ColorBrewer. Необязательно обладать визуальным вкусом, чтобы грамотно сочетать оттенки. Освоить эти инструменты под силу любому человеку.

Базово шрифты делятся на два типа — с засечками (Serif) и без (Sans Serif). Serif смотрится более олдово, как в старых газетах. Sans Serif чаще используют в диджитале — например, к этому типу относится Arial.

В нашем примере используем расширение ColorPick Eyedropper, чтобы подобрать цвет, и WhatFont — для шрифта.

Легенда — ключ к визуализации, с её помощью обозначаются категории. Но лучшая легенда — та, которой нет. Можно зашить её в подзаголовок, чтобы снизить когнитивную нагрузку на человека. Если без легенды не обойтись, делайте её в левом верхнем углу: так пользователю проще её прочитать.

Для нашей задачи легенда не нужна: у нас всего одна категория. Если решим добавить конкурентов, зашьём легенду в заголовок.

В результате получился график:

6

Добавим конкурентов и уберём легенду в заголовок:

7

Какие ошибки допускают при создании визуализации

График не несёт ценности для читателя. Непонятно, какую мысль хотел донести автор. Например, человек выступает перед командой, подготовил много картинок и все их показывает. Но у слушателей мало времени, они хотят увидеть важное. Если визуализация не сообщает читателю ценную информацию, она не выполняет свою задачу.

Вид диаграммы выбран неправильно — человеку сложно считывать информацию. Не стоит использовать 3D-визуализацию, по ней не получится корректно сравнить данные.

Столбиковая диаграмма нарисована не от нуля — это манипуляция данными, когда подрезается часть информации. Люди могут не заметить, что числа начинаются не с нуля.

В круговой диаграмме не сходится сумма частей — она больше или меньше 100%.

График неправильно стилизован. Нет единообразия — встречаются разные шрифты и нагромождение цветов.

Визуализация не адаптирована под мобильную версию. Лучше делать график квадратным или размером 4 × 5. Важно, чтобы он помещался в одном окне — влезал на экран смартфона или ноутбука.

Что почитать

  • Телеграм-канал «Дата-сторителлинг» рассказывает про истории, основанные на данных, инфографику, диаграммы, карты и инструменты для визуализации без программирования.

  • «Графики, которые убеждают всех», Александр Богачёв — книга учит готовить данные к работе, выбирать и оформлять график, чтобы он доносил сообщение до аудитории.

  • «Данные: визуализируй, расскажи, используй», Коул Нассбаумер Нафлик — автор объясняет основы визуализации данных и учит эффективно взаимодействовать с ними.

  • «Представление информации», Эдвард Тафти — автор на примерах разбирает ошибки в визуализации данных и делится принципами, которые помогают сделать инфографику понятной.

  • «Графики лгут. Как стать информационно грамотным человеком в мире данных?», Альберто Кайро — книга показывает, как инфографика вводит в заблуждение читателя, и учит создавать корректную визуализацию.

Краткий пересказ от Yandex GPT