Визуализация данных: как сделать числа и отчёты понятными
Зачем визуализировать данные
Визуализация данных — это представление информации и аналитики в виде графиков, диаграмм и карт. Иногда требуется использовать несколько разных визуализаций, чтобы правильно донести сообщение до читателя. Вот примеры таких комплексных решений.
Инфографика — в неё могут входить числа, диаграммы, схемы, текст, но основу составляют изображения.

Дашборд — набор графиков и чисел, приборная панель, которая помогает проанализировать данные с разных сторон и принять решение.

Визуализация данных помогает решить несколько задач:
-
Понять, что происходит в данных. Информации в интернете становится всё больше, а специалистов по обработке не хватает. Бывает, что визуализация — единственный способ разобраться.
-
Сравнить данные. Изучать таблицы или документы неудобно, особенно когда информации много. На графике легче сопоставить величины, заметить закономерности и сделать правильные выводы.
-
Быстро принять решение. Человек лучше усваивает информацию глазами. Если данные на графике представлены правильно, менеджеру проще понять, что творится в компании, и выбрать дальнейшие шаги.

Как сделать понятную визуализацию
Визуализация данных — язык, на котором вы общаетесь с пользователями. Чтобы освоить его, нужно:
-
Решить, что вы хотите сказать читателю.
-
Перевести сообщение на визуальный язык. В иностранных языках или программировании есть правила, которые важно соблюдать, чтобы вас понимали. Так же работает и визуализация данных.
Алгоритм создания визуализации состоит из шести этапов:
1. Определить задачу. Бывает, графики не получаются из-за того, что автор неправильно выбрал цель. Во многом это связано с пониманием аудитории. Например, вы хотите показать, что число пользователей нового сервиса растёт.

2. Понять контекст проблемы, которую вы исследуете. Контекст — всё, чего нет на графике, но что важно знать читателю. В любой области есть нюансы. Человек со стороны не всегда понимает, почему на графике получилась именно такая зависимость, ведь он не погружён в задачу. В примере из первого пункта вы знаете, какая динамика роста приемлема, что на неё влияет и сколько пользователей у конкурентов. Поделитесь этой информацией с читателем.
3. Собрать данные — подготовить их, очистить, убедиться, что в них нет ошибок и дыр.
4. Выбрать вид визуализации. Для этого нужно определить тип сравнения. Базово их четыре: разница показателей, часть от целого, изменения во времени или в пространстве. Для каждого типа есть графики, которые хорошо понимает большинство людей: столбчатая, круговая, линейная диаграммы и карты. Специальные сервисы — The Data Visualization Catalogue или Data Viz Project — помогут выбрать вид визуализации.

5. Выбрать инструмент для визуализации. К простым и бесплатным программам относятся:
-
MS Excel или Google Таблицы;
-
PowerPoint;
-
Flourish — нужен VPN.
С помощью первых двух инструментов можно создавать базовые графики — но без кастомизации: нельзя изменить цвет или толщину любого элемента. Чем больше возможностей у программы, тем она сложнее.
Вот более гибкие бесплатные сервисы с дополнительной функциональностью:
-
Datawrapper — работает без VPN;
-
RAWGraphs — работает без VPN;
-
Yandex DataLens — работает без VPN;
-
Tableau Public — работает с VPN;
-
D3.js — нужно знать JavaScript;
-
Matplotlib — для тех, кто умеет программировать на Python.
6. Отполировать визуализацию — самый важный и долгий этап. Нужно выбрать цвета, шрифт, заголовок и добавить аннотации, где это необходимо.
Пример создания графика
1. Определяем задачу
Важное правило: один график — одна мысль. Человек плохо воспринимает несколько сообщений сразу, ему проще фокусироваться на чём-то одном. Не сваливайте все собранные данные на читателя. Определите, что вы хотите сказать, и разделите мысли на несколько графиков. Например, нужно поэтапно подвести читателя к выводу, что продукт окупается. Один из графиков может показывать, как растёт число пользователей. Другой — динамику прибыли.
Задача — показать, что число пользователей сервиса растёт, но недотягивает до целевых показателей.
2. Погружаемся в контекст
Важно знать, какой бэкграунд у вашей аудитории, какие слова она понимает. Например, есть термин EBITDA — прибыль компании до вычета налогов, амортизации и процентов по кредитам. Если его услышит школьник, он, скорее всего, засмеётся. А на собрании акционеров участники скажут: «Как здорово, что у нас EBITDA растёт». Нужно адаптировать график под контекст и убедиться, что читатель получает новое знание. Иначе пользы от визуализации данных не будет.
Контекст — сервис запустили полгода назад, поэтому присутствует эффект низкой базы. Пробовали рекламу в социальной сети и таргет в Яндексе.
3. Собираем данные
Прирост количества пользователей по неделям попросили у продакт-менеджера.
4. Определяем вид графика
Так как нужно показать изменение числа пользователей, подойдёт линейная диаграмма.
5. Выбираем инструмент
Чтобы не усложнять задачу, нарисуем график в Google Таблицах.
6. Дорабатываем график
От аудитории зависит, какую лексику использовать в визуализации. Внутренние сотрудники компании поймут принятые термины и аббревиатуры. Если вы делаете график для широкой аудитории, ориентируйтесь на знания десятиклассника. Например, в банках используют виды визуализации, которые понимают только там, такие как график-водопад, waterfall chart. Его редко можно встретить в других сферах.
Заголовок — эту важную часть визуализации часто упускают. Основной вывод, который хотите донести до читателя, поместите в название графика. Даже если человек не поймёт изображение, он уловит смысл сообщения. Всегда лучше подстраховаться. В подзаголовке укажите, какие данные использовали.
Получится заголовок «Число пользователей растёт, но целевые показатели не достигнуты», подзаголовок — «Прирост числа пользователей в день».
Контекст. Допустим, целевой показатель — 140 пользователей в день. Отметим его красной линией на графике и добавим аннотацию — она описывает то, что не показывают числа, и подсвечивает ключевые мысли. Вы даёте читателю дополнительную информацию, с помощью которой ему легче считывать график.
Цвета и шрифт. В каждой компании принят свой корпоративный стиль, он распространяется и на графики. Если создаёте визуализацию для рабочих задач, используйте фирменные цвета и шрифты — это выделит изображение среди остальных, а читатель узнает компанию.
Для личных целей можно обратиться к бесплатным сервисам, которые помогают подбирать цвета для графиков, — Adobe Color или ColorBrewer. Необязательно обладать визуальным вкусом, чтобы грамотно сочетать оттенки. Освоить эти инструменты под силу любому человеку.
Базово шрифты делятся на два типа — с засечками (Serif) и без (Sans Serif). Serif смотрится более олдово, как в старых газетах. Sans Serif чаще используют в диджитале — например, к этому типу относится Arial.
В нашем примере используем расширение ColorPick Eyedropper, чтобы подобрать цвет, и WhatFont — для шрифта.
Легенда — ключ к визуализации, с её помощью обозначаются категории. Но лучшая легенда — та, которой нет. Можно зашить её в подзаголовок, чтобы снизить когнитивную нагрузку на человека. Если без легенды не обойтись, делайте её в левом верхнем углу: так пользователю проще её прочитать.
Для нашей задачи легенда не нужна: у нас всего одна категория. Если решим добавить конкурентов, зашьём легенду в заголовок.
В результате получился график:

Добавим конкурентов и уберём легенду в заголовок:

Какие ошибки допускают при создании визуализации
График не несёт ценности для читателя. Непонятно, какую мысль хотел донести автор. Например, человек выступает перед командой, подготовил много картинок и все их показывает. Но у слушателей мало времени, они хотят увидеть важное. Если визуализация не сообщает читателю ценную информацию, она не выполняет свою задачу.
Вид диаграммы выбран неправильно — человеку сложно считывать информацию. Не стоит использовать 3D-визуализацию, по ней не получится корректно сравнить данные.
Столбиковая диаграмма нарисована не от нуля — это манипуляция данными, когда подрезается часть информации. Люди могут не заметить, что числа начинаются не с нуля.
В круговой диаграмме не сходится сумма частей — она больше или меньше 100%.
График неправильно стилизован. Нет единообразия — встречаются разные шрифты и нагромождение цветов.
Визуализация не адаптирована под мобильную версию. Лучше делать график квадратным или размером 4 × 5. Важно, чтобы он помещался в одном окне — влезал на экран смартфона или ноутбука.
Что почитать
-
Телеграм-канал «Дата-сторителлинг» рассказывает про истории, основанные на данных, инфографику, диаграммы, карты и инструменты для визуализации без программирования.
-
«Графики, которые убеждают всех», Александр Богачёв — книга учит готовить данные к работе, выбирать и оформлять график, чтобы он доносил сообщение до аудитории.
-
«Данные: визуализируй, расскажи, используй», Коул Нассбаумер Нафлик — автор объясняет основы визуализации данных и учит эффективно взаимодействовать с ними.
-
«Представление информации», Эдвард Тафти — автор на примерах разбирает ошибки в визуализации данных и делится принципами, которые помогают сделать инфографику понятной.
-
«Графики лгут. Как стать информационно грамотным человеком в мире данных?», Альберто Кайро — книга показывает, как инфографика вводит в заблуждение читателя, и учит создавать корректную визуализацию.