20.05.2024 публикации

Как правильно визуализировать данные, чтобы принимать эффективные решения?

Примеры визуализации данных
Согласно исследованию «Data Age 2025», проведенному аналитической компанией IDC (International Data Corporation), объем данных в мире к 2025 году вырастет до 175 зеттабайт (175 триллионов ГБ). Большую часть этих данных генерирует бизнес.

Это огромное количество информации, которое включает в себя данные о клиентах, транзакциях, конкурентах, процессах и операциях, данные из социальных сетей и онлайн-платформ, сенсоров, IoT и многие другие. Все они представлены в разных форматах: электронных таблицах, текстах, изображениях, видео.

Зачем визуализировать данные?

Анализ данных - мощный инструмент для принятия обоснованных и эффективных решений в бизнесе, но интерпретация данных в исходном виде может быть сложной:
  • Большие объемы данных перегружают информацией, рост идет быстрее, чем их успевают обрабатывать
  • Данные хранятся в корпоративных источниках с установленной системой доступов, что ограничивает свободу работы с ними
  • Переключение между разными форматами затрудняет восприятие информации
  • Для полноты картины необходим контекст и связи между разрозненными данными
  • Не вся информация одинаково ценна для анализа, выделить ключевую вручную сложно
  • Аналитика часто требует специализированных навыков и инструментов, математические модели и алгоритмы не интуитивны для большинства людей
Для того чтобы данные были понятны даже для неподготовленного человека, их можно представить в виде визуализаций: графиков, диаграмм, таблиц, карт.

В статье рассказываем, как создавать эффективные визуализации, которые раскроют природу данных и помогут выявить скрытые в них закономерности, и как помочь пользователю выделить главное с помощью акцентов.

Что такое хорошая визуализация данных?

Согласно исследованиям Калифорнийского университета в области вербального и невербального общения зрительное восприятие информации обычно составляет около 90%.

Правильно подобранные визуальные образы воспринимаются более однозначно, чем текст, что делает визуализации ключевыми для понимания и запоминания информации.
Примеры дашбордов и визуализации
Хорошая визуализация учитывает особенности данных, на которых она строится, чтобы сделать принятие бизнес-решений максимально наглядным и интуитивным.

Путем использования различных цветов, форм и размеров, визуализация поможет выделить ключевую информацию, что упрощает ее анализ.

Если вы корректно используете визуализации:

  • Большой объем данных преобразовывается в лаконичную, доступную для всех форму
  • Графики и диаграммы вызывают интерес, их хочется изучать и задавать вопросы
  • Данные представлены в соответствии с основной целью визуализации и потребностями пользователей, которые их исследуют
  • В данных возникают связи и формируется новый смысл
  • Информация становится живой, даже если тема сама по себе сложна для восприятия

Обратите внимание на примеры ниже. На обоих из них - информация о 7560 спутниках, которые в настоящее время вращаются вокруг Земли.
Пример отчета с данными в Excel
Отчет в Excel пугает и вызывает желание его закрыть, данные кажутся скучными
Дашборд в виде глобуса
Дашборд в виде глобуса впечатляет, его хочется рассматривать и изучать

Основные принципы визуализации данных

Для того, чтобы создать визуализацию, которая привлечет внимание пользователя и облегчит анализ, стоит придерживаться ряда рекомендаций:

  • Выбрать диаграмму, правильно отображающую конкретный тип данных
  • Использовать цвета так, чтобы они помогали пользователю быстрее оценить ключевые показатели
  • Расставить акценты в формах, размерах, с помощью насыщенности цветов, которые подчеркнут самое важное
  • Выбрать такой дизайн визуализаций, который не будет препятствовать пониманию связи в данных или искажать их
Ниже разберем принципы визуализации данных подробнее.

Выбирайте диаграмму в соответствии с задачей

Визуализации создаются не просто для красоты, как правило, у каждого набора данных существует минимум 2–3 варианта визуализации для ответа на разные бизнес-запросы.

Графики и диаграммы помогают быстро обозначить ключевые тренды или аномалии. Таблицы используются для точного отображения конкретных числовых значений.

Самая известная схема выбора визуализаций (чарт-чузер) была предложена еще в 2006 году Эндрю В. Абела, создателем методики разработки презентаций Extreme Presentation™ Method.

Она основана на разделении способов визуализации данных по видам анализа (сравнение, распределение, соотношение, структура), количеству категорий, переменных и периодов.

Помимо схемы Абела существуют и другие чарт-чузеры, которые могут быть хорошей подсказкой для выбора подходящей визуализации.
Рассмотрим некоторые типы диаграмм по основным категориям, которые чаще всего используются для визуализации данных.

1. Сравнение

Сходство и различие между переменными в один момент времени. Например, сравнение результатов маркетинговых кампаний, план-факт продаж.
    • Линейчатая диаграмма (Bar Chart)

      Также известна как столбчатая или полосчатая диаграмма, отображающая информацию в виде баров (столбцов). Длина столбца – значение параметра.
    • Линейчатая диаграмма с группировкой

      Используется для сравнения двух или нескольких наборов данных. Каждый набор данных выделен своим цветом.
    • Вертикальная диаграмма Водопад (Waterfall)

      Используется для отображения изменений значения относительно предыдущего. Верхний – исходное значение, нижний – итоговое.
    • Лолипоп

      Значение параметра отображено длиной линий, на верхушке каждой добавлен кружок. Вид диаграммы позволяет добавлять сноски и пояснения.

    2. Распределение

    Деление на категории, частотность в пределах интервала, группировка по признаку. Например, распределение населения по возрастам, продаж по регионам, процентное соотношение успешных и провальных событий.
      • Гистограмма

        Визуализирует распределение данных в рамках непрерывного интервала или ограниченного периода времени.
      • Боксплот

        Также известна как Диаграмма размаха, «ящик с усами». Показывает статистические показатели: медиану, верхний и нижний квартили, минимумы и максимумы, выбросы.
      • Точечная карта

        Известна также, как точечная карта плотности распределения. Отображает географические паттерны или распределение данных по географическим регионам.
      • График плотности

        Демонстрирует распределение данных за непрерывный или определенный интервал времени. Отображает более гладкое распределение за счет сглаживания изменений параметров.

      3. Структура

      Соотношение части к целому, состав, деление категорий на подкатегории и их отношение к общей величине. Например, доля филиалов в общей выручке, влияние увеличения продаж и сокращения расходов на рост прибыли.
        • Круговая диаграмма (Pie chart)

          Отражает соотношение категорий к целому при помощи сегментов окружности. Вся окружность означает общую сумму, 100%.
        • Линейчатая диаграмма с накоплением

          Показывает, как крупная категория делится на более мелкие, и какое отношение имеет каждая часть в рамках общей величины.
        • Горизонтальная диаграмма Водопад (Waterfall)

          Показывает процентное соотношение подкатегорий и общего показателя, изменение частей от целого во времени.
        • Древовидная карта (Treemap)
          Отображает иерархические данные, полезна при необходимости визуализировать большие объемы данных.

        4. Корреляция

        Взаимосвязь между переменными, которую можно описать как "когда изменяется переменная X, изменяется и переменная Y ". Например, сегментация клиентов по частоте обращений, возрасту и покупательской способности.
          • Пузырьковая диаграмма

            Отображает трехмерные данные в двумерном пространстве. Размер каждого пузырька является третьим измерением.
          • Диаграмма рассеяния

            Демонстрирует, существуют ли связи между двумя переменными. Степень взаимосвязи определяется плотностью расположения точек.
          • Зеркальная линейчатая диаграмма

            Два набора данных располагаются по разным сторонам оси для удобства сравнения и поиска взаимосвязей.
          • Тепловая карта

            Визуализирует данные в цветовой гамме. Удобна для демонстрации вариативности переменных, выявления паттернов, отображения взаимосвязей между переменными.
          Правильно выбранная визуализация данных помогает представить их более понятно и наглядно, обнаружить скрытые тренды или аномалии в данных.

          Правильно используйте цвета

          Цветовая палитра для визуализаций способна как помочь пользователю быстрее оценить ключевые показатели, так и создать хаос в данных.

          Например, использование слишком ярких и насыщенных цветов может создать визуальный шум и отвлечь от самой информации. В то же время, слишком блеклые оттенки сливаются друг с другом и не позволят сконцентрироваться на разнице показателей.
            Дашборд с плохой цветовой читаемостью
            Дашборд с хорошей цветовой читаемостью
            ❌ Сложно сравнить показатели
            ✔️ Проще сравнить благодаря контрастным цветам
            Рассказываем о нескольких способах использования цвета, которые помогут сделать ваши визуализации лучше:

            1. Цветовая палитра зависит от типа данных

            Существует три основных типа цветовых палитр для визуализаций: категориальная (качественная), последовательная и расходящаяся.

              Категориальная (качественная) палитра

              Категориальная (качественная) палитра
              Палитра состоит из разных цветов, которые не имеют упорядоченного или градиентного значения, с близкой яркостью и насыщенностью.

              Категориальная цветовая палитра предназначена для представления категорий или классов данных без какого-либо внутреннего порядка или значений между категориями.

              Она используется для отображения дискретных категорий, таких как различные группы товаров, типы событий, категории пользователей и т. д.

              Последовательная палитра

              Последовательная палитра
              Градиент из одного цвета разной насыщенности.

              Палитру используют для данных, где присутствует упорядоченная структура, явная прогрессия или различные уровни значений.

              Например, такая палитра идеально подходит для отображения температурных карт, рейтингов, показателей продаж, или любых данных, которые имеют явное распределение от низких к высоким значениям или наоборот.

              Расходящаяся палитра

              Расходящаяся палитра
              Комбинация последовательных палитр с разрывом, диапазон значений с определенной серединой, от которой цвета уходят в разные направления.

              Расходящаяся палитра подходит для визуализации данных, которые имеют явное различие между низкими и высокими значениями, с выделенной областью средних значений или уровнем концентрации.

              Это может быть полезно при отображении данных о средней температуре, статистике доходов или других показателях, где центральное значение играет важную роль.
              Выбор цветовой палитры также зависит от контекста визуализации и эстетических предпочтений. Например, для корпоративных отчетов можно использовать цвета, соответствующие фирменному стилю.

                2. Чем меньше цветов, тем проще найти их на дашборде

                Для создания визуализаций лучше использовать не больше 5–6 цветов. Диаграмма будет выглядеть более профессионально, если использовать в ней только несколько оттенков и комплементарных цветов.
                  Неудачные цвета в дашборде
                  Приемлемые цвета в дашборде
                  ❌ Сложно сфокусироваться
                  ✔️ Понятнее
                  Во избежание хаоса в цветах рекомендуется стандартизировать несколько цветовых палитр, каждая из которых предназначена для определенных целей: несколько темных цветов, несколько светлых и нейтральные оттенки.

                  В случаях, когда необходимо использовать большее количество цветов, лучше заменить их оттенками серого или объединить несколько не ключевых категорий данных в одну.

                    3. Разные цвета для разных диаграмм

                    Пастельные, ненасыщенные цвета лучше подходят для крупных элементов визуализации. Яркие, насыщенные – для мелких, в том числе, надписей, тонких линий.

                    Для корректного отображения маленьких элементов можно или прибавить насыщенность и яркость цветовой палитры в конкретной диаграмме, или попробовать увеличить масштаб элементов/ сделать линии толще.
                      Дашборд с читаемыми цветами
                      Плохо читаемый дашборд
                      ✔️ Цвета различимы
                      ❌ Сложно различить элементы
                      Дашборд увеличенного масшатаба
                      ✔️ Увеличили масштаб и добавили насыщенность – стало лучше
                      Для компонентов таблиц и графиков, не относящихся к данным, стоит использовать нейтральные цвета, довольно контрастные, но, в то же время, не отвлекающие от данных.

                      Для обозначения осей и границ диаграмм лучше использовать тонкие, насыщенные серые линии, для фона универсальный вариант – белый.

                        4. Не знаете, какой цвет выбрать - используйте красный и синий

                        Лиза Шарлотта Мут, руководитель отдела коммуникаций издания Datawrapper, в одной из статей о лучших практиках визуализации, предлагает цвета, которые чаще всего используют дизайнеры визуализаций: оттенки желтого/оранжевого/красного в сочетании с оттенками синего.

                        Эти цвета универсальны для любых видов данных и подходят под любые тематики.
                        Желтый, оранжевый и красный сочетаются, но, при этом, воспринимаются как разные цвета, что необходимо для отображения разных значений. Синий цвет всегда воспринимается приятно и даже профессионально.
                          Примеры визуализация с красными и синими цветами
                          Примеры визуализаций из отчета "A year in Graphic detail" от The Economist
                          К тому же контраст этих цветов доступен даже тем, кто страдает дальтонизмом и другими особенностями восприятия.

                            Как привлечь внимание к ключевым показателям?

                            Расставьте акценты

                            Часть информации опознается человеком на уровне бессознательного, подпорогового восприятия – когда действие раздражителя на органы чувств возникло, а порог восприятия, сознательного опознания еще не пройден.

                            При визуализации важны акценты в виде направления, формы, размера, длины и ширины линии, цвета или насыщенности, чтобы информация, которая имеет наибольшую значимость или релевантность (наиболее заметный стимул), отобралась для дальнейшего и более полного анализа путем сознательной обработки.

                            При помощи таких акцентов можно визуализировать ключевую информацию и помочь пользователю интерпретировать ее без усилий.
                              Архитектура управления данными
                              Некоторые визуальные атрибуты, помогающие расставить акценты в данных
                              На примере ниже мы можем наблюдать, как использование разной длины столбцов в диаграмме автоматически направляет наше внимание на город с большим объемом продаж. Этот эффект еще больше усиливается за счет использования цвета. Именно на результатах продаж в этом городе можно сосредоточиться, изучая факторы повышения эффективности.
                                Разные визуальные акценты позволяют анализировать информацию с разной точностью.

                                Например, стандартная гистограмма, где столбцы расположены на одной шкале, позволяет оценивать конкретные значения и делать более точные выводы, а пузырьки разного размера или цвета на пузырьковой диаграмме дают лишь общие представления о разнице показателей.
                                  Точные значения
                                  Общее представление

                                  Не перегружайте

                                  Визуализация должна помочь пользователю сравнить два или более показателей друг с другом. Дизайн визуализаций не должен препятствовать пониманию связи в данных или искажать данные.

                                  Излишнее количество элементов, цветов, попытки уместить в одну многоярусную диаграмму все имеющиеся данные приведет к тому, что визуальный ряд будет перегружен.

                                  Если необходимо визуализировать сразу несколько типов данных и категорий, лучше разделить эту информацию на несколько диаграмм и графиков.
                                  ❌ Ничего не понятно
                                  ✔️ Интересно

                                  Как расположить визуализации на дашборде?

                                  В системах бизнес-аналитики, цель которых – скоррелировать данные и представить их в удобном для пользователя виде, различные визуализации объединены в интерактивные информационные панели – дашборды.
                                  Архитектура управления данными
                                  Дашборды в BI-системе
                                  Некоторые правила, которые сделают ваш дашборд понятным для пользователя:

                                  • Элементы, добавленные в дашборд, должны быть логически объединены и помогать пользователю решить конкретную бизнес-задачу, например, повысить эффективность продаж
                                  • Информация должна помещаться на одном экране без необходимости скроллинга (обычно, не больше 4–7 визуализаций)
                                  • Масштаб визуализации определяется степенью ее важности, порядок расположения – паттерном восприятия пользователей

                                  Для верстки дашбордов используют классические приёмы дизайна.

                                  Стандартная европейская схема считывания информации – Z-образное направление - слева направо и сверху вниз.
                                  Эту схему можно использовать для привлечения внимания пользователя к самым важным элементам, когда простота восприятия визуализаций является основной целью.

                                  Согласно Z-паттерну, стоит располагать диаграммы с ключевыми KPI в левом верхнем углу.
                                  Архитектура управления данными
                                  Z-паттерн считывания
                                  Лидеры в сфере пользовательского опыта Nielsen Norman Group считают, что для быстрого считывания тяжелых блоков контента больше подойдет F-паттерн.

                                    При такой схеме восприятия пользователь сканирует горизонтальную линию в верхней части страницы, затем спускается ниже и сканирует более короткую горизонтальную линию контента. После считывание осуществляется вниз по вертикали.
                                    Этот паттерн свидетельствует о том, что контент, размещенный в верхней части страницы, обычно привлекает больше внимания, чем содержимое, размещенное дальше по горизонтали.

                                    В некоторых странах Ближнего Востока и Южной Азии читают и пишут справа налево. При дизайне дашбордов для этих стран следует учитывать эти особенности восприятия.
                                      Более подробно тему создания дашбордов мы раскроем в следующей статье. Расскажем о разработке ТЗ для дашборда, прототипировании, методологии D.A.R. (Dashboard, Analysis, Reporting).

                                      Подписывайтесь на наш телеграм-канал, чтобы не пропустить оповещения о выходе новых материалов Qlever Solutions.

                                      Лучшие инструменты для визуализации данных

                                      PIX BI

                                      • Российская система PIX BI
                                        Российская система бизнес-аналитики с адаптивным интерфейсом, гибкими возможностями фильтрации и возможностью создания персонализированных отчетов. Cоздана как альтернатива Qlik Sense, Microsoft Power BI, Tableau.
                                      PIX BI предоставляет широкий набор встроенных визуализаций: линейный график, пузырьковая диаграмма, диаграмма с областями, фильтр, столбчатая диаграмма, изображение, комбо график, круговая диаграмма, каскадная диаграмма, таблица и другие.

                                      Для расширения визуальных возможностей в PIX BI доступна библиотека визуализаций ECharts с более 400 дополнительными визуализациями.

                                      Встраивание таких визуализаций реализуется с помощью блоков JavaScript, которые позволяют кастомизировать дашборды под уникальные бизнес-процессы.

                                      Подробнее о платформе >>

                                      FineBI

                                      • Китайская платформа FineBI
                                        Self-service Business Intelligence платформа с оптимальным соотношением функциональности и ценовой политики от производителя FanRuan. Многие называют FineBI аналогом Tableau, так как платформа заточена под создание визуализации.

                                      FineBI предлагает большое количество визуализаций для различных сценариев. Визуализации разделены на 19 категорий, состоящих их более 50 стилей диаграмм: столбчатые диаграммы, таблицы, круговые диаграммы, графики, географические карты, тепловые карты и т. д., с возможностью настройки динамических и 3D- эффектов.

                                      Доступны функции создания комбинированных диаграмм – соединения нескольких типов чартов в одной визуализации, например, столбчатая диаграмма + график, и добавление нестандартных диаграмм с помощью плагинов из маркета.

                                      Подробнее о платформе >>

                                      Analytic Workspace

                                      • Китайская платформа FineBI
                                        Российская BI-система, предлагающая простой в освоении и интуитивно понятный self-service интерфейс, возможность реализовать самые сложные сценарии анализа данных и широкий выбор красочный визуализаций для разных типов данных.
                                      Платформа предлагает 26 вариантов встроенных визуальных элементов и возможность сформировать собственный виджет с использованием HTML, CSS и JS. Встроенная интеграция с Echarts добавляет 400 дополнительных видов визуализации.

                                      Подробнее о платформе >>

                                      Qlik Sense

                                      Qlik Sense – приложение для самостоятельной визуализации, исследования и мониторинга данных.
                                      Позволяет быстро и легко загружать данные, создавать разнообразные визуализации и проводить глубокий анализ данных.

                                      Подробнее о платформе >>

                                      Microsoft Power BI

                                      Power BI — это набор приложений и онлайн- сервисов для бизнес-аналитики от компании Microsoft, который позволяет пользователям визуализировать данные и создавать интерактивные отчеты.
                                      После приостановки работы вендора с российским рынком доступна только базовая бесплатная версия Power BI с ограниченной функциональностью.

                                      Получите сравнительную таблицу BI-решений

                                      Мы сравнили Power BI, PIX BI, Fine BI, Analytic Workspace и еще одну доступную платформу бизнес-аналитики по основным функциональным критериям, которые сами используем для оценки качества BI.

                                      Таблица поможет вам подобрать замену Power BI в зависимости от ваших задач и отраслевых особенностей бизнеса.

                                      Tableau

                                      Tableau – популярный онлайн-сервис для бизнес-аналитики и визуализации. Разработан для работы с большими объемами данных и предоставляет инструменты для создания отчетов, дашбордов и визуализаций без необходимости глубоких знаний в программировании.
                                      На сегодняшний день Tableau приостановили деятельность в России.
                                      Правильно выбранные визуализации удерживают внимание пользователя, объясняют сложные концепции простым языком и делают факты более запоминающимся, а цвета, формы и стили могут помочь выделить ключевые элементы или группы данных.

                                      Создавайте историю из данных, связав визуальные элементы между собой, ведь интересно читать истории, а не простые подборки фактов.

                                      Qlever Solutions – компания-эксперт в области внедрения корпоративных систем бизнес-аналитики. Более 10 лет мы создаем наглядные дашборды для подразделений маркетинга, продаж, закупок, финансового отдела и топ-менеджмента на базе BI-платформ PIX BI, FineBI, Analytics Workspace, Qlik.

                                      Отраслевой опыт, накопленный нами на протяжении работы над проектами для ритейла, фудритейла, промышленности, строительства, энергетики, помогает нам внедрять инструменты визуализации данных, отвечающие уникальным потребностям бизнеса.

                                      Хотите создать визуализации, которые помогут вам принимать эффективные решения?

                                      Свяжитесь с нами, и мы разработаем эстетичные и наглядные дашборды для детального анализа ключевых KPI вашего бизнеса.