7 советов для эффективной визуализации данных

7 советов для эффективной визуализации данных

Одним из важных аспектов работы в области науки о данных является способность эффективно передавать результаты анализа с помощью разных способов визуализаций.

Данные — это история в числах, а визуализация — это то, как вы рассказываете эту историю.

К сожалению, мы проводим больше времени, изучая свежие методы анализа и библиотеки, знакомясь с новыми наборами данных или трендами в алгоритмах машинного обучения и искусственного интеллекта, а про улучшение навыков визуализации забываем.

Не поймите меня неправильно. Знание новых технологий необходимо для успешной карьеры в сфере науки о данных. Но не менее важно научиться хорошо визуализировать и рассказывать истории.

Представьте: вы часами очищаете, изучаете и моделируете данные. Вы получаете точные и очень важные результаты. Но презентуете их скучно и посредственно. В итоге работа, на которую вы потратили столько сил, остается незамеченной.

Процесс изучения эффективной визуализации данных похож на освоение навыка увлекательного сторителлинга.

Выбор типа диаграммы, цвета и стиля сильно влияет на то, как другие люди воспримут ваши данные.

К счастью, есть простые рекомендации, которые помогут сделать визуализацию убедительной, интересной и привлекающей внимание.

В этой статье представлены 7 простых советов для повышения уровня визуализации на основе научных экспериментов и исследований.

Совет №1: чем проще, тем лучше

Цель визуализации — сделать так, чтобы другие могли легко понять информацию. Поэтому избегайте сложной и перегруженной подачи.

Каждый раз при создании визуализации обращайте внимание на соотношение данных и чернил (англ. data-ink ratio). Этот термин используется для обозначения количества данных по сравнению с избыточными элементами на графике: фоновыми эффектами / цветами и 3D-представлением данных.

Вместо многомерных графиков используйте такие свойства визуализации, как форма, цвет и толщина, чтобы можно было отличить разные наборы данных.

Для простой и эффективной визуализации соотношение данных и чернил должно быть высокое.

Совет №2: выбирайте правильный тип диаграммы

Когда вы создаете график, ориентируйтесь на тип данных. Это поможет выбрать правильную диаграмму и точно представить информацию.

Вот несколько полезных рекомендаций:

  1. Для категориальных данных подойдет гистограмма, если у вас больше 5 категорий, или круговая диаграмма, если категорий меньше 5.
  2. Для номинальных данных подойдет гистограмма, если данные дискретны, или линейная диаграмма / диаграмма с областями, если данные непрерывны.
  3. Если вы хотите показать взаимосвязь между значениями в наборе данных, используйте диаграмму рассеяния, пузырьковую диаграмму или линейную диаграмму.
  4. Для относительного сравнения значений, используйте круговую диаграмму, для точного — гистограммы.

Совет №3: используйте разные диаграммы для визуализации разных аспектов

Перед созданием диаграммы определитесь, что именно вы хотите показать: закономерность или детали? Чтобы это выглядело доступно, старайтесь отображать только один аспект за раз.

Если нужно показать две стороны данных, используйте два разных графика. Например, вы можете сделать линейную диаграмму для отображения деталей и тепловую карту, чтобы показать закономерность в данных.

Чтобы выделить различия и экстремальные значения на линейной диаграмме, используйте разные цвета.

Совет №4: выбирайте корректный диапазон осей

Диапазон ваших вертикальных и горизонтальных осей зависит от типа диаграммы и истории, которую вы рассказываете с ее помощью.

Например, если вы используете гистограмму и показываете только максимальные значения разных наборов данных, оси должны начинаться с 0.

Однако, если вы хотите показать точные числа колебания данных, то необходимо увеличить масштаб осей, чтобы они четко просматривались. Легче увидеть вариации в наборе данных, когда границы графика ближе к диапазону колебаний.

Tip №5: преобразовывайте оси или данные

На решение использовать ли преобразование в вашей визуализации влияет как набор данных, так и цель диаграммы. Вы можете преобразовать два аспекта графика: оси и данные.

Преобразование осей

При построении набора данных можно использовать линейную или логарифмическую шкалу. Логарифмическая шкала часто применяется для отображения процента изменения за период времени, поэтому точки на шкале не расположены через равные промежутки.

Линейная шкала используется для отображения абсолютной разницы между различными уникальными точками вашего набора данных.

Преобразование данных

Людям иногда сложно понять логарифмические шкалы. Чтобы этого избежать, можно преобразовать данные. Например, вместо отображения абсолютных значений вы можете нормализовать их до среднего или определенного значения.

Совет №6: будьте внимательны с точками пересечения на диаграмме рассеяния

Иногда на диаграмме рассеяния два или более круга могут перекрывать друг друга, тем самым усложняя чтение данных. Также это может скрыть фактический размер определенного кластера на графике.

Чтобы избежать этой проблемы и сделать диаграмму рассеяния более понятной, используйте разную степень непрозрачности для ваших кругов. Это поможет четко показать все точки данных.

Еще один вариант — незакрашенные круги. Но для больших наборов данных он может не подойти. Для более четкой визуализации вы также можете изменить размеры кругов.

Совет №7: внимательно выбирайте цветовую схему

Цвета могут сделать график как лучше, так и хуже. Поэтому внимательно отнеситесь к выбору цветовой схемы. В этом вам помогут следующие вопросы.

Виден ли цвет на разных устройствах?

Создав диаграмму на своем устройстве, мы иногда забываем проверить перед презентацией или собранием, как она будет отображаться у других.

Будет ли график четким на компьютере и телефоне? А как насчет освещения? Надо ли использовать высокую яркость экрана, чтобы диаграмма была лучше видна, или на нее это не повлияет?

Что я буду использовать для презентации диаграммы?

Например, если вы создаете диаграммы для печати, то важно учесть тип бумаги. Иногда цвет, четкий на экране, может не отображаться при печати на определенной бумаге.

Старайтесь использовать меньше цветов или родственные цвета. Если вы создаете тепловую карту, вам нужно использовать градиент одного цвета, а не разных. Иначе это может затруднить понимание вашей карты.

Заключение

В большинстве случаев визуализация является лучшим и наиболее легкий способом презентации данных для широкой аудитории. Когда мы создаем диаграммы и рисунки, необходимо делать их простыми, понятными и удобными для чтения.

Помните, что ваши данные рассказывают историю, и ваша визуализация может сделать ее увлекательной или абсолютно неинтересной.

Следуя 7 простым советам, вы сможете быстро улучшить качество вашей визуализации:

Источник

Как визуализировать данные

Как визуализировать данные

Текст – информация, которая усваивается сложно. Таблица – более понятный вид отображения информации. Диаграмма – наглядно, красиво и понятно. Суть визуализации – привести информацию в понятный вид, понятный не только технически грамотному специалисту, но и обычному человеку.

В этой статье мы разберем зачем визуализировать данные, как это делать и каких правил нужно придерживаться, чтобы визуализация была понятной и доступной для восприятия.

Зачем и как использовать визуализацию данных?

Визуальный контент притягивает больше внимания, он лучше запоминается, его проще воспринимать. Это правило лежит в основе визуализации данных. Представьте, что вам нужно привлечь как можно больше внимание к посту в FB. Как вы это сделаете?

  1. Структурированный текст – хорошо
  2. Эмодзи в тексте – еще лучше
  3. Хорошая яркая картинка или инфографика в тему поста – вообще замечательно

По такому же принципу работает и визуализация данных. Сложную таблицу всегда можно свести в красивый и понятный график и затем использовать его для представления продукта, рассказа об аудитории и вообще о любой вещи или явлении.

Визуализация данных решает сразу несколько задач:

  1. Ускоряет восприятие и принятие решения. Разгрести тонну строчек в таблице или посмотреть с десятью столбцами и круговую диаграмму. Что проще? Конечно, графики!
  2. Увеличение вовлеченности. Рассматривать графики гораздо интереснее, чем читать скучные цифры.
  3. Качественное восприятие информации. Грамотная визуализация понятна любому человеку, даже если у него нет специальных знаний аналитика.

Визуализируйте данные всегда: в отчетах, текстах, презентациях, постах – везде. Это улучшит восприятие и увеличит вовлеченность каждого читателя.

Правила качественной визуализации или как подать информацию

Чтобы визуализация работала правильно, выполните 4 правила:

  1. Проверьте информацию
  2. Определите правильные средства отображения информации
  3. Определите аудиторию и постройте графики под ее особенности
  4. Сделайте правильное оформление графиков

Зачем проверять информацию

Фактчекинг – важный момент в работе аналитика или любого человека, работающего с данными. От того, насколько правильно сформирован отчет зависят действия, которые вы или ваши коллеги будут применять.

График должен отражать действительность. Если в нем есть ошибки, вы непременно получите ошибки в работе, которая будет строиться на основе отчетности.

Способы отображения информации: типы диаграмм

Как выбрать подходящий график исходя из типа данных. Источник – Digital Inspiration

Существует много разновидностей графиков и каждый из них подходит под разные цели. Рассмотрим наиболее популярные типы графиков:

1. Линейный график

Показывает динамику роста и спада по одному или нескольких показателям.

Графики удобно использовать для отображения информации о динамике цен, продаж, прибыли или для сравнения значений. Часто используются для визуализации показателей посещаемости страниц.

2. Столбцовая диаграмма

Тоже хорошее решение для демонстрации роста и спада разных показателей. Ниже представлен пример графика изменения сумм в разных кварталах года. Информация наглядная и понятная. Чтобы улучшить подачу над цифрами можно указать значения, например тыс. руб.

Есть отдельная разновидность столбцовых диаграмм – гистограммы. Они похожи на столбцовую диаграмму способом отображения, но используются для других целей.

Таким образом, гистограммы используются для отображения непрерывного интервала, В столбчатой диаграмме каждый столбик отображает отдельную категорию.

3. Круговая диаграмма

Идеальный вариант для демонстрации долей от целого. Примеры: разбивка аудитории по возрастному или половому признаку, источники прибыли, доли посетителей с компьютера, телефона и планшета.

4. Географические диаграммы

Используется для демонстрации распределения показателей по регионам: посещаемость из разных стран, популярность продукта в разных регионах. Можно использовать гео диаграмму по одной стране или по миру.

Пример географической диаграммы из сервиса Google Analytics. Отражает посещаемость из разных регионов

5. Пузырьковая диаграмма

Это линейный график с расширенными возможностями. Вместо точек применяются круги разных размеров, отражающие третье значение. Использовать такую диаграмму можно для отражения зависимостей.

Пример использования – в презентации услуг SEO-агентства: как меняются показатели затрат на рекламу и растет трафик.

Такой график понятный и наглядный. Из примера: трафик растет с течением времени, затраты стремятся к нулю.

Это пять наиболее популярных разновидности графиков. Некоторые из них можно объединять для получения более наглядной демонстрации.

Круговые диаграммы на географической для большей наглядности

Как использовать графики и диаграммы правильно

Есть несколько правил, которые нужно учитывать для грамотной визуализации аналитических данных.

1. Учитывайте интересы аудитории

Графики должны быть понятны и близки аудитории, для которой вы готовите презентацию. Если вы предполагаете, что график может быть непонятен и не найдет отклик, подготовьте аудиторию устным рассказом о том, что вы пытаетесь донести.

2. Не перегружайте графики

Неудачное и правильное отображение информации

Много данных – это хорошо, но далеко не всегда, особенно, когда вы рассказываете о сложном мало осведомленным людям. Упростите информацию и сделайте так, чтобы она легче усваивалась.

3. Не забывайте о наглядности

Сделайте так, чтобы изменения были заметными.

Если изменения незаметны, попробуйте поиграть со шкалой времени или отразите изменения не с нуля, а с текущих значений, масштаб графиков тоже влияет на наглядность.

Как оформлять отчеты

Если вы готовите стандартный отчет, избавьте его от всего лишнего. Не засоряйте график, используйте только важную информацию. Различные украшения отвлекают внимание и не дают сосредоточиться на главном – информации, которая лежит в основе графиков.

Читайте также:  Что такое атрофический тип мазка в гинекологии

Топ-3 сервиса визуализации

Обработка массивов данных – тяжелый труд, особенно если не знать о крутых инструментах визуализации данных и автоматизации этих задач. Есть куча полезных программ, которые позволяют без помощи программиста создавать понятные графики и дашборды под любые цели. Мы определили топ-3 полезных сервиса для этих целей, берите на вооружение, презентуйте информацию правильно и легко.

Google Data Studio

Крутой инструмент от великого и могучего Google. Он бесплатный и достаточно функциональный для решения большинства задач. Позволяет сводить массивы данных в понятные графики.

С какими данными работает

Можно собирать данные более чем из 100 источников, хорошо работает с продуктами Google: Analytics, Ads, таблицы и Яндекса: Метрика и Директ. Можно использовать данные из баз MySQL и рекламных кабинетов Facebook и Instagram.

В чем преимущества

  • Добротная бесплатная версия. Ее хватит для решения задач малого и среднего бизнеса
  • Несложный интерфейс: разберется человек без специальных знаний, знания синтаксиса языков программирование необязательно
  • Можно создавать шаблоны визуализации данных. Это удобно для частичной автоматизации процессов
  • Постоянные обновления. Появляется новый функционал

Какие недостатки

  • Мало типов визуализации данных. Но для решения большинства задач функционала хватает
  • Узкий функционал работы с вычисляемыми полями. У следующих программ такой функционал шире
  • Сервис хорош для представителей малого и среднего бизнеса, когда нужно собирать простые графики для презентаций

Power BI

Продукт для работы с массивами данных от Microsoft. Под названием Power BI объединяется несколько сервисов. Один из продуктов позволяет сводить данные в графики для упрощения анализа.

Есть бесплатная и корпоративная версия стоимостью 9.99 $/мес.

С какими данными можно работать

Информацию можно подтягивать из разных источников: популярных баз данных, Google, различных интернет-источников, в том числе из рекламных кабинетов социальных сетей.

Преимущества Power BI

  • Удобно работать с продуктами Microsoft. Хорошо интегрируется с Excel. Azure Cloud Service, SQL Server
  • Есть много шаблонов для красивой визуализации баз данных
  • Есть облачный и десктопный интерфейсы. Можно работать на разных компьютерах: дома и в офисе
  • Можно интегрировать в собственные приложения и продукты от сторонних разработчиков
  • Возможности предоставления отчетов по ссылке и в файле

Недостатки

  • Плохо воспринимает данные из Google Analytics и Яндекс.Метрики. Проблему помогают решить коннекторы от сторонних разработчиков
  • Мало инструментария для обработки и очистки данных
  • Сервис особенно удобен для пользователей, работающих на устройствах с ОС Windows

Tableau

Крупный сервис для аналитики и визуализации данных. В нем предусмотрен широкий функционал для визуализации любых данных в разных форматах.

С какими данными работает

Можно использовать данные из самых разных источников. Сервис работает с десятками платформ, популярными форматами файлов и базами данных.

Преимущества Tableau

  • Можно сводить данные из разных источников в единые графики
  • Можно работать в команде. Несколько сотрудников могут смотреть и корректировать отчеты
  • Разные способы передачи отчетов. Можно поделиться ссылкой, отправить отчет по почте в файле
  • Широкий выбор шаблонов. Разные способы отображения данных

Недостатки

  • Нет бесплатной версии. Оплачивается по количеству пользователей раз в месяц
  • Для интеграции в работу нужна поддержка IT-специалиста
  • Сервис удобен, когда нужно собрать данные с разных источников и быстро объединить их в один отчет. Полезен для командной работы

Выводы

Визуализация данных делает жизнь специалистов проще, главное правильно подавать информацию:

  1. Проверьте информацию перед построением графиков
  2. Выбирайте правильные диаграммы и не забывайте о смысловой нагрузке каждого элемента данных
  3. Подстраивайте визуализацию под аудиторию, иначе информация будет воспринята неправильно
  4. Соблюдайте эргономику. Не переусердствуйте с оформлением
  5. Выберите удобный инструмент визуализации с нужным функционалом

Чтобы строить графики и визуализировать данные, их нужно откуда-то брать и где-то хранить. Соберите все в одном месте, используйте CRM.

Если вы хотите знать, как CRM-система поможет в работе с данными, пишите онлайн-консультанту на сайте.

Ваши оценки помогают сделать блог еще лучше и информативнее.

Вы можете ознакомиться с другими статьями по этой теме ↓ и подписаться на рассылку о новых статьях (спамить не будем, обещаем:)

Источник

Визуализация данных: основные правила, полезные приемы и инструменты

Когда стандартные таблицы в Excel не раскрывают полную картину и нет возможности привлечь к созданию отчетов аналитиков, на помощь приходят сервисы и инструменты для визуализации данных.

В этой статье мы расскажем, зачем визуализировать данные и как правильно это делать, какие инструменты можно использовать для создания интерактивных дашбордов без помощи разработчиков и как выбрать тот, который подойдет именно вам.

Содержание

  • Зачем визуализировать данные
  • Правила успешной визуализации
  • Сравнение инструментов для построения отчетов
  • OWOX BI Smart Data
  • Google Data Studio
  • Google Sheets

Зачем визуализировать данные

Если вы хотите, чтобы ваш пост в Facebook прочитало как можно больше людей, что вы сделаете? Правильно, добавите интересную картинку или фото. Этот прием прекрасно работает и с отчетами. Информация в графическом виде привлекает больше внимания, легче воспринимается и помогает быстрее донести до аудитории ваше сообщение. С помощью наглядных графиков и дашбордов можно сделать понятными даже сложные наборы данных.

Почему так происходит? Потому что большинство людей в мире — визуалы. И если вы хотите, чтобы большая часть ваших партнеров, коллег или клиентов могли взаимодействовать с вашими данными, нужно превратить скучные таблицы в красивые и динамичные графики.

Вот несколько интересных цифр, полученных в результате различных исследований, которые подтверждают важность визуализации:

    об окружающей среде человек получает с помощью глаз.
  • 50% нейронов мозга участвуют в обработке визуальной информации.
  • Наличие картинок на 80% повышает желание прочесть текст.
  • Человек запоминает 10% того, что услышал, 20% того, что прочитал, и 80% того, что увидел.
  • Если в инструкции к лекарству нет иллюстраций, человек усвоит 70% информации. Если добавить туда картинки, то цифра увеличится до 95%.

Если список показался вам скучным, есть инфографика, которая описывает эти же факты, но в более веселом и наглядном формате 😉

Грамотная визуализация данных принесет вашему бизнесу ряд преимуществ:

  • Скорость принятия решений. Проще и быстрее сделать вывод, глядя на график, где один из столбцов или одна из точек взаимодействия находится намного выше всех остальных, чем пролистать несколько страниц статистики в Google Sheets либо Excel.
  • Больше привлеченной аудитории. Как мы уже говорили, большинство людей лучше воспринимает и запоминает зрительную информацию.
  • Высокая вовлеченность читателей. Красивый яркий график с понятным посылом привлечет к себе внимание ваших читателей.
  • Лучшее понимание данных. Идеальные отчеты понятны не только технических специалистам, аналитикам и Data Scientists, но и маркетинг-директору или SEO и позволяют каждому сотруднику принимать решения в своей зоне ответственности.

Правила успешной визуализации

Первое, что нужно сделать перед созданием графика — проверить данные на точность и корректность. К примеру, если у вас коэффициент конверсии где-то равен 300%, а в среднем он обычно составляет 50-70%, проверьте, откуда взялось такое число. Возможно, это было поле total и у вас суммировались все данные. Возможно, это какой-то выброс, который нужно удалить с визуализации, иначе этот скачок поломает всю картину — 300% нивелируют разницу между 50% и 70%. Из-за такого выброса в отчете вы можете ошибиться и принять неверное решение.

В обычной жизни мы привыкли к тому, что правильное сообщение нужно донести до правильного человека в правильное время. При визуализации данных есть три похожих правила:

  1. Нужно выбрать правильный график в зависимости от того, какая у вас цель.
  2. Убедиться, что посыл вашего графика подходит аудитории.
  3. Оформить график в правильном дизайне.

Если вы сделали своевременное сообщение, но график не отображает динамику, у него неправильный посыл либо сложный дизайн, то результата, на который вы рассчитывали, не получится.

Какие бывают диаграммы и как их выбирать

Если график выбран неудачно, человек, который его смотрит, может запутаться либо ошибочно интерпретировать данные. Поэтому перед созданием отчета важно определиться, какие данные вы хотите визуализировать и с какой целью:

  • Сравнить разные показатели.
  • Показать распределение данных. Например, какие показатели встречаются чаще, а какие реже.
  • Показать структуру чего-либо с помощью данных.
  • Проследить взаимосвязь между показателями.

Давайте рассмотрим самые популярные виды графиков и разберемся, для каких целей они подходят.

1. Линейный график (Line Chart)

Линейный график отображает динамику по одному или нескольким показателям. Его удобно использовать, чтобы сравнить, как меняются со временем разные наборы данных. Например, посмотреть статистику посещений трех посадочных страниц.

2. Столбиковая диаграмма (Bar Chart)

Еще одна диаграмма, которая идеально подходит для сравнения нескольких наборов данных. Горизонтальные столбиковые диаграммы обычно используют, когда нужно сравнить большое количество показателей или визуально выделить явное превосходство одного из них. А вертикальные столбцы хорошо иллюстрируют, как менялись показатели в разные периоды, например, ежегодная прибыль компании за несколько лет.

3. Гистограмма (Histogram)

Гистограмму часто путают со столбиковой диаграммой из-за визуального сходства, но все же у этих графиков разные цели. Гистограмма показывает, как распределяются данные в рамках непрерывного интервала или определенного периода времени. На вертикальной оси этого графика находится частотность, а на горизонтальной — интервалы или временной период.

Столбиковая диаграмма в отличие от гистограммы, не связана с непрерывным интервалом — здесь каждый столбик означает отдельную категорию. Например, показать количество покупок в разные годы удобнее с помощью столбиковой диаграммы. Если же вы хотите узнать, в пределах какой суммы (от $10 — $100, $101 — $200, 201 — 300 и т.д.) совершается больше всего покупок, лучше выбрать гистограмму.

4. Круговая диаграмма (Pie Chart)

Круговая диаграмма показывает долю каждого значения внутри множества. Её используют, чтобы показать структуру какого-нибудь набора данных — из чего он состоит. Например, какой процент от общих продаж приносит каждая категория товаров.

5. График рассеяния или точечная диаграмма (Scatterplot)

График рассеяния помогает найти взаимосвязь между двумя показателями. Например, с его помощью можно узнать, как меняется коэффициент конверсии в зависимости от размера скидки на товар.

6. Пузырьковая диаграмма (Bubble Chart)

Интересный график, который позволяет сравнить два параметра по третьему. Возьмем коэффициент конверсии и размер скидки из предыдущего примера, добавим к ним доход (за который отвечает размер круга) и получим примерно такую диаграмму.

Глядя на этот график, легко заметить, что самая высокая конверсия у товаров со скидкой 30%, однако больше всего дохода приносят товары без скидки и товары со скидкой 5%.

8. Географическая диаграмма (Geo Chart)

С географической диаграммой все просто — ее используют, когда хотят увидеть, распределение определенного показателя по регионам, странам, материкам.

Мы перечислили одни из самых популярных диаграмм, но далеко не все. Посмотреть остальные типы графиков вы можете в «Каталоге визуализации данных». Также рекомендуем вам удобную схему, которая поможет правильно выбрать график, подходящий для ваших целей.

Правильное использование графиков и диаграмм

Второй важный момент, который необходимо учитывать при визуализации данных — это правильный месседж и выбор аудитории. Вашим читателям должны быть близки и понятны данные, о которых вы хотите рассказать в отчете.

Читайте также:  Краснодар впервые за три года обыграл Ростов в РПЛ

Перед вами график, который в 2016 году был отмечен престижной премией Data Journalism Award. Для человека, незнакомого с предысторией, график выглядит, как рисунок трехлетнего ребенка. Однако, стоит узнать о нем чуть больше — и становится понятно, что его авторы проделали огромную работу.

Чарльз Сейф и Питер Олхоуз, редакторы Buzzfeed News, с помощью языка R визуализировали данные о полетах, которые совершают агенты FBI и DHS для воздушного наблюдения. Конкретно на этом графике изображены полеты над домом и мечетью преступников, которые устроили стрельбу в Сан-Бернардино в декабре 2015 года.

При выборе параметров, которые вы хотите визуализировать на одном графике, нужно убедиться, что их действительно можно сочетать. Бывает так, что связь данных, которые на первый взгляд идеально коррелируют друг с другом, совершенно лишена логики. Вот пример такого графика с ошибочной корреляцией. Он показывает, что число утонувших в бассейне тесно связано с количеством фильмов, в которых снимался Николас Кейдж.

Следующие вещи, на которые стоит обратить внимание при создании графика — это правильные шкала и масштаб. Люди привыкли, что отсчет на осях координат начинается снизу вверх и слева направо. Если вы измените порядок отсчета, это может ввести в заблуждение не внимательную аудиторию. Стоит оговориться, что обратная шкала допустима, если вы используете ее в качестве тактического приема, как в этом примере:

При первом взгляде на этот график может показаться, что количество убийств с применением огнестрельного оружия с годами падает. На самом деле все наоборот, так как отсчет на шкале идет сверху вниз. Вероятно, автор графика сделал это специально, чтобы снизить негативное впечатление от данных, представленных в отчете.

Правильно подобранный масштаб также сделает ваш график более наглядным и понятным. Если в отчете показаны очень близкие между собой показатели и в классическом масштабе вы не видите динамику и разницу, попробуйте изменить масштаб. Начните отсчет не с нуля, разбейте шкалу на более мелкие единицы — и картина сразу прояснится.

Прежде, чем отдать отчет конечным пользователям, позаботьтесь о том, чтобы график работал быстро. Медленная работа убьет все ваши труды. К примеру, если вы визуализируете данные в Google Sheets, скорее всего, параметры хранятся на этом же листе или на соседнем и не подтягиваются из третьего источника. Если же вы делаете отчет в Data Studio, то данные вы будете откуда-то импортировать. В таком случае нужно позаботиться о доступности этого ресурса и о скорости передачи данных. Иначе вы увидите некрасивую картинку, когда макеты графиков есть, а данные не подгрузились.

Правильный дизайн отчетов

В дизайне ваших диаграмм всегда придерживайтесь принципа простоты. Если вам нужно подготовить какой-нибудь стандартный отчет, не стоит изобретать велосипед или заниматься «украшательством». Избегайте лишних элементов, которые только засоряют график: обилие разных цветов и структур, 3D-объем, тени, градиент и т.д.

Поверьте, чем проще график, тем лучше воспринимается информация, которую вы хотели донести.

Не делайте визуализацию слишком мелкой, не накладывайте все графики на одну страницу дашборда. Использовать на одном слайде либо на одной странице дашборда более трех видов графиков считается дурным тоном. Если вам действительно нужно столько типов графиков, разместите их на разных страницах — так их будет легче воспринимать.

Не бойтесь экспериментировать. Если у вас нетипичная задача, вполне возможно, что решение тоже будет нетипичным. На инфографике ниже мы видим траекторию движения крыльев разных животных. Здесь динамическая визуализация вполне уместна.

Давайте разберемся, какие есть инструменты для визуализации данных и как выбрать тот, который подойдет вам.

Сравнение инструментов для построения отчетов

Сейчас на рынке есть очень много инструментов для визуализации. Некоторые из них платные, некоторые нет. Одни работают в онлайне, другие можно установить на десктоп и работать в онлайне, а третьи только офлайновые. Мы сделали список из 10 инструментов, которые чаще остальных встречаются вместе со словами «визуализация данных»: ​

До пятого пункта — это инструменты и сервисы крупных корпораций, которые специализируются на визуализации данных. После шестой строчки мы разместили достаточно интересные инструменты, преимущественно бесплатные и онлайновые. В них можно увидеть нестандартные виды визуализации и, возможно, найти новый подход к вашим данным.

Чем руководствоваться при выборе инструмента для создания отчетов?

  • Отталкивайтесь от тех задач, которые вы хотите решить. К примеру, сейчас основной тренд на рынке — это возможность смотреть отчеты в динамике. Если инструмент не умеет работать с динамическими отчетами, это может сыграть не в его пользу.
  • Учитывайте сумму, которую вы готовы за это заплатить. Если у вас достаточно большая команда и каждый сотрудник должен работать с инструментом визуализации, то стоимость подписки на одного человека может стать стоп-фактором.
  • Продумайте, кто и как будет пользоваться инструментом: динамически или нет, возможно ли групповое редактирование. Насколько легко начать работу, понятный ли интерфейс. Есть ли возможность создать отчет без знания языков программирования. К примеру, R Studio — классный сервис особенно для поиска трендов, построения модели атрибуции, модели корреляции. Однако, если вы не знаете язык программирования, не умеете подключать специфические библиотеки, то есть не являетесь техническим специалистом, вам будет сложно начать работу с этим инструментом.

Мы выбрали пятерку сервисов и подготовили сравнительную таблицу с плюсами, минусами и основными характеристиками. Прежде чем к ней перейти, поясним чем отличаются строчки «Динамика в отображении данных» и «Динамические отчеты».

Под динамическими отчетами мы имели в виду способность подгружать данные из различных источников на лету. Например, у Google Data Studio нет динамического отчета. Допустим, мы подключили к Data Studio запрос из Google BigQuery, а затем в запросе что-то поменяли. Чтобы эти изменения отразились в отчете, нужно как минимум обновить страницу в Data Studio. Однако, если мы в Google BigQuery добавили или удалили какое-то поле (не просто поменяли логику расчета, а изменили структуру таблицы) то Data Studio закроет отчет с ошибкой. Его придется переделывать.

Динамика в отображении данных — это возможность, к примеру, посмотреть в рамках одного сеанса сводную статистику за разные даты. Как в Google Analytics: вы меняете временной интервал, и у вас подгружается статистика за нужные даты.

Ключевые характеристики ТОП-5 инструментов визуализации

Мы хотим подробнее остановится на трех инструментах, которые активно используем в OWOX BI. Это Google Data Studio, Google Sheets и OWOX BI Smart Data.

Источник

Что такое визуализация данных и как ее применять?

Информация усваивается лучше, если ее подать в виде схем, графиков и диаграмм. Сейчас визуализация данных является одним из важнейших инструментов и упрощает наше понимание объемных данных в век информационных технологий.

Что такое визуализация данных?

Визуализация данных — это то, что превращает большие и маленькие данные в вижуал, который человеческому мозгу легче понять и обработать.

Идея использования изображений для понимания данных существовала давно — от карт и графиков в 17 веке до изобретения круговой диаграммы в начале 1800-х годов.

Один из самых ярких примеров статистической графики —карта вторжения Наполеона в Россию Чарльза Минарда. На ней были показаны размеры армии, а также путь отступления Наполеона из Москвы: эта информация была привязана к температурным и временным шкалам для более глубокого понимания события.

Современные компьютеры обрабатывают большие объемы данных с молниеносной скоростью. Сегодня визуализация данных превратилась в быстро развивающееся сочетание науки и искусства, которое будет в тренде в обозримом будущем.

Зачем визуализировать?

Согласно недавнему исследованию Microsoft, средняя продолжительность концентрации внимания человека 8 секунд, что, кстати, на секунду меньше, чем средняя продолжительность концентрации внимания у рыбы.

Люди реагируют на визуальные эффекты лучше, чем на любой другой тип стимуляции. Человеческий мозг обрабатывает визуальную информацию в 60 тыс. раз быстрее, чем текст. Зрительные данные составляют 90% информации, передаваемой в мозг.

Визуализация данных используется во всех отраслях: она является важным шагом в аналитике данных, дает компаниям возможность критически оценить информацию и запросы аудитории.

Какой бывает визуализация?

Раньше самым простым и распространенным способом создания визуализации данных была информация из электронной таблицы Excel и преобразование ее в гистограмму, круговую диаграмму или таблицу.

Этот метод по-прежнему чрезвычайно эффективен, но искусство визуализации данных также прошло долгий путь за последние 20 с лишним лет. Существует множество инструментов, помогающих c визуализацией данных. Диаграммы и графики упрощают понимание результатов, даже если вы можете определить закономерности без них.

Графики

График показывает изменения во времени. Ось X обычно представляет собой период времени, а ось Y — количество.

Гистограмма

Гистограмма также показывает изменения во времени. Но если существует более одной переменной, гистограмма может упростить сравнение данных для каждой переменной.

Пузырьковая диаграмма

Пузырьковая диаграмма изображается в виде пузырька и является адаптацией точечной диаграммы.

Круговая диаграмма

Круговая диаграмма показывает каждый элемент как часть целого и является лучшим вариантом для иллюстрации процентов.

Карта

Карта помогает понимать локальность предмета исследования. Ведь большинство данных содержат элемент местоположения.

Инфографика

Инфографика требует обширного набора информации и дает исчерпывающее визуальное представление. Она отлично подходит для изучения сложных и очень субъективных тем.

Примеры визуализации данных

Альберто Каиро — один из лучших дата-журналистов — сказал, что визуализация данных является наиболее эффективным способом в предоставлении информации во время пандемии.

Вспомним карту, составленную Университетом Джона Хопкинса про распространение COVID-19.

Пример хорошей инфографики — анализ развития Казахстана с 1991 по 2021 год. Визуализация дает отчетливо понять, в какой сфере наблюдается спад, а в какой — прогресс.

Эта карта мира создана с помощью инструмента Blueshift для визуализации торговли глобальными товарами, такими как продукты питания и одежда. Точки «исходят» из одной страны и переходят в другие, показывая, на каких товарах эта страна специализируется, а что другие страны покупает у нее. При нажатии на отдельные страны отображается их экспорт и импорт.

Гистограммы бывают разные. Один из наглядных примеров —миграция. Мы можем увидеть, что большинство трудовых мигрантов в России родом из Узбекистана. Из Таджикистана приезжает почти в два раза меньше мигрантов, следом за ним — мигранты из Кыргызстана. Меньше всего мигрантов — из Казахстана.

Бесплатные инструменты визуализации данных

Инструменты визуализации данных могут помочь вам превратить данные во что-то мощное и красивое.

Tableau — пользователь легко может загрузить данные, составление карт — одна из самых сильных сторон этого приложения.

Infogram — очень удобный и легкий интерфейс. Он позволяет создать инфографику за считанные минуты. В наличии 31 вид эффектных диаграмм, включая радиальные, точечные, пузырьковые диаграммы и карты.

Plotly — создает графики, диаграммы, презентаций, датасеты и уникальные дашборды. Есть платная и бесплатная версии.

Datawrapper — удобный и быстрый способ визуализировать данные в виде графиков и таблиц.

Google Data Studio — позволяет подключать данные в реальном времени. Бесплатная платформа для визуализации данных.

Существует также еще один инструмент, позволяющий создать визуализацию данных, включая разные виды диаграмм, гисторгамм и таблиц. Этим инструментом пользуются 90% компаний.

Что такое PowerBI и зачем он нам нужен?

PowerBI (Power Business Intelligence) — это программа, с помощью которой можно собрать в одном месте данные из разных источников —Excel, csv, SQL, Google Analytics, а также создать модель данных, проанализировать их и применить интерактивный дашборд из сотен вариантов визуализаций. PowerBI пришел на смену Excel.

Читайте также:  Примечание Почему именно квадраты разностей

Одной из тех, кто основал сообщество BI-аналитиков и регулярно проводит курсы PowerBI является — Екатерина Рехерт. Она основала компанию Databoom. kz и она с командой помогает новичкам освоить сферу анализа данных.

работа ученицы Екатерины Рехерт, Елены Афонины

Зачем нужен PowerBI?

Екатерина рассказывает, что PowerBI делает то же самое, что Excel, но гораздо быстрее в несколько кликов. Любой человек может за короткое время с нуля освоить этот инструмент и приобрести востребованный на рынке навык Business Intelligence-аналитики.

PowerBI состоит из трех компонентов:

1. Редактор PowerQuery — «кухня» PowerBI
2. Модель данных и формулы DAX — data analytics expressions — «сердце» PowerBI
3. Визуализации PowerBI

PowerBI — это не только про то, как строить графики. Ведь 80% времени работы уходит на очистку данных в PowerQuery и моделирование с помощью DAX.

Как можно изучить PowerBI и сколько потом можно на этом заработать?

Можно освоить этот инструмент самостоятельно с помощью бесплатных онлайн курсов и документации или присоединиться к казахстанскому сообществу BI-аналитиков и пройти бесплатные воркшопы, которые проводятся регулярно, а также получить доступ к чату сообщества, где можно задать любой вопрос.

По словам Екатерины, топовые компании во всех сферах — Beeline, Mars, «КазМунайГаз», Toyota, AirAstana, «Евразийский банк», Kimberly Clark, Kolesa Group, Национальный банк Казахстана, «Самрук-Казына» уже внедрили Power BI.

По данным Kolesa Group, средняя зарплата казахстанских специалистов BI-аналитиков 480 тыс. тг.

Источник



Визуализация данных и выводов исследования

Интерпретация полученных в диагностике данных — самоцен­ный и особенно спорный этап. Это связано с трудностями при отбо­ре и обосновании критериев оценки, выборе методик статистиче­ской обработки данных, учете личностной обусловленности оценок.

В связи с этим требуется отдельное рассмотрение вопроса интерпре­тации диагностических данных. Первый шаг на этом пути — визу­ализация полученных данных, их графическое представление.

Визуализация данных исследования.Нередко в научной работе графическое представление данных исследования позволяет обой­тись в их анализе без трудоемкой и длительной статистической обработки. Выводы при этом представляются лаконичными и уни­версальными для понимания. К основным способам визуализации данных относятся таблицы, рисунки, фотографии, схемы, гра­фы, диаграммы, графики.

Таблица это такой способ представления данных, когда циф­ровой или текстовый материал распределяется по столбцам (ко­лонкам, графам) и строкам. Таблицы используются для приведе­ния данных в определенную систему, когда требуется их сопо­ставление. При этом, как правило, в каждой строке помещаются данные об одном испытуемом (или случае), а по столбцам — зна­чения переменных (параметров, факторов).

Аналитические таблицы представляют собой результат обработки и анализа показателей. Обычно на их основе делают обобщающий вывод, в котором устанавливается и формулируется определен­ная закономерность. В неаналитических таблицах приводятся не­обработанные диагностические данные, на основании которых не делается никаких выводов. Это информативный и иллюстратив­ный материал.

В таблицах необходимо представить данные для последующей их обработки в табличном процессоре Ехсе1 или других компью­терных программах обработки данных.

В состав таблицы входят порядковый номер и тематический заголовок (название), боковик (перечень параметров, размещае­мых по горизонтали), заголовки столбцов (головки) и сами стро­ки и столбцы (горизонтальные и вертикальные графы). Образец оформления таблицы представлен на рис. 9.

Название таблицы

Головка Заголовок столбцов Заголовок столбцов
Подзаголовок столбца Подзаголовок столбца Подзаголовок столбца Подзаголовок столбца
Боковик Столбцы

Рис. 9. Образец оформления таблицы

Поскольку таблицы часто используют для различного рода от­четности (в том числе для отчетов по итогам диагностики), сфор­мулируем основные требования к оформлению таблицы.

1. Название таблицы, заголовки столбцов в ней должны быть максимально краткими и точно отражать ее содержание. В заго­ловках столбцов не повторяются общее название таблицы или названия ее отдельных частей. Единицы измерения параметров вносят в название таблицы или столбцы.

2. Боковик таблицы также должен быть предельно лаконичным, повторяющиеся слова нужно выносить в объединяющие рубрики, общие для всех заголовков слова помещают в заголовок над боко­виком. В конце заголовков знаки препинания не ставятся.

3. Основные заголовки внутри таблицы пишутся с прописной буквы, подчиненные — со строчной, если образуют единое целое предложение с основным заголовком, или с прописной, если имеют самостоятельное значение. Параметры по столбцам назы­ваются в единственном числе («Фамилия, имя учащегося» или «Оценка»).

4. Все таблицы должны иметь сквозную нумерацию арабскими цифрами. Над правым верхним углом таблицы помещается над­пись «Таблица» с указанием порядкового номера (например, «Таб­лица 7». Знак номера и точка после цифры не ставятся. Если в тексте имеется только одна таблица, то она не нумеруется и слово «таблица» не пишется. •’

5. При переносе таблицы на следующую страницу головка таб­лицы воспроизводится, а над ней помещается надпись «Продол­жение таблицы 7». Если головка громоздкая, то столбцы нумеру­ются и на следующих страницах повторяется их нумерация. Заго­ловок таблицы не воспроизводится.

6. Шрифт текста таблицы, как правило, меньше шрифта ос­новного текста на 2 пункта (пт), а шрифт головки — на 2 пт меньше шрифта текста таблицы. При оформлении головки исполь­зуется только прямое светлое начертание шрифта, текст распола­гается по центру столбца. Для названия таблицы используют фор­мулировки, имеющиеся в основном тексте или в заголовках его частей, но полужирного начертания.

Использование таблиц целесообразно в случае большого мас­сива текстовых и цифровых данных, которые нуждаются в клас­сификации и наглядном сопоставлении.

Рисунки используются для иллюстрации идей, положений, выводов, воссоздания образов. Они (в отличие от таблиц) подпи­сываются внизу: «Рис.2. Название рисунка или фотографии». В подпись часто входит экспликация: детали иллюстрации нуме­руются, а в подписи они поясняются текстом. При этом применя­ется шрифт на 2 пт меньше шрифта основного текста, подпись располагается по центру иллюстрации, нумерация сквозная для

всех иллюстраций. В тексте делаются ссылки на иллюстративный материал с указанием его порядкового номера, например «(рис. 2)» или «как видно на рис. 2». Эти же правила распространяются и на другие иллюстративные средства.

Фотографии применяются тогда, когда требуется отобразить объект с документальной точностью или его индивидуальными особенностями. При этом они должны быть технически воспроиз­водимы средствами копирования, поясняться в подписях и тек­сте.

Схема это изображение, выполненное с помощью условных обозначений и без соблюдения масштаба. Она предназначена для наиболее емкого и наглядного выражения идеи, соподчиненно-сти понятий. Фактически схема представляет модель изучаемого объекта, его структуры, взаимосвязей и взаимозависимостей. В блок-схемах для простоты элементы изображают прямоугольниками и другими геометрическими фигурами, а их связи — простыми ли­ниями. По функциям схемы подразделяются на логические, по­следовательные, локальные, сущностные и технические.

При оформлении схемы используемые геометрические знаки подбираются в зависимости от их количества и поля чертежа; они могут быть разными по форме, но близкими по размерам; для изображения основных и вспомогательных элементов, их связей используются линии одинаковой толщины; звенья располагаются по возможности симметрично.

Графы (от греч. %гарко — пишу) являются разновидностью блок-схем и представляют собой расположенные на плоскости геомет­рические конструкции, которые состоят из вершин, соединен­ных определенным образом ориентированными линиями, и вос­производят изучаемый процесс или явление. С помощью графов можно изобразить связи между свойствами и качествами, описать связи между отдельными составляющими процесса, выделить ряд особо важных в логическом плане компонентов системы, имею­щих наибольшее число связей с другими компонентами.

Диаграмма (от греч. сИа§гатта — изображение, рисунок, чер­теж) — графическое изображение, наглядно показывающее соот­ношение каких-либо величин. Диаграмма используется для облег­чения сравнений (сопоставлений), выявления закономерностей и тенденций данных. Она помогает увидеть динамику процесса.

По форме построения диаграммы бывают линейные, плоско­стные и объемные; столбчатые (ленточные) и круговые (сектор­ные); простые и составные.

В многочисленных компьютерных программах имеется возмож­ность выбора из нескольких типов диаграмм и графиков, причем каждый тип имеет несколько разновидностей (видов). К примеру, Мкюзо/1 Ехсе1 позволяет выбрать один из 14 основных (стандарт­ных) типов диаграмм (графиков) и 20 дополнительных (нестан-

дартных) типов диаграмм. Внутри каждого из основных типов диаграмм можно выбрать конкретный подтип. Правильный выбор типа диаграммы (графика) дает возможность представить данные наглядным образом.

Круговая (секторная) диаграмма представляет собой круг, раз­деленный на секторы, величина которых пропорциональна вели­чине частей отображаемого объекта или явления. По такой диа­грамме можно выявить соотношение компонентов внутри одного целого, но она не дает возможности проследить динамику изме­нения величин и их соотношений. К тому же наглядность круго­вой диаграммы снижается при возрастании количества сравнива­емых величин и небольшом их различии.

Столбчатая (ленточная) диаграмма (гистограмма) представля­ет собой ряд расположенных на одинаковом расстоянии друг за другом прямоугольников одинаковой ширины. Такие прямоуголь­ники располагаются вертикально (столбики) или горизонтально (ленточки). Высота (или длина) прямоугольников пропорциональ­на изображаемым ими величинам. Ширина прямоугольников за­висит от их количества и рабочего поля чертежа.

Ярусная (или составная) гистограмма позволяет проследить ди­намику распределения составляющих. При этом есть возможность сравнивать только изменения соотношения, когда соседние стол­бики остаются одинаковой высоты, принимаемой за 100%, а со­ставляющие их прямоугольники пропорциональны относительной величине компонента в составе целого (рис. 10). Можно также срав­нивать одновременно изменение абсолютных величин компонен­тов и целого (рис. 11).

Как правило, такие гистограммы менее информативны. Это можно видеть из сравнения рис. 10 и 11.

Изобразительные диаграммы являются иллюстративно-инфор­мационным изображением, в них простые геометрические фигу­ры заменяются символами, воспроизводящими образ предмета. Они могут быть следующих видов:

— в качестве графических знаков служат символы сравнивае­мых параметров, различающиеся по величине;

— символы-знаки помещены внутри столбиков, полос или сек­торов, причем прямоугольники или секторы вписываются точно по масштабу, а символы не меняют своей величины;

— соблюдается и масштабность, и изобразительность, а в зоне рисунка вычерчивается ломаная линия, соединяющая показатели;

— показатели оформляются не точками, а кружочками со впи­санными числовыми значениями и соединяются не линиями, а широкими полосами;

— диаграммы могут содержать цветовые выделения.

Графики (от греч. §гарЫкоз — начертанный) — условное изобра­жение характера зависимости одной величины от другой или дина­мики изменения величины. Кривая на графике может быть лома­ной или сглаженной в зависимости от требований наглядности.

График включает в себя заголовок, словесное пояснение ус­ловных знаков и значения отдельных элементов графического об­раза, оси координат, шкалу с масштабом, числовые сетки и чис­ловые данные, дополняющие или уточняющие величину нане­сенных на график показателей.

Координатные оси вычерчиваются сплошными линиями без стрелок на концах. Если это необходимо для повышения нагляд­ности, оси дополняются координатной сеткой, соответствующей выбранному масштабу. Числовые значения штрихов, как прави­ло, пишут за пределами графика (левее вертикальной оси и ниже горизонтальной), избегая дробных величин. При этом значения можно откладывать не с нуля, а в пределах рассматриваемой за­висимости. Независимую переменную откладывают по горизон­тальной оси. Масштаб каждой оси может быть разным.

По координатным осям указывают условные обозначения и раз­мерности отложенных величин в принятых сокращениях. На гра­фике используются только принятые в тексте условные обозначе­ния, аббревиатуры и сокращения. Надписи, относящиеся к кри­вым и точкам, должны быть краткими и немногочисленными. Все обозначения на графике обязательно комментируются в тексте.

Источник