что такое графическая диаграмма дополнительных примеров
Как визуализировать данные: типы графиков
Редактор Наталия Шергина специально для блога Нетологии адаптировала статью об эффективных способах визуализации данных.
Предположим, вы понимаете важность визуального представления данных, знаете, какие навыки для этого нужны и, более того, обладаете ими. Заодно представим, что у вас есть данные для визуализации, осталось только разобраться, какие виды графиков и диаграмм подойдут. В статье мы расскажем о самых эффективных способах визуализации данных — вам будет из чего выбрать.
Столбчатая диаграмма (Bar Graph)
Скорее всего, это был первый способ визуализации, с которым вы столкнулись. Вспомните школьные учебники, таких диаграмм там было много. Если вы думали, что столбчатые диаграммы вместе со школой остались позади — не спешите с ними прощаться. Многие виды данных удобно представлять с их помощью: информацию о пробках на дороге, увеличение клиентской базы, график продаж. Столбчатые диаграммы — один из самых наглядных видов представления статистики.
Линейная диаграмма (Line Chart)
Этот вид графиков напоминает вершины горного хребта, и это сравнение неслучайно. С помощью линейных диаграмм можно графически представить горы данных и извлечь столько же инсайтов. Подходят для представления колебаний акций, темпа роста компании, построения прибыльной системы.
Гистограмма с несколькими осями (Multi-Axis Charts)
Это сочетание столбчатой диаграммы и линейного графика. Подойдёт, если нужно представить два или более фактора для выявления параллелей или сравнения. Гистограммы с осями часто используют на заседании членов советов компании, чтобы сопоставить, например, рыночную цену и общую выручку.
Гистограмма (Bar Histograms)
Ещё один график из школьных учебников. Гистограммы используют для представления числовых данных одной категории и их изменения с течением времени. Пример — изменение численности населения страны за конкретный период.
Как и столбчатые диаграммы, гистограммы состоят из столбцов. Поэтому эти два вида графиков часто путают. Давайте разбираться.
Круговая диаграмма (Pie Charts)
Кто работал с Экселем, тот наверняка знаком с круговыми диаграммами. Поставил её — и отчёт сразу выглядит презентабельнее, так? А если серьёзно, то круговые диаграммы — это отличный способ представить части одного целого. Например, долю компании на рынке, ваш вклад в общий проект или разработку секторов для инвестиционного плана.
Каждому из нас приходилось работать хотя бы с одной из перечисленных диаграмм. А если нет, то их названия вы точно слышали. На этом мейнстрим заканчивается. Далее — менее популярные графики.
Диаграмма спагетти (Spaghetti Charts)
К сожалению, это не совсем о еде. Диаграмма спагетти — очень необычный вид графиков, который только набирает популярность. Здесь без визуальной подсказки не объяснишь.
Помимо метеорологии, эти диаграммы подходят для визуализации взаимосвязей, что особенно полезно в юридических и судебных вопросах.
Географическая диаграмма (Map Charts)
Географические диаграммы специально разработаны для анализа географической информации, представления пространственных отношений и региональных данных. Используйте их, если нужно графически изобразить глобальную клиентуру, план расширения компании или план диверсификации производства. Эти диаграммы покажут, какие географические области развиваются, а каким нужно больше внимания. Также они помогают принимать решение — например, куда инвестировать или какие страны лучше для жизни.
Стрим-график или график потока (Stream Graph)
Даже если вы ни разу не видели землетрясения, то о сейсмографе слышали наверняка. Это машина, которая реагирует на сейсмическую активность и записывает сейсмоволны в виде графика.
Сейсмограф фиксирует толчки 24 часа 7 дней в неделю. Данные представляются графически в виде «потока» или «волн» вдоль центральной оси. Сейсмография — не единственная сфера применения графиков потока. Они особенно эффективны для графического изображения изменений за период времени.
Пузырьковая диаграмма (Bubble Charts)
Не очень серьёзное название, но суть не в нём. Сфера применения таких диаграмм в представлении и анализе данных огромна. Если говорить технически, пузырьковая диаграмма пригодится для визуализации анализа взаимодействий и распределения. А проще говоря, информация представлена в трёх измерениях или плоскостях. Допустим, у вас три вида данных: общее количество товаров, число каждого проданного продукта и выручка от продаж каждого продукта. Если вы хотите видеть взаимосвязь этих данных на одном графике, то пузырьковая диаграмма для вас.
Лучевая диаграмма (Sunburts)
Любители интернет-магазинов, эта информация для вас. Ваше поведение на сайте и то, на какие страницы вы заходите, заносится в историю, а админы магазинов могут легко представить эту информацию в виде лучевой диаграммы, чтобы понять, куда идёт основной трафик на сайте и какие страницы посещают реже всего. Такие диаграммы идеальны для представления иерархических данных.
Полярные часы (Polar Clock)
Ещё один интересный, но пока не самый популярный вид представления данных. График работает по принципу часов и каждую секунду показывает количество проделанной работы. Похоже на окно «копирование файлов», где зелёный индикатор показывал, сколько процентов данных уже скопировано. Представьте себе то же самое, только в форме круга — это и есть диаграмма полярные часы.
Интерактивная кольцевая диаграмма (Donut Transitions)
Это та же кольцевая диаграмма, только анимированная. Интерактивная кольцевая диаграмма — один из лучших способов для выявления закономерностей между несколькими параметрами. Эффективна для представления части целого и анализа зависимости величин. При изменении анализируемых параметров изменяются и пропорции диаграммы. Пригодится тем, кто следит за динамикой изменения — например, изменения стоимости акций в результате каких-либо действий компании.
Курс
Инфографика
Это одни из наиболее эффективных способов визуализации данных. Какие-то из них более привычны, о других пока мало кто знает. Новые виды графиков и диаграмм появляются вместе с новыми видами данных, что происходит непрерывно. Это значит, что скоро появятся более продвинутые способы визуализации.
Инфографика для СМИ
Мнение автора и редакции может не совпадать. Хотите написать колонку для «Нетологии»? Читайте наши условия публикации. Чтобы быть в курсе всех новостей и читать новые статьи, присоединяйтесь к Телеграм-каналу Нетологии.
Пять основных диаграмм для визуализации данных. Шпаргалка для презентаций
Данная заметка станет экспресс-помощью всем, кто делает презентации и визуализирует данные. Она задумана как шпаргалка, сфокусируемся на пяти основных видах диаграмм и быстрых способах их выбора под задачу.
Цифры сами по себе для нас абстрактны. А диаграмма позволяет преобразовать абстрактные цифры в визуальную, конкретную картинку, отражающую количество. Например, таблица даёт точное значение цифр, но утрачивает моментальность восприятия, которую даёт визуализация.
Данные — это всего лишь данные. А чтобы они визуально заговорили, нужно определиться, о чём с помощью них мы хотим рассказать. Какой вывод сделать, какую идею (главную мысль) донести. С помощью одного и того же набора данных можно сказать о разном, положить в основу визуализации разные идеи.
Например, у нас есть набор данных по объёмам продаж разной продукции компании за несколько месяцев.
В основу идеи может быть положена определённая замеченная закономерность в данных. Анализируя итоговые показатели по продажам в таблице, мы можем заметить тенденцию роста объёма продаж. И тогда идею можно сформулировать следующим образом «С января объём продаж устойчиво рос». Отображаем идею на слайде визуально гистограммой и в докладе (выступлении) поясняем контекст идеи. Рост закономерен и обычен. Или у нас есть сезонность и весной должен быть спад продаж, а в этом году его нет и почему.
Анализируя продажи по месяцам, можно сформулировать другую идею «В мае продажи продукции А значительно превысили продажи продукции Б и В».
Поиску идеи стоит уделить время. Ведь сформулированную идею можно смело использовать в качестве заголовка слайда или заголовка диаграммы. Идея в качестве заголовка позволяет мгновенно считывать главную мысль визуализации (слайда). Сравните два варианта заголовка.
Для усиления идеи, можно расставить визуальные акценты
Визуальное восприятие человека так устроено, что сами по себе цифры для нас мало интересны и понятны. Чтобы цифры (данные) обрели смысл, их обязательно надо с чем-нибудь сравнить. Для донесения нашей идеи мы можем использовать пять основных типов сравнения: покомпонентное, позиционное, временное, частотное и корреляционное. И для каждого сравнения лучше подходит свой вид диаграммы.
При таком сравнении мы показываем размер компонента в процентах от некоего целого. Целое обычно представляется в виде стандарта в 100%. При компонентном сравнении мы показывает долю от целого, поэтому его можно назвать и долевым сравнением. Круг у нас всегда ассоциируется с целым, поэтому для визуализации наиболее подходит круговая диаграмма.
Наши глаза не могут быстро определять количество объектов больше пяти. Секторов (долей) в диаграмме лучше не делать больше шести. Если значений больше, можно выделить пять основных, а остальные объединить в сектор “прочие”.
Мы привыкли по кругу двигаться по часовой стрелке. Самый важный компонент лучше располагать на линии 12-ти часов и обратить на него внимание выделив цветом. Если “важный” компонент выделять не надо, то сектора диаграммы лучше расположить от большего к меньшему. А цвет просто должен помогать чётко разделять сегменты.
Когда нужно сравнить компоненты (доли) нескольких целых, то лучше использовать гистограмму нормированную на 100%. В этом случае, самый важный показатель желательно размещать внизу.
Здесь важна позиция, которую объект занимает по отношению к другим объектам. На сколько он больше или меньше других объектов, какое место занимает в “строю” других объектов. Для позиционного сравнения лучше подходит линейчатая диаграмма
В линейчатой диаграмме по вертикали располагаются обозначения сравниваемых элементов, шкала располагается горизонтально. Саму шкалу можно не отображать, а значения подписывать у линеек диаграммы (как на рисунке выше).
Линейчатая диаграмма подходит для позиционного сравнения лучше чем гистограмма. Нашим глазам привычнее позицию воспринимать по вертикали (вверху — лучше, внизу — хуже). А ещё, при таком расположении оси обозначений, появляется больше места для записи названий показателей.
Используем, когда надо продемонстрировать, как показатели (данные) меняются во времени (динамика изменений). В визуальном восприятии мы привыкли воспринимать время слева (прошлое), направо (будущее). При временном сравнении для визуализации данных лучше подходит гистограмма.
Здесь тоже можно руководствоваться правилом “не больше пяти”. То есть, если на временной оси нужно показать более 5 значений (столбиков), возможно лучше использовать график. График однозначно нужно использовать вместо диаграммы, если значений больше семи, или нужно отобразить какие-то тренды.
Если на графике нужно отобразить изменение нескольких показателей, то лучше не использовать более трёх линий тренда. При нескольких линиях тренда, линию главного показателя выделяем цветом или толщиной.
Как и в случае с линейчатыми диаграммами, у гистограмм тоже есть множество разновидностей, за подробностями ныряйте в список литературы ниже.
Частотное сравнение используем когда нужно отобразить частоту попадания числовых значений в некий диапазон (интервал). Такое сравнение удобно использовать, когда нужно обобщить (суммировать) большой объём информации, чтобы показать какую-то взаимосвязь. Для визуализации частотного сравнения хорошо подходят гистограммы и графики
Используются две шкалы. Вертикальная — шкала частотности и горизонтальная — шкала диапазонов. Для шкалы диапазонов важно правильно подобрать размер и количество диапазонов (интервалов).
Через малое количество интервалов бывает трудно проследить модель распределения, а слишком большое количество разбивает модель на мелкие части. В среднем, для лучшего визуального восприятия, можно рекомендовать количество интервалов от 5 до 10.
Размеры интервалов надо подбирать так, чтобы нагляднее показать идею (главную мысль).
Корреляция — страшное и непонятное слово:) Такое сравнение используется, когда нам надо показать наличие или отсутствие связи (зависимости) между двумя переменными. Например, мы можем предположить, что чем больше скидку на товар мы даём тем больше этого товара продаём или чем опытней продавец, тем он больше продаёт.
Для такого типа сравнения лучше подходят точечные или двухсторонние линейчатые диаграммы.
В точечной диаграмме используются координатные оси исследуемых переменных. В координатах наносятся точки с числовыми значениями переменных. Расположение точек может указывать на какую-то зависимость. Или наоборот доказывать, что зависимости нет. Если зависимости нет, то в визуализации для понятности можно стрелкой показать, какая зависимость предполагалась
Если значений сравниваемых переменных не слишком много можно использовать линейчатые двухсторонние гистограммы. Если зависимость есть, то диаграмма получается зеркальной. Если зависимости нет, то и зеркального отображения нет.
Ещё можно использовать пузырьковые диаграммы. В таких диаграммах кроме переменных отмечаемых на осях, третьей переменной является размер (диаметр) пузырька.
Итак, по шпаргалке нужно помнить, что можно выделить пять основных типов сравнения данных и пять типов диаграмм. И конечно не забывать про идею.
Шпаргалка сделана по книге Джин Желязны «Говори на языке диаграмм». С неё и нескольких других книг можно начать изучать эту тему глубже
Историческая справка
К концу XVIII века большинство используемых сегодня диаграмм были представлены миру в революционной публикации Уильяма Плейфэра под названием «Коммерческий и политический атлас».
В 1786 году Плейфэр решил использовать свои навыки рисовальщика для иллюстрации экономических данных. В то время такая информация обычно была представлена в виде таблиц, но инженер преобразовал данные в инфографику. В линейном графике он сопоставил цены на пшеницу с затратами на рабочую силу, опровергая распространённое мнение о том, что заработная плата приводит к росту цен на зерно, и продемонстрировал, что на самом деле она растёт гораздо медленнее стоимости товара.
С самого начала скромные диаграммы и графики помогали аудитории принимать решения на основе представленных данных, а также выявлять ранее неизвестные тенденции. За прошедшие годы были разработаны дополнительные инструменты для визуального отображения информации — в том числе и с помощью современных технологий.
Понятие и особенности
Диаграмма — это графическое отображение данных, в котором они выражены символами, такими как столбцы, линии или срезы. Эти графики могут показывать табличные числовые значения, функции и другую различную информацию. Диаграммы часто используются для облегчения понимания больших объёмов данных и взаимосвязей между их частями. Графики обычно читаются быстрее, чем необработанная информация.
Некоторые типы диаграмм более пригодны для представления определённого набора материалов, чем другие. Например, данные, которые показывают проценты в разных группах («удовлетворён, не удовлетворён, не уверен»), часто отображаются на круговой диаграмме, но их легче понять, когда они представлены на горизонтальной гистограмме. С другой стороны, данные, представляющие числа в динамике (например, доход с 2000 по 2010 год) лучше всего нарисовать в виде линейного графика.
Диаграмма может принимать самые разные формы, однако есть общие функциональные черты, которые предоставляют возможность извлекать смысл из данных. Одним из наиболее важных применений текста в графике является заголовок. Этот элемент обычно отображается над основным материалом и даёт краткое описание того, к чему относятся данные в графике.
Размеры в графиках часто отображаются на осях. Если используются горизонтальная и вертикальная оси, они обычно называются как X и Y соответственно. Каждая ось будет иметь шкалу, обозначенную периодическими градациями и обычно сопровождаемуя числовыми или категориальными указаниями. А также они имеют метку, отображаемую снаружи или рядом с ними, кратко описывающую представленное измерение.
Если шкала числовая, к метке часто будет добавляться единица этой шкалы в скобках. Например, «пройденное расстояние (м)» является типичной меткой по оси X и будет означать, что пройденное расстояние в единицах метров связано с горизонтальным положением данных на диаграмме.
На графике иногда применяется сетка линий, помогающая визуально выровнять данные. Она может быть улучшена путём выделения линий на регулярных или значительных отрезках. Затем они называются основными, а остальные — второстепенными. Данные могут отображаться в виде какой-либо комбинации цветов и фигурных объектов. Выводы или точки интереса могут быть наложены непосредственно на график, чтобы дополнительно помочь извлечению информации.
Когда данные, отображаемые на графике, имеют несколько переменных, он может сопровождаться легендой, которая содержит их список на диаграмме. Эта информация позволяет идентифицировать данные каждой переменной на графике.
Термин «диаграмма» в его общепринятом смысле может иметь следующие значения:
В науке этот термин используется обоими способами. Например, инфографист Майкл Андерсон заявил, что диаграммы являются графическими, но абстрактными методами предоставления информации. Карты, линейные графики, гистограммы, технические чертежи и эскизы архитекторов являются примерами диаграмм, в отличие от фотографий и видео. С другой стороны, его коллега Ричард Лоу определил диаграммы как «абстрактные графические изображения предмета, который они представляют».
Типы диаграмм
Существует много различных видов диаграмм, однако среди них можно выделить несколько самых популярных. Это графики следующих типов:
Каждая из них имеет свои отличительные структурные особенности, и нацелены они на разные задачи. Выбор типа диаграммы зависит в первую очередь от имеющихся данных и желаемого результата.
Гистограммы (столбчатые и полосовые)
По определению гистограмма — это тип столбикового (вертикального или горизонтального) графика, который представляет числовые материалы и их распределение.
Распределение часто иллюстрируется во времени, но данные также могут быть построены на основе любой динамической величины, такой как температура, высота или денежная стоимость. Эта концепция также может быть применена к линейным графикам и другим схемам, основанным на построении двух осей.
На гистограмме могут быть представлены два или более набора числовых данных. Как правило, они строятся для облегчения сравнения между двумя объектами, такими как средний рост и вес или рождаемость и смертность. Отдельные наборы дифференцируются с помощью изменения цвета. На гистограмме также есть деления по оси Y и по оси X, которые представляют различные значения переменной.
Сюда же относится радиальная, или кольцевая гистограмма, которая построена на полярной системе координат. В большинстве случаев этот тип используется по эстетическим соображениям, поскольку длины столбцов такого графика могут быть неверно истолкованы.
Круговые (секторные)
Круговая, или внутристолбиковая диаграмма — это круглый статистический график, который разделён на срезы для иллюстрации числовой пропорции. На круговой диаграмме длина дуги каждого среза (и, следовательно, его центральный угол и площадь) пропорциональна величине, которую он представляет.
Такие диаграммы хороши для иллюстрации и демонстрации разбивки выборки в отдельном измерении, поскольку они показывают взаимосвязь между основными данными и их подкатегориями. Это полезно использовать, когда идёт работа с категорированными группами информации, или если стоит цель показать различия между данными, основанными на одной переменной.
В действительности можно разбить любые группы выборочных данных на категории, например, по полу или разным возрастным группам. Для бизнес-проектов можно использовать круговые диаграммы для представления важности одного конкретного фактора для других. Однако для анализа нескольких различных наборов данных следует обратиться к столбчатым диаграммам.
Линейные графики
Линейный, или линейчатый график — это тип диаграммы, который отображает информацию в виде серии точек данных, называемых «маркерами», соединёнными отрезками прямых линий. Он распространён во многих областях и аналогичен точечному графику за исключением того, что точки измерения упорядочены (обычно по значению их оси x).
Линейный график часто используется для визуализации тенденции в данных за промежутки времени, поэтому линия часто рисуется в хронологическом порядке. В этих случаях они известны как графики выполнения.
Этот тип диаграммы обычно используется для объяснения тенденций за периоды. На вертикальной оси всегда отображается числовое значение, а на оси X указаны некоторые другие связанные факторы. Линейные диаграммы могут быть показаны круглыми или квадратными маркерами.
Такой график выглядит не так ярко, как другие его разновидности, но пользователи могут ясно увидеть тенденцию за определённый период для одного набора данных. Кроме того, с их помощью можно сравнить тренды для нескольких разных групп. Менеджеры или аналитики могут использовать такие диаграммы для измерения и анализа долгосрочных тенденций в продажах или при изучении маркетинговой статистики.
Другие варианты
Базовые линейные, гистограммы и круговые диаграммы являются отличными инструментами для сравнения одной или двух переменных в нескольких категориях, но что делать, если нужно сравнить много значений одновременно или они не являются числовыми? Мозаичная диаграмма станет лучшим выбором в этой ситуации. Например, рыночный аналитик хочет сравнить размер пользовательских баз, а также возрастные показатели в каждой группе. Создание такой диаграммы позволила бы маркетологу ясно и просто проиллюстрировать все переменные.
Сегменты рынка часто делятся в зависимости от возраста и пола, а популяционная пирамида является идеальным визуальным представлением двух групп. График классически принимает форму треугольника, когда популяция здорова и растёт — самые большие группы являются самыми молодыми, и каждый пол сокращается примерно в равной степени по мере старения населения, оставляя самые маленькие группы в верхней части графика.
Популяционная пирамида, которая отклоняется от своей классической формы, может указывать на неравномерность населения в течение определённого периода, например, голода или экономического бума, который привёл к увеличению смертности или рождаемости.
Конечно, пирамиды населения не всегда используются для сравнения по возрасту и поэтому не всегда принимают одноимённую форму графика. Например, маркетолог может использовать план для сравнения населения по доходу, весу или IQ, в котором самые маленькие группы часто бывают как сверху, так и снизу. Несмотря на это, график чётко отображает тенденции численности населения, а также сравнивает размеры двух связанных групп.
Ещё диаграммы используются при составлении розы ветров, которая графически отображает скорость и направление ветра в конкретном месте за определённый период, и других погодных показателей, например, дождливости и облачности.
А также используются менее известные типы диаграмм:
Создать диаграмму можно вручную (обычно это делается на миллиметровой бумаге) или с помощью компьютера, используя различные программы и приложения, в том числе известные всем Word или Excel. Продукты пакета Office работают в связке, так что можно рассчитать данные диаграммы в электронной таблице, а потом импортировать и оформить полученный результат в Ворд. Это удобный способ для того, чтобы позже изменить показатели без каких-либо проблем. Составить графики также возможно в многочисленных онлайн-сервисах.