10 заметок с тегом

аналитика

Дьявол в графике

Все мы воспринимаем графику лучше, чем текст. Нам легче усвоить учебный материал, если он дан в форме схемы; мы гораздо быстрее понимаем диаграммы, чем их описание; инфографика правит миром.

Однако далеко не всегда выбранное графическое решение отражает реальное положение дел или мысль автора. Более того, с помощью графики можно эффективно манипулировать идеей, скрывать правду, обманывать конечного потребителя.

Классические примеры визуального обмана поражают своей простотой и находчивостью. Вот справа на картинке история успеха газеты New York Post, почти «догнавшей» по тиражу конкурента Daily News.

Выявить подобное жульничество сложнее, чем в тексте. Это обратная сторона легкости восприятия графики и повышенного доверия к ней. Потребителю легче принять трактовку автора, чем относиться к каждой цифре критически.

Разберем подробно один пример, показывающий влияние формы графики на передаваемый смысл.

Оригинал поста — в блоге Junk Charts, я привожу сокращенный пересказ

График был опубликован Reuters. Он показывает в динамике изменение процента женщин-руководителей в компаниях Fortune 500.

Рисунок 1. Процент женщин среди CEO быстро увеличивается

Как видно, используется всего два параметра: год, процент женщин-руководителей. Число компаний на протяжении всего период времени остается неизменным, поэтому процентное выражение идентично по динамике абсолютному, т. е. просто числу женщин-руководителей.

Неправда ли, эта компоновка — портретная ориентация, максимальное значение по шкале в последний год — заставляет в первую очередь, обратить внимание на значительный рост числа женщин-руководителей. Рост здесь — главная идея, которую автор, может быть, и не хотел передать, но передал.

Альтернативная мысль — число женщин по-прежнему крайне мало! — достигается при показе шкалы ординат полностью.

Рисунок 2. Процент женщин среди CEO по-прежнему мал

Шаг вперед, но и на пути к усложнению визуализации — это разнесение двух показателей: динамика отдельно, мысль о малом проценте — отдельно. Такой подход представлен на следующих диаграммах. Обратите внимание, что достигается преемственность цвета: процент, откладываемый на пай-диаграмме и в поле квадратов, явно ассоциируется с последним годом наблюдения благодаря выделению красным цветом.

Рисунок 3. Процент женщин среди CEO быстро растет, но по-прежнему мал

На правом рисунке примечательно то, что квадрат, соответствующий женщинам-руководителям, размещен в центре поля. Очевидно, автор хотел сравнить пропорции этого малого и общего квадратов. Однако в такой расстановке может создаться впечатление о давлении на женщин-руководителей со всех сторон или их исключительном «центральном» положении.

Наконец, революционный относительно предыдущих вариантов, подход — показать данные на графике с двумя осями. По левой оси отложено число женщин-руководителей в абсолютном выражении; по правой — то же, но в процентном выражении. Эквивалентность динамики этих двух показателей позволяет относить графики одновременно к обеим осям, что является необычным подходом.

Рисунок 4. Процент женщин руководителей растет, но не быстро, и он по-прежнему мал.

Такое отображение становится в оппозицию к другим вариантам: здесь очевиден весьма незначительный прирост числа и соответственно процента женщин-руководителей. В это же время другие графики, если и отвечают на вопрос о динамике, то склоняют читателя скорее к позитивной оценке.

Однако сходу последний вариант крайне сложно понять из-за его непривычности. Часто на подобных диаграммах проценты соответствуют относительному приросту, а не отображаемому показателю — в данном случае, проценту женщин-руководителей.

Таким образом, четыре графика — четыре разные мысли:

— процент женщин-руководителей быстро растет;
— процент женщин-руководителей по-прежнему мал;
— процент женщин-руководителей быстро растет, но по-прежнему мал;
— процент женщин руководителей растет, но не быстро, и он по-прежнему мал.

А ведь в данном случае работа ведется только с двумя показателями. Большее число показателей открывает поистине обширные горизонты для манипулирования фактами.

На мой взгляд, наиболее удачный вариант, точно описывающий и динамику, и текущее положение, — показан на третьем рисунке (вариант слева). А как вы считаете, какой вариант самый удачный? Можете предложить свой? Приходилось ли вам сталкиваться с подобными задачами на практике?

2018   аналитика   креатив и контент

Какой не должна быть инфографика. Часть 1 — BARный кошмар

Когда дело доходит до таких вещей как сайты, графика, пользовательские интерфейсы и т. п. мы часто общаемся в терминах «нравится»/«не нравится». С инфографикой все очень похоже за одним исключением: инфографика должна передавать какой-то смысл, решать определенную задачу (сайты, интерфейсы, кстати, тоже). Чаще всего эта задача — дать быстрое понимание сложных фактов пользователю. Если она не решена — значит, и инфографика не совсем хороша. И это совсем не дело вкуса.

Мы начинаем собирать примеры того, какой инфографика не должна быть, и постараемся объяснить нашу точку зрения. Безусловно, встречные мнения приветствуются.

Проблема

Следующая иллюстрация была напечатана, правда уже достаточно давно, в одном из ведущих деловых изданий. Она показывает развитие сетей «Позитроника» и «Эксперт-Компьютерс» с помощью горизонтальной столбчатой диаграммы/горизонтального бара (bar chart).

Инфографика, очевидно, должна дать представление о следующем:

— показать, как выросли «Позитроника» и «Эксперт-Компьютерс» в 2007 году;
— сравнить, как они соотносятся между собой (по числу открытых магазинов).

Но дело сразу пошло не так: за очень редким исключением, нельзя на одной оси откладывать разные размерности. В данном случае это сделано с млн долларов и штуками.

Далее, совершенное буйство цветов, которое дополняется несоответствием пиктограммы на легенде (белая точка в середине) с изображением на графике.

На графике показатели чередуются: выручка с числом магазинов; это решение делает график окончательно нечитабельным.

Последним шагом на пути в бездну могло стать отображение информации в форме пай-диаграммы, но до этого, к счастью, дело не дошло.

Решение

Два шага к успеху: оставить шкалу только для одного показателя и перейти от абсолютного показателя (выручки) к относительному (средняя выручка с торговой точки).

Последнее нужно прокомментировать. Средняя выручка с магазина у сетей примерно одинакова и изменяется от 0,8 до 1,2 млн долл. в год (показатели неточные, определены «на глазок» по графику). Если бы она была идентичной, то динамика магазинов полностью бы совпадала с динамикой выручки. Но и в диапазоне 0,8-1,2 динамика мы добиваемся того же эффекта примерного соответствия динамики числа магазинов и выручки.

С помощью стандартных электронных таблиц, без привлечения дизайнера, можно получить следующую альтернативу. Здесь не хватает только легенды, что золотистый цвет относится к «Позитронике», а серый — к «Эксперт-Компьютерс».

В альтернативной версии также появляются подписи данных, число магазинов, средняя выручка, которые облегчают понимание. С помощью дизайна можно еще лучше подчеркнуть наиболее важные моменты на диаграмме, это только прототип.

Лирическое отступление

Кстати, линейные графики, состоящие только из двух периодов времени, на западе сейчас в тренде. Ту мысль, которую раньше показывали пай-диаграммой, а сегодня показывают горизонтальными барами, завтра, скорее всего, чаще будут показывать именно линейными графиками.

Пай-диаграмма

Горизонтальный бар

Линейный график

Впервые опубликовано: здесь, 7 августа 2015 года

2018   аналитика   креатив и контент

Какой не должна быть инфографика. Часть 2 — Неожиданные примеры плохой визуализации

Хорхе Камоишь (Jorge Camoes) в своем блоге Excel Charts приводит примерынеудачной визуализации от вполне уважаемых авторов и изданий, которые могли бы справиться с задачей лучше. Примеры на португальском языке, но часто можно увидеть проблему и без понимания сути. Попробуем разобраться, в чем дело, а также предложить альтернативные решения.

Первый пример — представление барьеров, которые ограничивают португальскую экономику.

Здесь неудачно, в первую очередь, разделение графической части и легенды — проще было подписать названия категорий непосредственно рядом с шестеренками. Далее, сама форма шестеренки дает намек, что соседние барьеры каким-то образом связаны. Этот смысловой оттенок ввиду симметрических черт изображения, весьма сомнителен. Наконец, сходу непонятно: какой все-таки из барьеров основной для португальской экономики.

Второй пример — газета Publico и географически привязанные пай-чарты и столбчатые диаграммы.

В круговых диаграммах одна категория стабильно меньше 1% — возможно был смысл ее опустить. В целом, нужно либо упрощать графическую часть, либо не привязывать ее к карте страны.

Третий пример принадлежит Государственному совету по образованию Португалии.

График должен показать по годам распределение учебных заведений страны в зависимости от числа студентов. Всего сегментация по 2 категориям и выделяется 110 «ячеек». Насколько можно понять задумку автора, главная мысль — в последние годы увеличивается число крупных учебных заведений. Альтернативное решение для подобных задач — это групповые горизонтальные бары: например, можно попробовать нарисовать 10 баров по годам для каждой из групп учреждений по численности и выделить отмеченный тренд. Можно было также подумать об объединении некоторых сегментов по численности.

Последний пример — график от фонда FFMS — независимой организации, чья миссия заключается в объективном освещении ситуации в стране. Фонд опубликовал следующую визуализацию статистики адептов католической религии в Испании, Италии и Португалии по годам.

Подобное решение делает совершенно несравнимыми показатели отдельных лет по странам. Альтернатива аналогична предыдущему пункту — группы горизонтальных баров.

Впервые опубликовано: здесь, 2 ноября 2015 года

2018   аналитика   креатив и контент

Инфографика: удачное представление результатов соцопросов

В инфографике большое мастерство — это, конечно, расставить акценты на статической картинке таким образом, чтобы читатель однозначно понял все сообщения автора.

Однако бывает, что данных и их измерений очень и очень много. Например, это результаты соцопроса.

В таких случаях отобразить удобным образом полученные знания весьма непросто. Замечательно, что тем не менее удачные решения существуют. И здесь отлично срабатывает интерактивность, дающая возможность в разное время отобразить тот или иной срез данных.

Этот пост вновь написан по мотивам поста, опубликованного в блоге Junk Charts Кайзера Фунга (Kaiser Fung). В нем речь пойдет об интерактивной визуализации результатов соцопроса. Опрос сравнивает отношение жителей Восточной и Западной Германии к социальным трендам, а также показывает динамику мнений в течение последних 25 лет, т. е. с момента воссоединения страны.

Как и в любом опросе респонденты были сегментированы, в данном случае — на 9 групп: по полу, уровеню образования (3 категории), возрастной группе (4 категории).

Можно ли одновременно отобразить на одном графике 20 временных трендов (9 групп и среднее отдельно по Восточной и Западной Германии)?

Можно! Вот, что сделали авторы из издания Zeit Online (кстати, у них очень хорошие примеры интерактивной инфографики). Это типовой интерфейс их инфографики; он демонстрирует результат ответа на один вопрос.

Вопрос анкеты звучал так: «Согласны ли Вы, что с точки зрения воспитания ребенка работающая мать более предпочтительный вариант, чем мать-домохозяйка?». График показывает число согласных (от 0 до 100%).

Толстые линии соответствуют средним значениям: синяя — среди жителей Восточной Германии; желтая — среди жителей Западной Германии. Разрыв в отношении к этому социальному явлению между двумя регионами значителен и со временем почти не сократился на фоне общего тренда поощрения работы матерей.

Каждая из тонких фоновых линий — это один из разрезов респондентов. Доступ к разделу происходит через кнопки в верхней части интерфейса. Вот результат выбора сегмента «Мужчины» (выбранный сегмент прорисован толстой серой линией).

Что не удивительно, в обоих регионах мужчины больше поощряют женский труд, чем население в среднем, и, следовательно, чем женщины. При этом с точки зрения временной динамики тренд этой группы практически полностью повторяет тренд среднего.

Обратите внимание, насколько «чистым» и простым выглядит интерфейс: хотя на нем практически отсутствуют подписи числовых значений (а они появляются только для выбранного сегментов), зритель сразу может охватить картину в целом.

Дополнительные преимущества этой работы:

— Результаты ответов на все вопросы представлены в едином стиле и зрители не тратят время на то, чтобы перенастроить свое восприятие инфографики на новые образы и закономерности.
— Справа предложен удобный навигационный инструмент для того, чтобы перемещаться между разными вопросами анкеты.

Компании, проводящие опросы, — примите на заметку! Datasense поможет Вам создать удобные и понятные интерактивные интерфейсы для представления сегментированных результатов Ваших опросов.

Впервые опубликовано: здесь, 10 июля 2015 года

2018   аналитика

Польза от тепловых карт

Существует много типов диаграмм и различных способов отображения данных. Одни из них традиционные и, если вы их используете, у вас очень много шансов быть верно понятыми без лишних усилий и комментариев. Другие встречаются заметно реже. Однако с ними часто сложно рассчитывать на «понимание по умолчанию». Тепловые карты (heatmap) относятся к последним. Тем не менее, они имеют свою область применения и там очень эффективны.

Недавно в газете Washington Post была опубликована точечная диаграмма. Каждая точка соответствует одному американскому городу, а ее положение — проценту белокожего населения (по горизонтальной оси абсцисс) и проценту белокожих полицейских (по вертикальной оси ординат). Цвет точек не имеет принципиального значения: синим цветом показаны те города, в которых процент белокожих полицейских больше процента белокожих жителей; серый соответственно, наоборот.

Проблема этого решения в том, что оно плохо отвечает на вопрос о плотности точек. Правый верхний угол: там сконцентрированы точки, и непонятно, сколько их. То есть: «Как много городов, в которых все полицейские белокожие (100% по ординате) и процент белокожего населения велик (70-100%)?». Эта проблема связана с излишней дисперсностью диаграммы: если какой-то показатель отличается у двух городов на 0,1% — это будут две, наезжающие друг на друга, точки.

Решение проблемы — использование тепловой карты (heatmap): обе оси делятся на 5%-е интервалы, составляя тем самым 400 квадратов. Цвет квадрата показывает, сколько городов относятся к соответствующему диапазону.

Теперь, конечно, не увидеть каждый город, но возникает общее понимание ситуации, в том числе ясно, что концентрация показателей в правом верхнем углу значительна. В бледно-желтых квадратах — от 1 до 5 городов. Именно этот масштаб пока не дает полного представления, поскольку каждый пятый город имеет только белокожих полицейских.

Обратимся к содержанию статьи, которую иллюстрировала точечная диаграмма. Она посвящена резонансному для США событию: 4 апреля 2015 года в городе Норт-Чарлстон (Южная Каролина) белокожий полицейский из соображений самообороны застрелил чернокожего нарушителя. В Норт-Чарлстоне имеет место расовый дисбаланс: от общего числа жителей чернокожие занимают больше половины, однако среди полицейских преобладают белокожие (более 80%).

Это знание позволяет упростить диаграмму. Предположим, что в городах с большой долей белокожих в полиции (100%) расовый момент неприменим. Удалим соответствующие точки из выборки. Получается уточненная картина, дающая хороший вывод, — есть прямая корреляция между процентом белокожего населения и полицейских. Увеличивая масштаб по каждой из сторон клетки с 5% до 10%, получим следующий вид, отражающий прямую зависимость двух показателей.

Какие выводы можно сделать из данных Washington Post:

  1. Наблюдается определенная тенденция: процент белокожих полицейских выше процента белокожих жителей в населенных пунктах. При этом, конечно, есть исключения.
  2. Почти в каждом пятом городе полицейская служба состоит только из белокожих (на графике эти города не представлены).
  3. Стоит обратить внимание на города, которые сильно отстоят от среднего значения, т. е. в которых процент белокожих полицейских несравнимо выше процента белокожего населения и наоборот.

Еще один вывод: в некоторых случаях исключение отдельных сегментов данных (здесь — городов со 100%-й белокожей полицейской службой) не только не портит картину, но и дает ее лучшее понимание.

Пост основан на публикации в блоге Junk Charts.

Впервые опубликовано: здесь, 27 апреля 2015 года

2018   аналитика
Ранее Ctrl + ↓