14798
О графиках: плохих, хороших и других. От восхищения до ненависти — один chart. Заметили подозрительный график, присылайте — @bogachev11
Линейный график нельзя делать без чисел
За последний месяц видел эту ошибку несколько раз. Дважды — в презентациях коллег, а теперь ещё и в материале «Бизнес-секректов».
Сила и одновременно слабость линейного графика — в том, что он может начинаться с какого угодно значения (да, не только с нуля!). Линейный график помогает нам видеть лишь направление тренда, но чаще всего мы не можем по одной лишь визуальной форме определить силу этого изменения.
Вот тут — с 2019 по 2024 — это какая разница? В 100 раз? В 2 раза? Или прирост совсем небольшой? Важно добавить этот контекст в виде чисел: на оси или хотя бы в виде пары подписанных точек.
В большинстве случаев графики без единого числа — это всегда плохая идея, даже если это столбики.
Могу представить несколько ситуаций, когда автор или заказчик просит сделать график без чисел:
🔗Числа под NDA
🔗Очень не хочется делать акцент на конкретных значениях. Важно не то, что компьютерные клубы заработали 300 млн, а что в 2024 году они заработали в 3, 5 или 10 раз больше, чем в 2019.
Но оба этих случая решаются процентами! Если это даты — можно в процентах от первой даты.
Можно ещё от среднего значения, от максимума, от суммы — когда это уместно. В общем, вариантов масса: надо подумать, зачем график вообще делали, и определиться, что за числа показывать.
Единственная ситуация, когда отсутствие значений в целом можно простить — это спарклайны (маленькие графики размером примерно как одна ячейка таблицы). Но и там можно что-то придумать.
Пару недель назад в Сиэттле на Open Visualization Collaboration Summit я узнал про удивительный визуальный инструмент для создания гео-визуализаций — noodles.gl.
Инструмент еще совсем новый и у него нет детальной документации, но авторы выложили свое выступление из которого хорошо понятно насколько он гибкий и мощный. Особенно мне нравится, что можно анимацию сделать и экспортировать как видео.
Создатели его используют для анализа данных при разработке своего электролёта (если кто-то знает, как оно по-нормальному называется, напишите) в компании Joby Aviation (котороая изначально была частью Uber, но ее выкупили).
https://noodles.gl
@dataviznews
Причем анаморфоза может выглядеть достаточно сильно по-разному. Главный принцип — изменение площади для кодирования показателя.
(вторую поставил по ошибке. это proportional symbol map — пузырьковая (или в данном случае - квадратичная(?) картодиаграмма — всё же)
Как можно сделать лучше?
Накидала быстренько несколько вариантов, как иначе можно визуализировать эти данные (да-да, будут столбики🤓)
Линейчатая с накоплением прекрасно будет работать с этими данными. У нас есть части, которые в сумме дают 100% (вложенный характер) и в каждой группе мы смотрим доли каких ответов преобладают или нет. Можно выделить все категории, а можно сделать точечный акцент на основной идее, остальные ответы залить серым.
Можно вполне уйти в столбиковую с группировкой и полосовую. Здесь еще решила немного переиграть сам набор данных, чуть укрупнила "хвост из мелочевки". Дальше расставляем акценты, добавляем все подписи, доп.комментарии.
Ну и решила все-таки вынести на общее обозрение вариант с вафлей. Понятно, что многие значения близки и она не так визуально эффективна, но основную мысль вполне себе выделяет и разницу в некоторых интересных моментах тоже. Можно также выделять цветом не все ответы, а зацепиться за идею, остальное оставить серым.
Я еще пробовала варианты "с кругами", но из-за того что значения многие близки, смотрится все примерно одинаково, сложно сравнивать и различать
#Разборыдиаграммы
Довольно необычные и при этом на удивление наглядные графики из свежего материала NYT про женскую лигу NBA.
Идея сводится к тому, что лига зарабатывает очень много, а баскетболистки непропорционально мало, особенно в сравнении с баскетболистами NBA.
И тот, и другой график — чуть додуманные графики из знакомых. Буллет-чарт, в которые добавили ещё один уровень вложенности (плюс остроумно расположенные подписи) и.. range chart, но перевернутый на 90 градусов и фактически small multiples для сравнения текущих и возможных доходов.
#датавизприемы
Нашел сложную задачку, над которой было приятно поломать голову. Коллега прислал вот такую табличку. Перепробовав несколько вариантов переделки, пришел к своему решению. Но поделюсь им через несколько дней.
Кому интересно, кидайте в комменты свои идеи, потом сверимся. Датасет в первом комменте.
☝🏻История про пост Бирмана оказалась еще забавнее, чем казалось сначала. Я вообще не мог понять логику, которую автор использовал в своем посте, настолько она выглядела абсурдной. Но всё выяснилось, когда Игорь Яновский (который написал прекрасный пост про Тафти, его я прокомментирую позже) прислал мне скрин страницы из книги Тафти Visual explanations.
Итак, давайте почитаем, что пишет Тафти и о чем этот пример.
Наконец, несмотря на хроническую опасность искажения, корректные преобразования масштабов являются одними из самых мощных стратегий исследования данных. В двух- и трёхмерных изображениях часто бывает полезно видеть изображения и объекты примерно одинакового или меньшего, чем реальный, размера. [Перед этим он возмущается роликом, где показали красивый пролет по Венере, где высота гор была для красоты увеличена в 22,5 раза]
Например, рассмотрим это полезное решение (разработанное Уильямом Кливлендом) для проблемы отношения сторон в статистических отображениях. График справа показывает количество солнечных пятен по годам с 1749 по 1924 год, следуя известному 11-летнему циклу. Но в этих данных есть гораздо больше, чем просто ритмы и формы. Идея Кливленда — выбрать соотношение сторон так, чтобы наклоны выбранных отрезков линий центрировались вокруг угла в 45°, техника, реализуемая с помощью итеративных вычислений. Применение этого метода к данным о солнечных пятнах даёт график внизу справа, который показывает, что циклы имеют тенденцию быстро расти и медленно спадать. Это поведение наиболее выражено для циклов с высокими пиками, менее выражено для средних пиков и отсутствует для циклов с низкими.
Вижу, что некоторые люди репостят пост Ильи Бирмана про то, каким должны быть правильные пропорции линейного графика. Пост сколь категоричный, столь.. и странный. Я уже много раз писал об этой теме в канале (очень подробно, и еще, и еще), писал в книге, у нас даже были дебаты с Ромой Буниным, по результатам которых он кажется немного пересмотрел свои взгляды)
Вообще, обратил внимание, что в 99% случаев чушь можно предсказать по вводному сочетанию слов "как писал Эдвард Тафти". Ребят, со времен Эдварда Тафти прошло уже много времени, во-первых, а во-вторых, прочитайте, пожалуйста, еще какие-то книги, чтобы категорично что-то утверждать с интонацией эксперта.
Речь как вы понимаете снова о том, что нужно [якобы] использовать соотношение 45 градусов наклона в линейных графиках. При этом вокруг этого Бирман выстраивает какую-то псевдонаукообразную аргументацию, с которой непонятно даже как спорить. Потому что он берет абсолютно абстрактный пример. Как и в предыдущих постах на эту тему и на дебатах могу еще раз повторить. Не надо цепляться к правилу 45 градусов. Понятно, что слишком плоский график и слишком узкий затрудняют чтение просто с позиции восприятия. Для остальных случаев выбор пропорций определяется субъективным контекстом, в котором а) существуют конкретные данные б) который выбрал автор для донесения своей мысли.
Долго вглядывался в бездну этот график. Нашел, что он гениален. И по форме, и по содержанию.
/channel/data_bar/116
При подготовке графиков OpenAI используют секретную технику Nvidia — главное, какого размера столбик и неважно, какое в нём число.
Отрицательный рост наглядно.
@exploitex
Просто вспомнил одну из моих любимых инфографик. Тот редкий случай, когда буквальное изображение понятий на инфографике работает. Иконки сделаны гениально.
Картинка из Иллюстрированной энциклопедии Комптона 1943 года. В которой и сам таймлайн является метафорой жизненного пути.
Единственное что я бы поменял, цветовую легенду сделал цветом, а не словами "красный", "желтый" и поместил сверху перед таймлайном.
По сути столбчатая диаграмма, с условно запрещенным направлением сверху вниз, но — редкий случай — в виде буквальной метафоры, где это абсолютно оправдано.
Также отметил бы скругление, которое в данном случае не декоративное, а скорее показывает условность значений. Как и пунктир на объектах.
И элегантная легенда обводкой.
#датавизприемы
У Яндекса актуальное и остроумное. Напомнило легендарный проект Паддинг про Макконахи (и других)
Читать полностью…
Ну, и последний важный тейк. Важно отличать всё вышеперечисленное от картодиаграм (proportional symbol map), где показатель кодируется (как правило) площадью кружочка или квадрата, который ставится либо на какую-то точку (город), либо в центр (центроид) полигона.
Собственно в этом их отличие от непрерывных анаморфоз. Потому что бывают непрерывные анаморфозы (contiguous cartograms), которые сохраняют топологию, но искажают форму, и раздельные (разобщенные) анаморфозы (non-contiguous cartograms), которые сохраняют форму, создавая при этом зазоры между областями.
И их отличие от картодиаграмм, где символы размещаются в центре каждой области в том, что анаморфозы масштабируют всю территорию целиком.
Уже писал об этом, но давно. Но постоянно вижу эту ошибку. Поэтому повторяю.
Традиционно в России cartogram ошибочно переводят как картограмма. Хотя всё ровно наоборот. Это НЕ картограмма, а анаморфная карта (анаморфоза), где показатель кодируется площадью географической фигуры.
А на картограмме показатель кодируется цветом или оттенком цвета, которым фигура закрашивается. Только вот по-английски картограмма — choropleth map.
Пожалуйста, не повторяйте эту ошибку.
—
P.S. На первой картинке по-видимому сделано и то, и другое. То есть показатель кодируется и площадью фигур и цветом заливки.
Когда форма ради формы
Разберу простой пример, но очень показательный, уже не раз с подобным сталкивалась.
Посмотрите на эту визуализацию. Вроде бы все есть: проценты, подписи, цвета. Но считывать информацию как-то долго и неудобно. Почему?
Потому что форма ради формы.
Авторы решили подать данные в виде капель. Выглядит может даже "креативно", но визуально совершенно бесполезно:
- площадь каждой капли ничего не означает (если я совсем не ослепла🫠)
- сравнить значения между строками затруднительно
- мозгу приходится каждый раз "читать цифры", а не воспринимать форму, которая бы соответствовала значению и передавала бы его.
То есть визуализация перестала быть визуализацией - стала просто декоративной картинкой.
Форма должна помогать понять данные, а не прятать их. Когда мы в визуализации видим круги, капли и т.п., то мы автоматически ищем смысл в размере, форме, цвете. А если смысла там нет, то такая "визуализация" начинает только все усложнять и запутывать аудиторию.
К чему это все, а чтобы напомнить (побуду занудой):
- красота визуализации не в необычной форме, а в ясности передачи смысла
- форма может быть нестандартной, но она должна передавать смысл, эмоции, посыл. Если форма не помогает понять данные, ничего не доносит, то от нее стоит отказаться
- лучше "простая и понятная" диаграмма, чем "красивая, но бесполезная".
Не топите данные под формой. Визуализация должна быть в первую очередь все-таки про данные, про смысл, особенно, в бизнес-среде (да и не только).
Как можно сделать лучше?⬇️⬇️⬇️
#Разборыдиаграммы
Ну что ж, пришло время поделиться своим вариантом ответа на вчерашнюю головоломку. Как справедливо отметили в комментах данные какие-то странные и непонятные сходу. Вроде бы говорится про "изменение" и ты ждешь "плюс сколько-то процентов" или "минус сколько-то", и вроде бы проценты и есть. Но на самом деле.. это обман. Это не проценты изменения, а просто результаты опроса.
Вторая хитрость. Изменилось отношение — не изменилось. Как будто бы это довольно разные группы, и хочется на этом сделать акцент. На том, что у большинства китайцевладельцев именно изменилось отношение. И мы не знаем какое оно было (а если бы знали, можно было сделать санкей, например, кто из какой группы в какую перетек), но скорее всего оно было хуже.
В общем, пытаясь учесть все эти нюансы, собрал вот такую визуализацию. Кажется, у нее еще есть потенциал для апгрейда, но разобраться в ней уже проще, чем в исходной таблице.
И отдельный привет тем, кто утверждает, что таблички меньше 15-20 строк вообще визуализировать не надо.
Я сделал свой плагин для визуализации данных в Figma!
Сразу о главном: найти его можно тут. А в качестве иллюстрации — две версии графика, которые с помощью него были сделаны.
🔗 Это Лёша, дата-журналист, автор проекта @data_csv, а теперь ещё и разработчик плагина data-viz.me. Я уже восемь лет визуализирую данные, и заметил вот какую вещь:
Самые красивые графики в большинстве случаев дизайнеры дорабатывают в графическом редакторе. Меняют шрифты, добавляют иллюстрации и кастомные подписи.
Однако перенос графика из программ для визуализации в векторные редакторы — это всегда немножко пытка. Ты удаляешь кучу каких-то масок и лишних слоёв. Не всегда можешь поменять размеры. Тексты разбиваются на несколько блоков. Пережить можно, но хотелось бы проще.
Вот уже много лет я думаю — было бы славно, если графики можно было бы рисовать инструментами Фигмы. Но почему-то за все эти годы там не появилось хороших плагинов для визуализации. Я постараюсь эту нишу закрыть.
🔗Важно: пока это alpha-версия с урезанным функционалом. Можно сказать, что это самый продвинутый генератор столбиков во всём Figma Community 😄
Что можно сделать на текущий момент:
➡ Загрузить таблицу из Google Sheets, файлом или текстом. Загрузка из Google Sheets иногда может тупить из-за нагрузки на сервер-парсер. Я обычно просто копирую таблицу
➡ Выбрать разделитель и форматирование для чисел
➡ Построить по ним вертикальные столбики
➡ Задать столбикам gap в процентах от их высоты
➡ Раскрасить по категориям — пока только по стандартным палитрам, но в будущем функционал расширится
➡ Убрать подписи. Или добавить в них любую колонку
➡ Выбрать любой шрифт! Написать заголовок, подзаг и источник, подобрать к ним любые цвета и форматирование
➡ Подобрать любой размер и отступы от границ фрейма
Многого пока нельзя. Сжальтесь! До релиза пришлось жёстко отсекать фичи, чтобы плагин работал стабильно.
Но подозреваю, что багов по-прежнему много — о них можно писать в комьюнити.
🔗Я планирую делать плагин полностью бесплатным. Очень надеюсь, что он станет востребованным, и в том числе мы сможем использовать его для обучения студентов визуализации.
Однако в разработку уходит много моих сил. А ещё — приходится оплачивать курсор для разработки. И если вы считаете это начинание важным, поддержите проект донатами.
P.S. На обложке плагина — работа моей коллеги Нади Андриановой One Week in Sound. Надя, спасибо за красоту и что разрешила её использовать 🥺
У рассылки «Это не показатель» — новый формат! Вместе с приглашенным экспертом мы разбираем графики подписчиков
🔸Как это работает. Мы даем данные и контекст, вы — строите график. Работы прокомментируем вместе с Александром Богачевым — автором книги «Графики, которые убеждают всех» и телеграм-канала «Чартомойка».
🔸Что нужно сделать: Скачать данные, построить график и выложить его в комментариях к этому посту до 14.09 включительно. Через три дня мы выберем и подробно разберем первые пять графиков. Обратная связь тоже будет в комментариях.
🔸Что за данные: Это статистика Росстата о доле новорожденных в России по гражданству матери и отца.
В таблице 8 столбцов: первый — год, три с приставкой father_ — гражданство отца (от конкретной страны до укрупнённых категорий), три с приставкой mother_ — гражданство матери. Последний столбец — доля рождений конкретной комбинации гражданств в данном году.
Важно помнить: речь только о гражданстве родителей, эти данные не отражают этническую принадлежность.
Все графики мы разберем в закрытом канале рассылки. Хотите больше таких заданий и разборов от команды и экспертов? Подписывайтесь на рассылку за 500 ₽ в месяц.
The Art of Data Visualization with ggplot2 (The TidyTuesday Cookbook) 🌟
Nicola Rennie подвела небольшой итог трехлетней работы с данными в рамках еженедельного социального проекта TidyTuesday, цель которого — показать, как можно исследовать различные реальные наборы данных.
За три года еженедельных публикаций Nicola создала более 150 визуализаций данных. Каждая глава книги The Art of Data Visualization with ggplot2 посвящена отдельной визуализации данных, включая пояснения для каждого этапа творческого процесса: исследование данных, выбор типа визуализации данных, первоначальные идеи дизайна с набросками от руки, первое построение графика, итеративный процесс стилизации графиков.
Цель книги — продемонстрировать примеры сквозного процесса создания визуализаций данных, уделяя особое внимание техническим деталям их создания в R. Особенно нравится то, что процесс создания визуализации записывается как gif в библиотеке {camcorder}.
Просто кладезь идей для визуального вдохновения!
Довольно необычный ход, мне бы не пришел такой в голову.
Я бы сделал линейными степами с общими осями X и Y, либо один график под другим, чтобы не подписывать дважды май-август.
Но размышляя над тем, почему сделали именно так. При сохранении удобства сравнения паттернов год к году, имеем логичную интуитивную последовательность слева направо. А главное — получаем столбики с более вертикальными пропорциями. Что с одной стороны лучше показывает идею про достижение 300 млн, а во-вторых, и это может быть даже важнее, даёт удобно подписать фильмы сверху.
Отдельно отмечу подписи годов на самих столбиках, тоже достаточно необычно.
#датавизприемы
Записала маленький бесплатный курс про улучшение таблиц и графиков в Excel. С задачками самопроверки и чеклистами.
1 час и 42 минуты переверстываю стандартные визуализации, объясняя где чего не так и как сделать лучше. Вот так вот!
В Экселе как известно можно сделать всё.
Via /channel/finalyticspro/758
⚡Вы неоднократно спрашивали как купить книгу "Графики, которые убеждают всех" в Европе.
И теперь такая возможность есть! Договорился с магазином Polaris, книга теперь у них в наличии, доставляется по всей Европе.
https://kniga.lv/shop/grafiki-kotorie-ubezhdajut-vseh-2-e-dopolnennoe-i-pererabotannoe-izdanie
👀 Плотность населения
Шесть способов визуализировать плотность населения. Цветовая шкала и подписи объясняют, как каждая карта визуализирует плотность населения: с использованием точек, искажённых форм, кругов, линий или классического цветового градиента. А как бы вы визуализировали плотность населения?
via Benjamin Nowak
✨Оптимальные размеры барчарта✨
Недавно на курсе обсуждали, какие же они, идеальные пропорции для барчарта? На что я обычно ориентируюсь -- с пропорциями все хорошо, если:
- Можем охватить график одним взглядом:
Если ловите себя на том, что глаза "бегают"от начала и до конца столбиков, то можно сУзить
- Легко проводить сравнение:
Немного субъективная штука, но можно попробовать убрать подписи чисел и посмотреть, как хорошо вы можете узадать реальную разницу
- Текст и подписи влазят в столбец:
Числа не прилипают к краям, размеры текста и столбика визуально сбалансированы
- Столбики не слишком широкие и не слишком узкие
На слишком широких теряется текст -- столбики начинают визуально перевешивать. На узких появляется ощущуение "сетки", как будто белое пространство такое же важное, как и сами столбцы. В идеале расстояние между столбцами составляет ~30-50% ширины самого столбика.
Гайд по типам графиков от Datawrapper 💫
Свежее прекрасное от Lisa Charlotte Muth. На этот раз общий гайд про то, какие типы графиков существуют и когда их использовать. Не уходит в детали построения и правила, но зато есть куча кросс-ссылок на примеры и другие статьи.
Мы с Сашей Бараковым собираем в Miro Data & Analytics Songbooks все ее посты картинками для удобной навигации. Сама пользуюсь эти минимум раз в месяц. И эта новая статья там тоже появится сегодня 🐙