chartomojka | Unsorted

Telegram-канал chartomojka - Чартомойка

8917

О графиках: плохих, хороших и других. От восхищения до ненависти — один chart. Заметили подозрительный график, присылайте — @bogachev11

Subscribe to a channel

Чартомойка

Мой коллега по пристрастию к датавизу сделал онлайн-приложение «My life in weeks», где можно, введя свою дату рождения, сгенерить себе лаконичный постер-визуализацию, сколько ещё осталось недель, если планируете дожить до 90. Очень такой убедительный постер, да. Можно скачать, напечатать и повесить и поплакать. А если не вводить дату, то можно скачать пустой бланк и раскрасить самостоятельно цветными карандашами.

Ну и вдогонку любимое видео про прокрастинацию, которое я всегда смотрю, когда нужно сделать что-то важное. Вы его наверняка видели, но вам же тоже важное надо делать, поэтому, почему бы и не посмотреть.

Читать полностью…

Чартомойка

📚Недавно для книжного магазина БММ сделала подборку книг по визуализации. Не все осталось в наличии, но тут то, что точно можно ухватить:
- «Графики лгут. Как стать информационно грамотным человеком в мире данных?» от Альберто Кайро. Это одна из моих любимых книг про графики и как они нас обманывают, а некоторые этим пользуются.
- «Визуализация данных. Полный и исчерпывающий курс для начинающих» от Тамары Манценр. Прямо такая полноценная книга про все самое важное в визуализации. У нее еще есть классные записи лекций на ютубе.
- «Как лгать при помощи статистики» от Даррена Хаффа. Хорошо идет вместе с Кайро про обманывающие графики, потому что все идет от цифр.

И не про датавиз, но полезное в связке про данные «Думай медленно... решай быстро» Канемана и «Чёрный лебедь» Талеба.

До 1 сентября по промокоду DATAVIS можно получить скидку -10%, а еще и при регистрации будет действовать -25% и они суммируются.

Читать полностью…

Чартомойка

Энди Кирк обновил свой каталог инструментов. Действительно добавлено много новых и улучшена рубрикация.

https://visualisingdata.com/resources/

Читать полностью…

Чартомойка

⚡️Через 20 минут начинаем обещанный стрим с Ромой Буниным. Стрим будет в Ромином канале @revealthedata.
Ссылка для подключения в качестве слушателя: /channel/revealthedata?livestream

Читать полностью…

Чартомойка

📘 Графики, которые убеждают всех
Совместим полезное с полезным, продолжу разбор важных книг по визуализации данных и сделаю анонс нашего разговора с Сашей. Про пропорции графиков мы поговорим на стриме в телеграме 2-ого в воскресенье, в 12:00 по Мск.

А сегодня расскажу вам про книгу Саши. Она является отличным пособием как делать графики и передавать с помощью них идеи. Больше всего идеи из книги будут полезны для презентаций и отчетов, когда у вас уже есть мысль или вывод, которые вы хотите донести до аудитории с помощью графика. А в контексте дашбордов будут полезны объяснения на какую группу вопросов отвечает каждый тип графиков и как их правильно оформить.

В книге есть личная история Саши и примеры из необычной отрасли — медицины. Это добавляет жизни и книгу читать интересно. Самое полезное в книге, на мой взгляд, — примеры «было → стало». Много интересных преображений графиков с полезными комментариями и много важных приемов и правил. Можно сделать чек-лист на проверку графика по этим пунктам. Но при этом в книге много классных отступлений формата «но бывает и по-другому». Саша гибко думает про правила, которые предлагает, и не запирает в них читателя: «Чаще всего делайте „так“ и „так“, но что-то может пойти и по-другому»

Отдельно стоит выделить классный раздел с частыми ошибками в визуализации. А ещё есть отличный постер чарт-чузер, который шел к книге, можно скачать тут.

Понравившиеся цитаты:
«Чем больше у проекта ограничений, тем проще вам работать» 

«Чаще всего с помощью визуализации мы пытаемся понять, какие из значений больше или меньше других и в какой степени» 

«Я не видел ни одного человека, которому помогли бы чарт-чузеры, или чтобы кто-то реально ими пользовался. Они интересны для ознакомления, но пользоваться ими не рекомендую»
(сказал Саша и сделал чарт-чузер =)

Итого, книга — отличное начало про то, как строить первичную единицу дашборда — график. Очень рекомендую. Наиболее близкой по духу будет книга Коул Нафлик, можно читать из в паре.

Больше разборов книг по тэгу #книга

Читать полностью…

Чартомойка

Саша Богачев накинул на мой пост про пропорции графиков у себя в канале и призвал на дуэль подискутировать на этот счет =)

Решили сделать спонтанный мини-стрим в воскресенье в 12:00 по МСК и там поспорить про это. Где пройдёт стрим решим попозже и напишем за час до встречи, скорее всего сделаем трансляцию в телеграме.

Читать полностью…

Чартомойка

Тут произошёл большой казус. Многие издания, включая РБК и даже сам сайт ФНС написали, что в 2022 году российские компании заработали 1.3 квадриллиона рублей. Один квадриллион — это 1000 триллионов, число с 15 нулями.

Эксперты это радостно подтвердили, рассказав множество версий, откуда в России появилось так много денег, да ещё и на фоне кризиса. Однако никто почему-то не предположил, что озвученное число — это просто ошибка в данных.

А вот Институт проблем правоприменения пишет, что таким расчётам просто нельзя верить. Судя по всему, журналисты просто сложили общую выручку по всем компаниям, не вникая в детали.

Однако, если изучить исходные данные, можно обнаружить, что в 2022 году больше всего денег сделала некая компания ООО «ЮССА», сделав 214 триллионов рублей и обогнав Лукойл (выручка 2.9 трлн руб.) и Магнит (2 трлн руб.). ИПП предполагает, что подобное значение — бугхалтерская ошибка. Вероятно — не единственная.

О чём это говорит?
Если у вас есть исходные данные — обязательно изучите распределение и отсутствующие значения. Возможно, перед суммированием и подсчётом средних часть данных придётся исключить или исправить.

А ещё эта история учит нас тому, что можно найти экспертов под самое безумное утверждение, подтвердив любую ошибку в данных 🙈

За подробной аргументацией отправлю вас в канал ИПП — там интересно.

Читать полностью…

Чартомойка

Ну как же так. По идеи оси слева и справа должны быть синхронизированы, но нет (см. картинку 2).

А можно было и просто линейный график сделать или даже скорее столбчатую диаграмму, на которой можно было удобно выделить период ковидных ограничений и экстремумы (мин/макс). Вряд ли так уж сильно нужны точные значения за каждый год среднего значения с детализацией до человека.

А ещё лучше было бы сделать ящики с усами.

А еще лучше.. в общем есть и другие варианты, но для начала можно хотя бы оси синхронизировать, чтобы одни и те же значения не изображались разной длины столбиками

Читать полностью…

Чартомойка

Пример того, зачем визуализируя любые данные нужно подумать об осмысленной сортировке. (Первая картинка исходная, на второй футболки отсортированы мной в Пейнте). Как правило, это добавляет целый новый слой информации или даже два или три (или позволяет их удобнее считывать, проявляет).

1. Мы можем видеть значения, собранные по группам (большие, средние, малые)
2. Удобно сравнивать соседние значения друг с другом, даже если они очень мало отличаются друг от друга.
3. Видеть как значения распределены внутри диапазона.

А еще лучше было сразу отложить футболки вдоль температурной шкалы.

Читать полностью…

Чартомойка

Прекрасная, очень наглядная диаграмма Венна 👍

Читать полностью…

Чартомойка

Дорогие подписчики, нужна ваша помощь.

Мы в Яндекс.Практикуме проводим исследование про инструменты и принципы визуализации данных. Хотим узнать, какие потребности в обучении визуализации есть у аналитиков и других представителей IT-профессий.

Если вы находитесь в поиске обучения по инструментам визуализации (Tableau, PowerBI, Datalends и др.) или просто хотите прокачать свои навыки — приглашаем вас поучаствовать в интервью. Оно займет около 25 минут, а в знак благодарности коллеги отправят небольшой бонус 🎁.

Не имеет значения, рассматриваете вы обучения с нуля или ищите что-то продвинутое. Если вы готовы помочь исследованию — заполняйте форму, а исследователи свяжутся, чтобы согласовать встречу 🙌

Читать полностью…

Чартомойка

Забавная статья о том, как манипулировать данными и прежде всего их визуализацией, чтобы достигать большей эффективности в бизнесе (на бумаге). Уверен, вы прочитаете и никогда не будете так делать ;)

/channel/rationalnumbers/5229

Читать полностью…

Чартомойка

Notion + Tableau!

Хотела поделиться чудесной новостью, что два хороших продукта теперь ещё лучше работают вместе! ☺️

В Notion можно вставлять не только публичные дашборды, но и приватные! Что делает прикольное корпоративное комбо!

Никто не знает, с Power BI Notion тоже работает? По идее, с публичным должен тоже. Но вот приватные... 🤔

Тестируем?

Читать полностью…

Чартомойка

🤓 Увидел дискуссию про то как бывает непросто убедить заказчика в необходимости доработать "графики из экселя". Основными были два варианта: сослаться на Тафти и показать ссылки на образовательные видео. Насколько я понял, Тафти так себе аргумент, а вот видео может и сработает (интересно было бы узнать развязку).

Мне кажется, есть один способ, который, наравне с популярными видео, может тоже помочь: нужно ввести и популяризовать термин "графическое редактирование".

Многим понятно, что происходит с текстом, который сокращает или приводит в порядок редактор. Каждый хоть раз ретушировал свою или чужую фотографию в телефоне.

Термин кажется понятным и не таким амбициозным, как "дизайн инфографики" (где дизайн, там интерьеры, смартфоны, интерфейсы, а это заведомо долго и дорого).

Графическое редактирование доступно каждому. Красные глаза на фото — плохо. Многоцветие столбиков — ну это как красные глаза на фото, нужно отредактировать. Канцеляризмы в тексте — плохо. Обилие подписей в диаграмме — так же плохо, как канцеляризмы. Нужно поправить.

Что думаете?

Читать полностью…

Чартомойка

📈Gephi Lite

Любителям строить графы — вышла веб версия старого доброго Gephi. Gephi Lite имеет более простой и удобный интерфейс и обладает основными возможностями работы с графами как в старшей десктопной версии, но с некоторыми ограничениями. Например, нельзя открыть совсем большие графы.

В целом испытываю физическую боль при использовании Gephi, будем тестировать этот тул.

https://gephi.org/gephi-lite/

#инструментнедели

Читать полностью…

Чартомойка

Очень хорошая вакансия в Тинькофф-журнале — редактор инфографики. Если вам нравится разбираться в цифрах писать про них и рисовать графики, но вы не знаете где этим заниматься, то вот здесь.

https://journal.tinkoff.ru/team/statistics-editor/

#дружескаяреклама

Читать полностью…

Чартомойка

Спасибо всем кто поучаствовал, надеюсь было интересно! Если формат прикольный — ставьте огонёчки.

Ссылки:
Запись стрима (качество такое отдает сам телеграм 😔)
— Мой дашбордик, чтобы поиграться с количеством точек
Статья про COVID-19 из Economist
#ссылка

Читать полностью…

Чартомойка

⚡️⚡️⚡️ Начали, подключайтесь

Читать полностью…

Чартомойка

The Pudding сделали экстеншн для гугл мита, который анализирует, кто сколько говорит на встрече.

И все, конечно, визуализирует:
- кто сколько говорит и подсвечивает тех, кто говорит больше среднего
- подсвечивает излишнее использование бизнес жаргона

Читать полностью…

Чартомойка

Думаю завтра всем будет не сильно до стрима про пропорции графиков, да и могут быть просто технические накладки с инетом, поэтому решили с Сашей перенести стрим. Расскажем позже когда сделаем.

А чтобы вы не совсем скучали, старый, но очень классный мем из «Как я встретил вашу маму». Кстати, этот сериал — неплохая альтернатива чтению новостей. 🥴

Читать полностью…

Чартомойка

Хочу поспорить/порассуждать немного о посте про выбор пропорций для линейного графика, который написал Рома Бунин.

Для выбора верных пропорций Рома советует либо использовать технику "banking to 45 degrees" — постараться средний наклон сделать близким к 45 градусам, либо использовать 16:9 пропорции.

Я бы посмотрел на вопрос шире. Зачем нам нужен линейный график (или шире — график вообще)?

Он должен решить коммуникационную задачу.

Задача эта может быть разной, но чаще всего она будет вращаться вокруг быстрой и точной передачи цифровых значений таким образом, чтобы было легко, удобно, недвусмысленно получить ключевые сообщения, которые в датасете есть, и на которые заказчик коммуникации хочет, что бы мы обратили внимание.

Линейный график даёт очень много информации, которую наш мозг считывает за секунды. Это и общий характер изменения показателя, и характер изменения (скорость, направление) в отдельные моменты (резкий рост в этот месяц, плавное снижение в следующем году), ритм изменений, амплитуда изменений и так далее.

Если говорить про Ромин пример, все 3 графика, успешно передают всю эту информацию. Тогда зачем нам нужно менять пропорции?
Затем, что изменяя пропорции (а также диапазон, который охватывает шкала Y), мы можем добиться более точного соответствия восприятия линии СУБЪЕКТИВНОМУ характеру изменений показателя.
Субъективному — это значит, что одни и те же пропорции и один и тот же диапазон шкалы Y для разных данных может либо соотноситься с характером изменений, а может и не соотноситься. То есть в одном случае изменение на 5% — это супермного и суперважно (условно, для графика массы тела или ее температуры), в другом — это что-то на уровне погрешности (площадь лесных пожаров).

Дефолтные 16:9 — это может быть неплохое костыльное решение для дэшборда без учета любой субъективной составляющей.

Но если мы хотим решать коммуникационную задачу лучше, то нам нужно хорошо понимать свои данные и значимость тех или иных изменений, чтобы максимально наглядно их показать.

И вот здесь нам будут помогать (реже) пропорции, а чаще диапазон шкалы Y. Почему пропорции реже? Потому что проблема возникнет скорее всего только для очень широкого и плоского графика, или очень высокого и узкого. В остальных ситуациях (1:1, 4:3, 3:4, 16:9 и так далее) это не будет существенно влиять на субъективный характер изменений. По-крайней мере — меньше, чем диапазон шкалы Y.

Разумеется, ось Y у линейного графика обрезать можно, и нужно, но об этом нужен отдельный подробный пост.

Либо об этом уже написано у меня в книжке Графики, которые убеждают всех (кстати, готовится переиздание бумажной версии, ура), либо об этом рассказано и наглядно показано с помощью специального интерактивного инструмента в нашем офигенном курсе Визуализация данных и BI-инструменты на Я.Практикуме.

Кстати, 26-го июня стартует новый набор. С промокодом DATAVISBOG10 он может стать для вас ощутимо дешевле)

Читать полностью…

Чартомойка

Как уместить много линий на одном линейном графике и не превратить его в спагетти чарт. Есть два пути:

📍 1. Убрать полностью цвет и подсвечивать только осознанно выбранную пользователем категорию. Наличие линий серого цвета даст контекст и понимание, в какой части графика находится выбранная линия.

📍2.1 Разместить много линий друг под другом. Такой формат позволяет сравнить тренды между категориями, но в меньшей степени дает контекст разброса значений между другими категориями.

2.2 Сочетать линейные графики с барами. Теперь еще пользуюсь лайфхаком от Sam Parsons, чтобы делать такие графики не через составную таблицу, а единым графиком. Дает возможность посмотреть на топ категорий и проследить динамику каждой.

Всегда можно дать пользователю выбор между разными типами графиков. И помнить, какая изначальная цель – если важно найти категории с наибольшим приростом, то будет проще вывести приросты в формате баров, а дальше дать линейный график для детального анализа каждой категории.

Книжка тут.

Читать полностью…

Чартомойка

😐 Подгорания пост
Недавно в LinkedIn наткнулся на пост, про то, что хватит делать дашборды, они не приносят аналитической пользы.

Меня всегда удивляет это заблуждение, что дашборды вообще как-то напрямую связанны с аналитикой. Люди часто думают, что делая дашборд они создают возможность для анализа, но это не так. Дашборд ≠ Аналитика.

Дашборды — это удобный инструмент для быстрого восприятия данных, но вот анализировать эти данные на дашборде сложно. Обычно максимум, что вы можете получить от дашборда — это увидеть, что какая-то метрика упала, и отследить в какой определенно части бизнеса это произошло. Если сравнивать с современными методами анализа — это довольно поверхностные выводы.

Поэтому, если вы создаете дашборд, будьте готовы к тому, что он не принесет вам инсайты. Создавайте дашборды для оперативных задач — понимать, всё ли окей идёт в бизнесе. А для поиска точек роста бизнеса используйте отдельные аналитические проекты.

Я не согласен с автором, который говорит, что аналитика приносит больше ценности, чем дашборды. Они просто служат разным целям. Проблема возникает тогда, когда аналитические команды считают, что создание дашбордов само по себе будет генерировать новые идеи для развития бизнеса.

П.С. Я пишу и в LinkedIn, и часть контента там пересекается с каналом, а часть нет. Например этот пост не планировал писать в канал, но его английская версия набрала аж целых 24К (уже 65К) просмотров, что меня сильно удивило. Поэтому решил опубликовать и здесь. Присоединяйтес в LinkedIn, если вдруг такое интересно.
#наблюдение #ссылка

Читать полностью…

Чартомойка

Конференция по продуктовой аналитике Aha!’23 пройдет 30 мая в Москве

Практическая конференция по продвинутой продуктовой аналитике и marketplace effiency состоится 30 мая на площадке Центра делового предпринимательства.

Среди спикеров конференции представители крупных компаний: Avito, Яндекс, Тинькофф, Мегафон, МТС, OZON и др. Целевая аудитория — продуктовые аналитики и менеджеры, директора по маркетингу, ML-специалисты.

Ключевые темы конференции: продуктовые эксперименты, a/b-тестирование, модели монетизации, surge pricing, supply & demand balance, ranking and personalization, network effects, экономика и оптимизация.

С подробной программой конференции можно ознакомиться по ссылке

В конференции примут участие более 500 специалистов в области ML-разработки, data science, продуктовой аналитики и управления бизнесом.

По промокоду Чартомойка можно получить скидку 10% на персональный билет

Подробности: matemarketing.ru

#дружескаяреклама

Читать полностью…

Чартомойка

Убедительно, конечно. -0,9% примерно так и выглядят. А заголовок "Еврокомиссия улучшила прогноз по ВВП России в 2023 году".

Читать полностью…

Чартомойка

От студентов в Я.Практикуме на курсе Визуализация данных возник вопрос, можно ли дата-материалы считать объективными.

Попробовал ответить.

Это зависит от желания и возможности быть объективным. Любой график — форма лжи, или в лучшем случае — недосказанности, вызванной выбором того или иного ракурса.
Но можно по возможности стремиться к максимальной объективности. То есть учитывать контекст и вписанность данных и конкретного графика в этот контекст.

Любые данные и их комбинации ограниченно и неполно описывают реальность, но между заведомой манипуляцией/искажением и неизбежной неточностью и неполностью при максимальных попытках учесть разные факторы и контекст — огромная разница. Хотя и в том, и в другом случае можно сказать, что "графики лгут". И в крайних полюсах получится "ложь" и "правда.

Также понятно, что погружаться в данные всё глубже и глубже не только не всегда нужно (а иногда вредно) не только по причине отсутствия времени, но и зачастую потому, что это более глубокое погружение не увеличивает точность и практическую применимость выводов.

Поэтому в идеале аналитик и визуализатор стремится к балансу, когда минимумом ресурсов добывается максимум пользы и эффективности.

Разумеется, мы исходим из пресуппозиции, что аналитик хочет быть объективным и непредвзятым с одной стороны, и стремится исключить другие вероятные объяснения тех гипотез, которые он выдвигает. Объективным и непредвзятым — то есть исключает фактор подгонки выводов под внешние требования или собственные предпочтения. А стремится исключить другие вероятные объяснения — это элементарная добросовестность, из которой должна вытекать стройность и "крепкость" методологии. Но это всё опять же в рамках того же самого баланса между трудозатратами и пользой.

Читать полностью…

Чартомойка

Объявлены победители конкурса World Data Visualization Prize, в котором в этом году участвовали @revealthedata и @analyst_club из нашего датавиз телеграм коммьюнити!

Главный приз на этот раз получила Линдси Поултер (Lindsey Poulter) за свой интерактивный проект по сравнению социально-экономических показателей между различными странами и регионами, и в зависимости от уровня дохода. Рома Бунин @revealthedata получил похвальный отзыв (honorable mention) от жюри, с чем мы его тоже поздравляем!

https://informationisbeautiful.net/2023/the-winners-of-the-world-dataviz-prize-2023/

P.S. Ни и если вдруг вы еще не видели наш проект, который выиграл главный приз в 2019 году — посмотрите и почитайте о его создании!

Читать полностью…

Чартомойка

Визуализируем кофе, молоко и сахар

Как же быстро время летит – уже 1,5 года прошло с момента стихийного конкурса-дискуссии по визуализации пропорций в датавиз-чате (телеграм-чате русскоязычного сообщества визуализации данных). В чате обсуждали, как лучше визуализировать проценты людей, пьющих кофе с сахаром, молоком или без них. Тогда я предложил свой вариант в R:

library(waffle)
coffee_data <- c("Черный с сахаром" = 3, "Черный без сахара" = 17,
"С молоком без сахара" = 20, "С молоком и сахаром (60%)" = 60)
waffle(coffee_data, rows = 10, title = "60% любителей кофе предпочитают\nдобавлять молоко и сахар",
reverse = T, flip = T,
xlab = "1 квадрат = 1% (100 человек)",
legend_pos = "right", size = 0.75, equal = TRUE,
colors = c("#bdbdbd", "#525252", "#fec44f", "#fee391"))

Наблюдения за дискуссией читайте в статье Натальи Киселевой eolay13/визуализируем-кофе-молоко-и-сахар-68fc7079868c">"Визуализируем кофе, молоко и сахар!"

#waffle_chart #визуализация_пропорций #часть_целое #R

Читать полностью…

Чартомойка

Мы ждали этого 10 лет :))

Читать полностью…

Чартомойка

Мы в очередной раз обновили подборку «шрифтов без бюджета» — добавили туда Тильду, Golos Text на Google Fonts и ещё пару шрифтов. 

Что это такое и чем отличается от большинства подборок бесплатных шрифтов: 

👉Это подборка шрифтов с хорошей или хотя бы приемлемой кириллицей — отбором занималась лично Александра Королькова, и в статье можно сразу увидеть шрифт на примере кириллической фразы с самыми каверзными буквами и сочетаниями.

👉Мы внимательно смотрели на условия использования — в разделе бесплатных шрифтов только те, которые можно использовать для коммерческих проектов, а в паре исключений есть пометка, для чего можно, для чего нельзя. В разделах с системными шрифтами и Adobe Fonts написано, как именно лицензия позволяет их использовать.

👉Мы даём ссылки только на официальный первоисточник шрифта или на юридически чистые ресурсы типа Google Fonts, никаких файлообменников или сомнительных сайтов со шрифтами неизвестно откуда.

👉Подборка время от времени обновляется. Если вы знаете хороший шрифт с кириллицей, который можно использовать в том числе для коммерческих проектов, а в подборке его нет — присылайте ссылку, мы добавим :)

Посмотреть подборку можно здесь

Читать полностью…
Subscribe to a channel