О графиках: плохих, хороших и других. От восхищения до ненависти — один chart. Заметили подозрительный график, присылайте — @bogachev11
Как показать 150 лет развития газет за 55 секунд?
Перед вами 60 000 (шестьдесят тысяч) первых полос Нью-Йорк Таймс. Художник Джош Бегли собрал визуальную хронологию изменения подачи новостей. Медитативное, наталкивающее на множество мыслей, видео.
Добавлю немного текстовой хронологии:
11 декабря 1861
«Нью-Йорк Таймс» публикует свои первые иллюстрации на первой странице. Одна из них — карта Вирджинии, а две другие — политические карикатуры, насмехающиеся над Джеймсом Гордоном Беннетом, основателем «Нью-Йорк Геролд», одного из главных конкурентов «Таймс».
15 апреля 1865
На первой странице колонки были обведены черным, так как сообщали об убийстве Линкольна.
10 февраля 1897
На первой странице появлется слоган «Все новости, которые стоит печатать»
30 мая 1910
На первой странице появляется первая новостная фотография — фото летчика Гленна Кертиса, который летит из Олбани в Нью-Йорк с скоростью 87 километров в час.
1 мая 1926
NYT печатает первую фотографию, «радиопереданную» в газету из Лондона. До этого дня фотографии пересылали по почте. Время передачи: 1 час 45 минут.
21 июля 1969
Первое использование шрифта размером 96 пунктов на первой странице. Передовица посвящена посадке «Аполлона-11» на Луну. Этот крупный шрифт также будет использоваться для объявления об отставке Никсона, первом дне 2000 года, 11 сентября и выборах Обамы.
7 сентября 1976
Колонки на первой странице становятся шире, уменьшая их количество с 8 до 6.
16 октября 1997
На первой странице NYT печатается первая цветная фотография.
#дата_сторителлинг
#визуальные_истории
#так_тоже_можно
Почему ваш дашборд не должен быть идеален
Прекрасный Andy Kriebel написал статью, посвященную MVD — по аналогии с MVP — дашборд минимальной полезности!
В целом, идея мне нравится. Без регулярной обратной связи от заказчика легко можно сделать что-то крайне законченное, но совсем не в ту сторону! Кто не грешит таким?? 😁
Вот вам краткое содержание статьи.
MVD — это самая простая версия дашборда, которая все же предоставляет основную ценность.
Она полностью сосредоточена на ключевых метриках и инсайтах, которые критически важны для ваших целей, без отвлечения на второстепенные функции.
Почему MVD лучше идеального дашборда
🔵Быстрые инсайты
MVD позволяет получить ключевые данные быстрее, не дожидаясь создания идеального дашборда.
🔵Разработка на основе обратной связи
MVD сразу получает отзывы пользователей, что помогает улучшать дашборд в следующих версиях.
🔵Избежание «паралича анализа»
MVD помогает сосредоточиться на важном, не застревая в бесконечном планировании.
🔵Легкость адаптации
MVD проще адаптировать к меняющимся приоритетам и новым данным.
🔵Эффективное использование ресурсов
MVD экономит время и деньги, фокусируясь на главном.
Как создать MVD:
🟣Определите 3-5 ключевых метрик.
🟣Выберите простые визуализации.
🟣Вовлеките пользователей как можно раньше.
🟣Улучшайте дашборд итерационно.
Главное — не стремиться к идеалу, а создать полезный инструмент, который можно улучшать со временем.
Статья
Кручу верчу, запутать хочу...
Давно я такого запутанного графика не видела. Одд-студия делает переделку графика о температуре и осадках в одном из регионов Бразилии.
1) По первому графику понять можно примерно ничего. Этот тот, где зеленые точки сверху. И если не вдумываться, что вроде бы что-то падает. Что падает? Температура? Ну и славно, а то жара в Бразилии - это небезопасно. Точно падает? Куда? Откуда?
2) Меняем местами оси - теперь все как-то не так радужно, или ничего не поменялось? Все еще это трудно объять разумом. Самое мозгодробительное в этом графике это шифровка лет цветом. Так что не скажу, что 2 версия мне нравится больше 1й.
3) На третьем шаге начинает происходить уже что-то более адекватное, но на арену под музыку выходят двойные оси!.. Только мозг немного расслабился, как нате вам - слева красное, справа синее. И смотри не перепутай. Слава богам - время теперь на оси Х.
4) Последняя версия, видимо финальная часть переделки - заставляет плакать-плакать, танцевать-танцевать...
Теперь у нас не 2 оси Y, а одна, зато мутировавшая где-то в районе 750 из градусов в миллиметры. ПАМАГИТИ...
Трустори!
🟣Насколько вы пострадали морально после просмотра этих графиков от 1 до 10 - напишите в комменты. 😭😭😭✨
Независимое исследование онлайн-курсов по аналитике
Все новое — хорошо забытое старое. Мы уже проводили исследование в далеком 2021 году и, кажется, пришло время обновить результаты. Поменялось все — мир, сфера и даже мы уже другие… (здесь должна быть меланхоличная музыка)
В общем, снова взываем о помощи и просим вас пройти опрос и оставить свое мнение —хорошее, плохое, главное, не безразличное!
Результатами в виде красивого дашборда мы обязательно поделимся в самое ближайшее время. Дату называть не будем, вдруг сглазим 🤣
Важно!
Мы будем принимать ответы до 19 сентября включительно, поэтому не откладывайте это дело в долгий ящик.
И чтобы смотивировать вас сделать это быстрее, за прохождение мы дарим подборку бесплатных материалов на русском и английском языках про дата-аналитику, SQL и не только.
🔜 Еще раз — ссылка на опрос.
P.S. Репосты среди коллег или друзей из аналитики не возбраняются, а только приветствуются 👀
GlowByte совместно с DataYoga и FanRuan запускают онлайн-ретрит по работе с BI-инструментом FineBI! 🐲
10 дней теории, практики и вдохновения от ведущих российских компаний. Узнайте о возможностях анализа и визуализации данных в FineBI, а также получите практические советы по оптимизации BI-практики от GlowByte.
Программа подходит для всех, кто работает с данными, от разработчиков до руководителей.
Что вас ждет:
Инсайты от таких компаний как Tele2, Уралсиб, Циан и других
Практические задачки от экспертов GlowByte
Общение в чате марафона и ежедневные встречи в эфире
Стартуем 16 сентября! 🧘♂️
Регистрируйтесь по ссылке.
Протестировал новую килер-фичу Datawrapper — плагин для PowerPoint.
Подхватывает все ваши графики из сервиса, позволяет убрать заголовок, позволяет сделать подложку прозрачной: ну сок?
Интерфейс максимально простой, мучаться с подгонкой размера не нужно. Плагин есть в двух версиях: статика, а есть интерактив
Интерактивные графики работают только с интернетом, а статику можно сохранить в любом формате и показывать даже в глухом лесу.
Единственная ложка дёгтя: шрифты на графике менять можно только в платной версии, а она стоит недёшево. Но кажется, большинство офисных работников и без этого проживёт.
Напомню, что у Flourish подобная интеграция есть с сервисом Canva, но простите, где Canva, а где — PowerPoint...
Саму идею сделать накопленную столбчатую можно только приветствовать. И цвет тоже функционален (хотя и не color blindness friendly). И вместо легенды прямые подписи. Прямо всё довольно грамотно.
Но вот сами столбики немного (много) не точно соответствуют заявленным значениям. Из-за чего довольно позитивное явление (больше половины успешных проектов) выглядит не столь позитивно при взгляде на картинку. Потому что график прямо говорит, что неудачных и проблемных проектов сильно больше.
#разборыграфиков
Всё-таки нет ни одной вещи в мире, которая может заставить вас почувствовать возмущение, ярость, беспомощность и отчаяние одновременно, чем попытки выровнять по левому краю подписи в линейчатой диаграмме в PowerPoint и Excel. Меняются версии Виндоуз и Офис, но всё остается неизменным. Ты нажимаешь на кнопочку "влево" и подписи размещаются хаотически!
Однако найден костыль, который позволяет это исправить. Да, он лишает возможности автоматически менять данные для этого графика, но это хотя бы что-то!
В общем, идея в том, чтобы скопировать график, вставить его как SVG, а затем разгруппировать и потом уже выровнять подписи по левому краю. Затем вернуться на график, удалить штатные подписи, и вставить svg-шные.
Всё это предполагаю сработает только с PowerPoint 2016, так как именно там появилась поддержка SVG.
Подробности в этом туториале: https://www.youtube.com/watch?v=pD9Q438qa34
UPD. В комментариях еще более гениальный лайфхак, который позволяет и исправлять подписи в исходном графике
Мне написала Таня Цвирова, когда-то моя студентка, а позднее коллега, с которой мы вместе работали над курсом по визуализации данных для Яндекса.
Таня в 2021 году обращала внимание Кинопоиска на ту же проблему. Правда тогда график был еще хуже (с дискретной осью времени). И пришла к примерно к тому же решению — точечной диаграмме с полупрозрачными точками.
Как аналитику выгрузить, обработать и проанализировать данные за пару минут?
Сделать SQL-запрос к базе данных.
Научитесь писать такие запросы за 1,5 месяца — на курсе Яндекс Практикума. После учёбы вы будете пользоваться SQL уверенно: пройдёте от самых простых селектов до работы с оконными функциями.
На курсе вас ждут:
◾️ видеоуроки,
◾️ симулятор с реальными рабочими задачами,
◾️ вебинары с экспертами по SQL,
◾️ тренажёр с задачами для практики.
На курсе можно будет набить руку, потренироваться, задать вопросы наставнику. Материал идёт от простого к сложному, так что к концу учёбы студенты уже думают на языке SQL-группировок.
→ Записывайтесь и растите конкурентоспособность
Это часть работы Ивана Кесорецких, научным руководителем которой был ваш покорный слуга. Для своей магистерской Иван сделал буклет про гестационный сахарный диабет.
Заболевание развивается во время беременности и заканчивается с рождением ребенка. Ежегодно в мире регистрирую около 200 000 случаев гестационного диабета — около 5% всех беременностей.
Но треть женщин не проходят тестирование на гестационный диабет — в том числе и потому, что почти ничего не знают о заболевании и сопряженных рисках. Поэтому Иван вместе с консультантом-эндокринологом придумали такой информационный буклет.
Как использовать визуализацию данных для научно-популярного контента, мы с коллегами учим в магистратуре «Научная коммуникация» Университета ИТМО. А еще рассказываем как:
• продвигать научные организации
• писать научпоп-статьи
• придумывать и воплощать в жизнь просветительские проекты
• работать с медицинскими и IT-компаниями.
Сейчас в магистратуру ведут новый набор. Приходите 25 июля на онлайн-митап — здесь узнаете про саму программу, вступительные и о том, как ChatGPT помогает в подготовке научпоп-контента.
📈Как графики спасают жизни
На бывшего президента США Дональда Трампа совершено покушение во время предвыборного митинга в городе Батлер в Пенсильвании. Во время выступления Трамп повернулся, чтобы указать на график и описать, что было на экране, когда раздались выстрелы.
Если бы я не указал на этот график и не повернул голову, чтобы посмотреть на него, пуля попала бы мне прямо в голову
This is illegal migrants coming into our country. See the arrow on the bottom? That was my last week in office. That was the lowest number in history. // Это нелегальные мигранты, прибывающие в нашу страну. Видите стрелку внизу? Это была моя последняя неделя в должности. Это был самый низкий показатель в истории//
🏆 Друзья, а не хотите ли получить в подарок любую мою книгу? А хотите!
Тогда бегите на канал гражданки Марии Гришиной (@BISupplyBA) /channel/Design_PowerBi/459, сделайте ей какой-то там супер-пупер отчет в PBI с WOW-эффектом и получите в подарок любую из переведенных мной книг. Даже две! Конкурс продлится до 21 июля. Не подкачайте!))
Ну и продолжайте заходить в гости к моему боту @alexanderginko_books_bot и следить в онлайне за переводом очередной моей книги. Он без вас скучает... А скоро мой бот пополнится новыми возможностями!..
Но иногда прямые метафоры и цветовое кодирование всё же имеют смысл 😃
Читать полностью…Fathom — компания Бена Фрая (Ben Fry), одного из авторов Processing — выкатили супер быстрый инструмент для анализа CSV файлов Excel-таблиц прямо в браузере под названием Rowboat.
Попробовал открыть файл на 500 мегабайт, и это заняло всего несколько секунд! Интерфейс тоже супер быстрый, за что отдельный респект.
Интересно, что под капотом. У меня есть догадки, но до конца докопаться не смог.
https://rowboat.xyz (бесплатно, но нужно зарегаться даже что бы пример посмотреть)
@dataviznews
О, как классно!
Это давно назревшая опция.
/channel/data_csv/1490
Имея высшее медицинское образование, опыт работы врачом, выступления на конференциях позволил себе пересобрать свой курс для врачей. Если среди нас есть такие, и вы хотите прокачать навыки презентаций на основе данных, велкам 👇🏻
/channel/scicomm/903
Так и знал что в новом рейтинге 100 величайших обложек музыкальных альбомов по версии Rolling Stone на первом месте будет Joy Division
Источник
Помню легендарный марафон по Tableau. Теперь вот и по FineBI подъехал, думаю, должно быть полезно 👇🏻
Читать полностью…Datawrapper завезли в PowerPoint (см. туториал). Теперь нельзя оправдывать свои отвратительные графики тем, что "я графики в PowerPoint рисовал, поэтому надо понять и простить" %)
#datawrapper #PowerPoint
👇🏻 Хорошая схемка, логически раскладывающая процесс создания дэшборда и то, на какие вопросы в процессе нужно ответить.
/channel/revealthedata/1278
За последние 3 года я отревьюила уже больше 3000 разных студенческих работ. И очень часто ошибки одинаковые и связаны с попыткой усложнить то, что можно сделать сильно проще. Собрала все простые советы, такой DataViz 101 в статье с примерами 🎓
1. Начните с базы и сделайте ее идеальной – научитесь работать с барчартами и линейными графиками, начните с простых, но понятных дэшбордов.
2. Не усложняйте. Меньше цвета, один шрифт, меньше шума на графиках.
3. Выучите подходящие типы графиков под каждую задачу.
4. Не забывается про отступы и пустые места.
5. Научитесь применять правило близости и схожести.
Подробные посты в BI Bites рассылке, лайк сабскрайб, буду правда очень рада💜
И наконец тоже довольно интересная версия от Артема Иволгина (2020-й год). Интересный ход, где размером показано число голосов. Я бы взял на вооружение, как раз способ показывать более и менее популярные фильмы.
/channel/gizhru/337
Обнаружил удивительно неинформативные графики, на которые ежедневно смотрят десятки тысяч людей, а возможно и больше. Это графики рейтинга фильмов определенного режиссера или актера на Кинопоиске. Это график, где подряд идут много оранжевых столбиков, а по оси X нет ничего конкретного, это просто столбцы по порядку. При этом наводя на отдельные столбики можно узнавать какой именно это фильм и в каком году выпущен. Что крайне недружественно с точки зрения пользовательского опыта.
Сначала я решил сформулировать, какие задачи я хочу этими графиками решать.
1. Насколько в целом крутые фильмы, которые снимал этот режиссер или в которых играл этот актёр.
2. Можно ли распознать этапы подъема или спадов у этого человека, в какие годы они были.
3. Можно ли распознать этапы активности (много фильмов) или спада (мало фильмов)
4. Увидеть ритм съемки (несколько лет активно снимает(ся), потом отдыхает, или снимает раз в 5 лет).
5. Какие именно фильмы самые крутые у этого режиссера или самые слабые из известных (для этого еще нужна метрика популярности/известности фильмов, в моем датасете ее исходно не было).
Плюс это разумеется должно работать корректно на мобилках и строиться автоматически. Возможность интерактивности я бы оставил, но все основные задачи график должен решать и в статике.
В итоге, поэкспериментировав с разными визами (пчелиный рой смотрелся неплохо!), я получил следующий результат, в котором все перечисленные задачи решены.
Некоторые нюансы:
— В процессе возникло достаточно много сложностей, в частности, потребовалось решение того, что в один год могло быть много фильмов и рейтинг у каких-то из них мог быть похожим. Сейчас решено прозрачностью кружочков, но можно еще покастомить.
— Цветовая шкала общая для всех фильмов. Она выстроена от 3 до 9, где 6 — середина между красным и синим. Таким образом, привыкнув смотреть эти графики можно будет с одного взгляда видеть, насколько крутые фильмы (или не очень) у этого киноперсонажа, а это и было основной задачей.
— То, что ещё помогает это решить — сохранение общей шкалы Y от 0 до 10. По общему расположению точек также можно будет считывать "крутость" фильмов
— Линия тренда решает проблему сглаживания данных и наглядно показывает как менялся уровень фильмов. Хотя над методологией ее расчета еще можно подумать.
— Над расположением лейблов и их оформление нужно еще подумать, сейчас они не оптимальны. В определенных случаях, если фильм известный, но места вокруг мало, его все равно стоит показывать, либо с небольшой выноской, либо с легкой обводкой или на полупрозрачной плашке. Самих фильмов я бы подписывал меньше (это сейчас стандартные настройки Tableau)
Это первый подход к снаряду, и разумеется, здесь большое пространство для улучшений, изменений и развития.
P. S. На графике сейчас продюссесркая ипостась Копполы, а не режиссерская.
/channel/ne_znal_ai/1929
👇🏻Сразу мысль, а что если эдакую вещь к столбикам попробовать применить 😈
Написал для Т—Ж ещё одну статью о том, как можно манипулировать восприятием при помощи графиков
На этот раз речь пойдёт про линейные графики и проблемы, которые с ними связаны
Очень понравилось, какой у нас получился материал
Почитайте и вы :)
https://journal.tinkoff.ru/stat-manipulation-line/
На прошлой неделе долго дебажила свой же отчет, потому что поленилась в первый раз нормально все сделать 🥲
Сгруппировала лучшие практики разработки в Tableau, чтобы на такое не натыкаться:
1. Называйте все поля понятно и читабельно. Используйте общепринятые сокращения.
- Не Sales (2), а Sales Last Year
- Если в калькуляции параметр, w param
- Стандартизируйте часто используемые калькуляции и параметры (MoM/YoY; Split b)
2. Разбивайте сложные калькуляции на несколько калькуляций. Не пытайтесь впихнуть все в одну, а внутри пользуйтесь отступами и переносом строки.
3. Группируйте поля в папки.
4. Нумеруйте поля и калькуляции, если их много и по логике они зависят друг от друга.
5. Добавляйте комментарии. Особенно к неочевидным техническим калькуляциям или с разными исключениями и логическими зависимостями.
6. В название листов добавляйте названия графиков и о чем он.
7. Цветовое кодирование. Присваивайте листам с графиками тот же цвет, что и табе с дэшбордом.
👉Детали тут
«Основы визуализации данных» Клауса Уилке
Наконец-то вышел русскоязычный перевод книги Клауса Уилке «Основы визуализации данных» — это настоящая кладезь знаний для всех, кто хочет овладеть искусством и наукой визуализации данных. Автор, профессор интегративной биологии, обладает уникальной способностью объяснять сложные концепции простым и доступным языком, что делает книгу полезной как для новичков, так и для опытных специалистов.
С самого начала Уилке подчеркивает важность правильного отображения данных. Он отмечает, что визуализация данных — это не просто способ сделать отчеты более красивыми, но и мощный инструмент для анализа и коммуникации, способный существенно повлиять на интерпретацию информации. Автор проводит читателя через все этапы создания визуализации, от выбора правильного типа диаграммы до настройки осей и использования цветовых схем.
Одним из главных достоинств книги является ее структурированность и систематичность. Каждая глава посвящена отдельному аспекту визуализации, начиная с базовых принципов и заканчивая более сложными техниками. Например, глава, посвященная цветовым схемам, предоставляет исчерпывающие рекомендации по выбору и использованию цветов, учитывая как эстетические, так и функциональные аспекты. Уилке подробно объясняет, как различные цветовые схемы могут влиять на восприятие данных и как избежать распространенных ошибок, таких как чрезмерное использование цветов или недостаточное внимание к людям с дальтонизмом.
Большое внимание уделяется также выбору правильных типов диаграмм для различных типов данных. Автор приводит множество примеров, показывая, какие визуализации наиболее эффективны для представления количественных, категориальных или временных данных. Практические советы и примеры помогают читателю лучше понять, как применять теоретические знания на практике.
Все графики в книге подготовлены с помощью R и ggplot2, но вы не найдете ни строчки кода в книге. Можно отдельно посмотреть код самой книги, так и отдельных графиков.
Похвалы заслуживает глава, посвященная распространённым ошибкам в визуализации данных. Уилке подробно разбирает типичные ошибки, такие как избыточное использование трёхмерных графиков или отсутствие контекста, и предлагает практические решения для их избегания. Это делает книгу не только учебным пособием, но и ценным справочником, к которому можно обращаться в процессе работы.
В целом, «Основы визуализации данных» Клауса Уилке — это обязательное книга для всех, кто работает с данными и хочет научиться представлять их максимально эффективно и понятно. Книга сочетает в себе глубокие теоретические знания и практические советы, что делает её незаменимым инструментом для анализа и визуализации данных. Она помогает не только создавать красивые графики, но и делать ваши данные понятными и убедительными, что особенно важно в эпоху информационного перегруза.
#книги #dataviz #R #ggplot2 #ВизуализацияДанных