13755
Блог о журналистике данных и дата-сторителлинге Ведёт @BlackPineapple — аналитик в службе дата-журналистики Яндекса
Знаете ли вы, что такое докс или вонёнизм?
Коллеги исследовали, какие новые слова интересовали пользователей Яндекса последние 10 лет. На лендинге можно посмотреть сами слова, их расшифровку, а также пройти тест на знание современного сленга:
https://yandex.ru/company/researches/2024/new-words
Т-Банк изучил, кто в России какими телефонами пользуются, и как отличаются траты этих людей
В среднем по России пользователей Android больше, чем пользователей iPhone. Айфоны в основном у людей помоложе и у девушек.
Айфоны преобладают в Москве и почему-то в республиках Северного Кавказа (кто-то понимает причину этого феномена?)
Самый популярный айфон в стране — это iPhone 11, прошлогодний флагман вошёл в топ-5.
По тратам предсказуемое — яблочники тратят больше, чаще ходят по барам и ездят на такси. Хотя судя по тексту исследования, мы наблюдаем тут не «эффект айфона», а скорее различие между городами-миллионерами и остальной Россией. Думаю, я бы при подсчётах учитывал бы разницу в среднем по городам.
https://www.tbank.ru/about/news/09122024-t-pay-research-how-do-iphone-and-android-smartphone-owners-differ-from-each-other-in-russia/
При работе над сложными визуализациями часто нужно вдохновение.
Data Viz Project запустили для этого классный инструмент — Data Viz Inspiration.
1500 интересных визуализаций, кнопочка Random, и вот вы залипли на пару часов.
https://datavizproject.com/inspiration/
Александр Варламов собрал данные сервиса Getmatch об актуальных российских зарплатах в IT
Если верить этим данным, миддлам-аналитикам при выходе на работу в среднем предлагают 210 тысяч. Самую «жирную» зарплату — обещают некому разработчику C++ — 1,6 млн рублей в месяц, есть в подборке и ещё несколько вакансий с потолком выше мульта.
В топе компаний по зарплатам почти всё — неизвестные имена. Из понятного мне внезапно вылез Островок, Звук (стриминг Сбера). Увидел ещё Яндекс, завуалированный как Плюс Фантех.
В общем, изучайте сами. Посмотреть можно на дашборде:
https://public.tableau.com/app/profile/alexandervar/viz/ITVacancies/ITVacancies
Bloomberg пишут, что Америка отстаёт от заявленных планов по климатическим целям — снижению выбросов и переход на возобновляемые источники энергии.
Для иллюстрации тезиса выбран очень нестандартный тип графика, который
1) отделяет реальные данные от прогнозных
2) позволяет сконцентировать внимание на увеличивающемся разрыве
https://www.bloomberg.com/graphics/2024-cop29-climate-change-targets
Запись вчерашних разборов!
Спасибо всем, кто пришёл вчера на стрим! Получилось очень интересно и разнообразно 🙌
Было много просьб выложить запись — делюсь ей с вами. Тут только разборы, запись моего пения пока останется эксклюзивом для тех, кто пришёл послушать вживую 😅
На эфире я также анонсировал основной поток записи на 3-й поток моего курса по визуализации данных «Эстетика в графиках».
На нем вы научитесь делать залипательные, понятные и эстетичные графики, которые будут быстро доносить мысли и помогать в принятии правильных решений. Такой навык точно поможет вам блеснуть на работе и пополнит портфолио.
🔷 Старт — 2 декабря
🔷 Продолжительность — 3 месяца
В результате курса вы:
🟣 Разберётесь как сделать график привлекательным, а также удобным и понятным для читателя;
🟣 Овладеете инструментами визуализации данных (Tableau, Flourish, Figma и другими);
🟣 Узнаете, какой график лучше подходит для вашей задачи, и почему именно он;
🟣 Научитесь дата-сторителингу: поймете, как выстроить графики, чтобы они рассказывали историю;
Разберу ваши графики
Давно не проводили такой формат, а я его очень люблю.
Условия простые, с вас — графики, с меня — предложения, как их улучшить. Или, возможно, я просто похвалю вас, и скажу, что всё круто :)
А ещё можно присылать не свои работы, а просто что-то, что вы видели в сети.
Разбор проведём в среду 20 ноября в 20:00 по Москве прямо тут.
Работы присылайте в эту форму:
https://forms.yandex.ru/u/673b275d49363912ace9eafc/
Антон Мизинов выложил в сеть свой сервис для сбора плиточной карты России
Достаточно приложить свой файл с данными (пример), выбрать цвета, настроить отступы — и можно получить готовое изображение в PNG или SVG.
Раскладка карты из ТАСС — она достаточно сильно отличается от карты, которые используют РИА, Т—Ж, РБК, Медиазона, Datawrapper и прочие медиа. Пока свою настроить нельзя, и для кого-то это может быть минусом.
https://mizinov.pro/tilemapper/
#работы_студентов
Даже серьёзную аналитику можно оформить ярко и привлекательно. Вот так получилось разобраться с экологической повесткой у моей студентки из Люксембурга.
В рамках хобби и волонтерства я интересуюсь вопросами экологии и устойчивого развития. Меня интересует, какие меры страны предпринимают для экологии и адаптации к изменению климата. Решила проанализировать, что делает Люксембург для обеспечения долгосрочного устойчивого развития, используя открытые данные.
Самым трудоёмким этапом была работа с табличными данными: от выбора подходящих датасетов сквозь кривой перевод с французского до подгона их под требования RAWgraphs и Flourish. С выбором вида графиков сложностей почти не возникло: получилось использовать и простенький донат, и Bumpchart. После обучения стало легче понимать, какие виды графиков сразу можно исключить для определенных данных. Как графический редактор использовала фигму.
Мега-инсайдов [от анализа] я не ожидала, и результаты получились достаточно предсказуемые. Решила разбавить эту предсказуемость неоновыми цветами как ассоциацию с энергетикой и инновациями, что достаточно непривычная гамма после корпоративных презенташек. Также пришлось отказаться от специфических терминов, чтобы материал был доступен более широкой аудитории, хотя обычно в таких темах хочется добавить больше профессиональных фактов.
В целом получилось выразить свои знания и интерес к сфере в новой плоскости. Ну и освоить работу с данными через эффективный визуал.
Было огненно 🔥
Поставил сегодня галочку — выступить на главной сцене Матемаркетинга
Спасибо всем, кто выбрал мой доклад! Болтали сегодня с девушкой, которая организовывала конференцию в прошлые годы: она сказала, что было много людей, и далеко не на каждое выступление столько приходит.
Приятно знать, что тема визуализации и красивые истории, построенные на данных, привлекают так много внимания. Буду стараться радовать вас ими и тут!
Как складывался путь Роберта Де Ниро в кинематографе?
Сегодня мы завершили второй поток курса «Эстетика в графиках» и сделали уже традиционную выставку дипломов. В этот раз нагенерили какое-то безумное количество крутого контента — хоть открывай свой Visual Capitalist. Безумно горжусь, что такие классные студенты учились у меня на курсе 🥰
Среди работ у меня есть и свои любимчики, и среди них — работа Дамиры Рейхерд. Ей слово:
Я давно хотела взяться за исследование творческого пути актёров, потому что просмотр и обсуждение кино с друзьями — это одно из моих главных удовольствий!
Готовых данных у меня не было, и я решила собирать их самостоятельно: нашла несколько датасетов на Kaggle, написала пару парсеров, использовала библиотеки под python для получения данных с IMDb и пр. Открытием для меня стало то, что полностью доверять полученным цифрам нельзя: я периодически натыкалась на нестыковки или неполноту. В результате ручная проверка и сопоставление данных из разных источников заняли неожиданно много времени.
Кажется, у меня нетипичный случай: изначально я сама не знала, какую историю хочу рассказать. Даже выбор актёра был практически случайным: несколько вариантов мне предложили товарищи по киноклубу. Но для меня именно в этом ценность моего исследования: в пути от поверхностного знакомства с объектом до полного погружения в его историю. Чем дальше я разбиралась в данных и строила графики, тем больше у меня появлялось идей и тем сильнее я восхищалась своим героем :) В результате успела реализовать только половину всего, поэтому — продолжение следует!
Я использовала практически все инструменты, которые освоила на курсе, — в этом одновременно была и лёгкость («Ух ты! Сколько возможностей!»), и сложность («Что выбрать? Куда податься?»). Очень вдохновила консультация, когда мы показывали свои наброски, и поддержка однокурсников.
Моя работа — это такое радостное желание поделиться своими открытиями. «А вы знали?», «Представляете!», «Я тут такое обнаружила!» Надеюсь, это радость передастся и читателям, а кто-то даже побежит смотреть фильмы с Робертом Де Ниро :)
если вы следили за моим курсом по визуализации данных, вот вам весточка
ближайшую неделю можно записаться на новый поток по самой выгодной цене 👇
Рад, что 2024 год наконец-то ощущается для меня как год оффлайна
В последние годы почти на все конференции подключался по зуму, и энергетика от этого, конечно, совсем не та. От того вдвойне рад, что приехал с лекцией на форум TIME CODE в прошлые выходные.
А уже через неделю — ещё одно живое мероприятие, где можно будет меня послушать: 7 ноября выступлю на Матемаркетинге.
Тема моего выступления:
ДАННЫЕ, КОТОРЫЕ РАССКАЗЫВАЮТ ИСТОРИИ. КАК ПРЕВРАЩАТЬ ТАБЛИЦЫ В ПОЗНАВАТЕЛЬНУЮ, РАЗВЛЕКАТЕЛЬНУЮ И СОЦИАЛЬНУЮ АНАЛИТИКУ, И ЗАЧЕМ ЭТО НУЖНО БИЗНЕСУ
The Pudding продолжают совершать революцию в визуальном сторителлинге
В США каждый штат имеет право установить свою политику относительно абортов, и где-то они абсолютно доступны, а в других штатах надо пройти запутанный путь, чтобы это право отстоять
Так вот, The Pudding решили буквально изобразить сложность совершения аборта в разных штатах в виде лабиринта, и — внимание — надо проходить эти лабиринты, чтобы узнать истории людей из разных штатов 🤯
Такая подача лично меня очень вдохновляет и рвёт все шаблоны. Но что более круто, вот эти сгенерированные лабиринты основаны на реальных данных:
Для расчета сложности лабиринта в каждом штате были собраны, нормализованы, взвешены и объединены данные Института Гутмахера по 28 штатам, чтобы получить оценку сложности. Запреты на аборты были оценены в 10 баллов, а исключения из запрета и конституционные меры — в 5 баллов. Другие стратегии и законы, направленные на ограничение доступа к абортам, были оценены в 2 балла. Другие стратегии в области репродуктивного здоровья, такие как сексуальное просвещение и доступ к средствам контрацепции, были оценены в 1 балл.
Наши расчеты сложности в последний раз обновлялись 17 октября 2024 года и представляют собой краткий обзор по времени. Таблицы могут не отражать текущую ситуацию с абортами в каждом штате из-за продолжающихся юридических проблем, судебных решений и нового законодательства.
Лабиринты были созданы с использованием алгоритма поиска в глубину, их размер и сложность соответствовали баллу сложности.
Очень приятная для глаз визуализация поисковых запросов из Google
Взяли трендовые запросы в поиске США и показали, как сильно отличался в разных штатах интерес к этим запросам.
Отдельного восхищения стоит виузализация в виде изотерм и плавная анимация
https://waves-of-interest.truth-and-beauty.net/topics/
Страшно красивый проект ТАСС про магнитные бури
Недавно видел, как российский биолог и популяризатор науки Александр Панчин разоблачал феномен магнитных бурь — именно из его уст я впервые услышал, что они, вопреки распространённому стереотипу, на самом деле не влияют на самочувствие.
Ожидал увидеть и здесь подобную аналитику, но удивился, что в проекте ТАСС мнение не такое однозначное.
В целом проект в большей степени рассказывает про сам механизм возникновения магнитных бурь, и делает это со вкусом. Иллюстрации, видео, графики — секс 🩷
Полистайте обязательно!
https://spec.tass.ru/magnitnye-buri/
Вы наверняка уже видели анонс конференции «Дата-сторителлинг», которая пройдёт в эту субботу.
На ней много классных спикеров будут рассказывать о том, как использовать данные, чтобы вызывать интерес у публики. Например, год назад я рассказывал про дилемму Тафти и Холмса — один был мастером вызывающих визуальных метафор, другой пропагандировал максимальную строгость и простоту в инфографике.
В этом году я не смог выступить на конфе, но вас — зову! Регистрируйтесь, будет точно интересно 🙌
В Германии более 9 тысяч улиц с названием Lindenstraße (дословно — липовая улица). Все они — на одной визуализации
Как думаете, какая улица в России могла бы с ней потягаться?
koriander/113529613040260508">Источник
Почему все так любят песню Creep?
Выпускники предыдущего потока «Эстетики в графиках» сделали много крутейших работ, но эта — скрывать не буду — моя любимая 🥰
Ольга Хлопкова проанализировала творчество Radiohead и нашла там потрясающую историю, связанную с песней Creep. Особенно здорово получилось воплотить оформление:
В процессе работы я стала замечать, что очень негодую по поводу разрыва в количестве прослушиваний песни «Creep» и других треков. Группа выпускала такие сильные и разнообразные пластинки, а мир знает и слушает только «Creep», песню, от которой меня, лично, тошнит! И оказалось, не только меня!
Почитав интернеты, узнала, что вокруг «Creep» есть история. Песню сначала не приняли в Великобритании, но спустя год она с фурором ворвалась в американские чарты и сердца. В штатах настолько любили эту песню, что бедный коллектив заставили 4 раза подряд её сыграть, чтобы снять лучший ракурс. Люди приходили на выступления Radiohead, требовали «Creep» и уходили сразу после того, как группа ее исполняла.
Первые идеи и наброски инфографики я делала в заметках на планшете и это настолько симпатично выглядело, что было принято решение делать весь проект в стиле скетчей. Частично из-за этого, а также чтобы не перегружать аудиторию сложной инфографикой, в проекте, в основном, я использовала барчарты.
Диаграммы были созданы с использованием библиотеки roughViz, а окончательная сборка и оформление выполнены в Figma.
PS. В этой работе нет громких выводов и открытий, это фановая аналитическая история вокруг песни, которую я не люблю :)
Инфографика про скалолазание!
В качестве дипломного проекта моя студентка Мария Павлова выбрала тему спортивного скалолазания. Оказалось, по этому виду спорта можно найти много интересных инсайтов, которые хорошо ложатся в интересную, разнообразную и местами даже сложную инфографику.
Отдельный респект выражаю за первую пояснительную карточку, которую Мария сама собрала в фигме 🔥
Моя работа — серия карточек со статистикой спортивного скалолазания.
Этот вид спорта недавно стал олимпийским — с Токио-2020, что повлияло на его развитие. Например, большинство спортсменов специализируются более, чем в одном виде скалолазания. А на первых Олимпийских играх выступали только в многоборье — комбинированном зачете трёх дисциплин: то есть во всех сразу, не каждый — в своей. А ещё — с вступлением в Олимпийское движение стало больше рекордов в лазании на скорость.
Также я постаралась отразить интересные паттерны на основе данных. Например, выигрывают первые места и ставят рекорды — как вчерашние юниоры, так и возрастные спортсмены. А в мировом рейтинге «скорости» в топ-30 входят и спецы, то есть спортсмены одной дисциплины, и универсалы-многоборцы.
Захотелось проследить путь отдельных спортсменов: многие известные скалолазы не раз становились победителями и рекордсменами. Так по рекомендации Лёши появился connected scatter plot, где на временной шкале отражены повторяющиеся победы чемпионов мира. Кстати, российские спортсмены довольно успешны в скалолазании ;)
Через час встречаемся в прямом эфире на разбор графиков!
Эфир будет прямо в канале — вы увидите уведомление в верхней части экрана.
В этот раз я задумал эксперимент. Обычно, ожидая, пока люди собираются на эфир, я пробую разные тактики. Иногда мы смотрим интересные работы из мира дата-журналистики, иногда молчим и смотрим друг на друга :)
В этот раз я спою вам пару песен под гитару. Кто хочет это услышать, подключайтесь ровно в 20:00 😁
А этот пост можно использовать для комментариев к эфиру
Осталась ли любовь в песнях про любовь?
В этом пытаются разобраться The Pudding, разбирая песни из Billboard Top 10.
Не желая проспойлерить вам выводы, отмечу лишь то, что, судя по всему, представление любви в музыкальной поп-культуре трасформировалось, стало более многообразным и смелым.
Кстати, это пример классного дата-сторителлинга, когда один набор данных рассматривают с разных сторон, и показывают поэтапно с большим количеством подробностей. И виды графиков можно взять на заметку!
https://pudding.cool/2024/11/love-songs/
Как ест, закупается и спит «синяя» и «красная» Америка
Любопытный анализ опубликовали в The New York Times. Там придумали скрестить данные об организациях и результаты выборов в США. Так открывается интересный взгляд на мнение о том, что типичный «синий» и типичный «красный» избиратель живут совершенно в разных мирах.
Так, в районах, где победили демократы, на одного избирателя приходится больше коктейльных баров, Starbucks, студий йоги и буддистских храмов. В республиканских районах больше мормонских цервкей, магазинов оружия и бейсбольных полей.
Авторы справедливо указывают, что по любви к бейсболу, йоге или религии нельзя прямо говорить о политических предпочтениях человека, и что многие связи банально произрастают из характера местности, где расположены более демократические или более консервативные районы. Так, более демократическими считаются крупные города, а более консервативными — небольшие поселения. Однако публикация все равно заставляет задуматься, в каких разных условиях живут два противостоящих друг другу клана.
https://www.nytimes.com/interactive/2024/11/04/upshot/place-politics.html
Вероятно, для просмотра потребуется подписка, режим инкогнито или расширение Bypass Paywalls
Два объявления от редакции статистики Т—Ж
1. Отдел ищет новых авторов текстов! Нужен человек с опытом в дата-журналистике, который будет анализировать данные о России, искать там выводы и писать об этом тексты.
Оплата сдельная — платить будут по количеству написанных статей. Совмещать можно с основной работой.
https://journal.tinkoff.ru/author-stat/
2. Объявление для дизайнеров (любых)
Коллеги собирают информацию о зарплатах, чтобы обновить своё классное большое исследование
https://journal.tinkoff.ru/opros-pro-zarplaty-dizainerov/
Прошедшим обещают подарки, а результаты будут полезны всему сообществу
На Матемаркетинге DataLens сделали очень эстетичный квиз на знание правил визуализации данных
Не все ответы на карточках счёл однозначно верными, но идея и оформление — огонь 🔥
Открываю предзапись на третий поток моего курса по визуализации данных «Эстетика в графиках»
3 месяца будем учиться делать залипательные графики, которые помогут убедительно донести ваши выводы аудитории.
В результате курса вы:
🟢 Научитесь делать визуализации, которые будут сразу понятны коллегам и начальству. Вопросов «а что тут имелось ввиду» станет кратно меньше;
🟢 Поймёте, как выстраивать из графиков историю;
🟢 Получите профессиональное преимущество, ведь любой заказчик любит, когда «красивенько»;
🟢 Овладеете инструментами визуализации данных: Tableau, Flourish, Figma и другими;
А ещё вас ждет работа над вашим собственным проектом, где можно будет включить внутреннего исследователя, покопаться в данных и сделать инфографику, которая станет украшением для портфолио.
Вот несколько примеров итоговых проектов:
раз, два, три, четыре
❗️По предзаписи — самые большие скидки, тариф с обратной связью стоит 24 900 вместо35 000 руб.
Вы можете оплатить полную стоимость, а можете забронировать место и цену. Чтобы забронировать место и скидку, нужно внести предоплату — 1000₽.
Предзапись будет открыта до 11 ноября включительно. Есть рассрочка на срок до 12 месяцев, по ней ваша переплата — 0 руб.
Washington Post рассказывают об интересном когнитивном искажении, связанном с американскими выборами
Социологическая служба YouGov провела опрос, в котором спрашивала американцев об их отношении к разным предвыборным обещаниям обоих кандидатов, не раскрывая кто именно был автор этого обещания.
Оказалось, что инициативы Харрис значительно обходят по степени поддержки инициативы Трампа — такой разницы даже близко нет в опросах общественного мнения.
Изумляет и то, что избиратели вообще зачастую путают, кто из кандидатов продвигает определённые тезисы: например, одни из самых популярных инициатив Харрис в области закона и правопорядка опрашиваемые приписывали преимущественно Трампу. Всё-таки грамотный пиар очень важен!
Разобраться в теме можно тут:
https://www.washingtonpost.com/opinions/interactive/2024/trump-harris-policy-quiz/
Вероятно, для просмотра потребуется подписка, режим инкогнито или расширение Bypass Paywalls
Я практически никогда не шерю здесь вакансии, не связанные прямо с дата-журналистикой, но тут — случай особенный.
Летом я был в гостях у команды продукта Яндекс Лавки. Это те ребята, которые придумывают разные классные фишки, улучшающие пользовательский опыт: например, они внедрили возможность добавлять товары в корзину после оформления заказа и получать заказы из аптек. Список главных фич, которыми они занимались в прошлом полугодии, можно посмотреть в карусели.
Тогда же мы познакомились с CPO Лавки Никитой Толстым. Никита — классный спикер, очень энергичный и умеющий вдохновлять человек. Убедиться в этом можно посмотрев любое из его выступлений.
Никита очень просил меня пошерить вакансии в свою команду. Там есть места для аналитиков, продактов, дизайнеров, разработчиков и даже для тех, кто очень хочет в Лавку, но не видит подходящей позиции.
Просьба от меня: Если нашли что-то подходящее, кидайте своё резюме, контакты и желаемую вакансию лично мне. Я проведу вас через программу рекомендаций: вы получите возможность быстро достучаться до рекрутёров и пинговать их через меня, а я, если вас в итоге возьмут, — получу бонус.
Кстати, получше познакомиться с командой можно тут: @lavka_product_team
Уже слышали о крупнейшей BI-тусовке этого года?
⚡️14 ноября в Москве пройдёт РУBIКОНФ — конференция лидеров российского BI, где соберутся все, кто двигает индустрию вперёд: топовые спикеры, ИТ-директора, руководители BI крупных компаний и независимые эксперты.
Классная возможность для всех, кто интересуется новыми подходами в BI. Если вы хотите узнать, как работают лучшие решения, найти идеи для своих проектов или просто пообщаться с единомышленниками, это мероприятие точно стоит посетить.
Почему нужно занести это событие в свой календарь?
📎Сильнейшие участники рынка на одной площадке: VK Cloud, AW BI, Loginom, Glowbyte — это только часть тех, кто представит свои стенды и доклады.
📎Реальные кейсы: услышите истории внедрений от компаний, которые уже прошли путь импортозамещения и добились результатов.
📎Пространство для новых идей и партнёрств: здесь вы сможете встретиться с ключевыми игроками, наладить контакты и обсудить стратегические проекты.
📎Подарки — мелочи, а приятно! Кто не любит сюрпризы?
Конференция — это место для новых идей и партнёрств. Вы сможете задать вопросы, обсудить проекты и наладить контакты с ключевыми игроками в сфере BI. И если вы всё ещё в поиске BI-системы для своей компании — вам точно стоит побывать на РУBIКОНФ! Конференция мультивендорная, будут разные платформы и решения, так что каждый найдёт что-то своё.
Мест всего 500, поэтому успейте зарегистрироваться. Если не получится прийти, подключайтесь онлайн.
🔗Регистрируйтесь прямо сейчас на сайте — всего пара кликов, и вы в деле!
Реклама. Рекламодатель АО «ОСТ»
ИНН: 9709108924
ищу героев датавиза
хочу в своём втором канале писать интересные истории о том, как визуализация данных помогает в жизни. и здесь лучше всего подойдут ваши живые истории!
так что если вы —
🟣с помощью графика убедили заказчика или руководителя;
🟣подготовили классную визуализацию и выступили с ней на конференции;
🟣получили авторитет у коллег и просьбы научить делать так же;
🟣собрали много просмотров в соцсетях;
🟣смогли объяснить какую-то сложную концепцию, которую раньше никто не понимал;
🟣получили оффер в компанию метчы;
... или сделали что-то ещё, что считаете своей маленькой победой,
напишите мне в личку, коротко упомянув ваш кейс!
пообщаемся :)
контакт: @BlackPineapple