13755
Блог о журналистике данных и дата-сторителлинге Ведёт @BlackPineapple — аналитик в службе дата-журналистики Яндекса
«Вёрстка» пишет, что интерес к сериалу «Слово пацана» в Яндексе сейчас выше, чем даже к очень крупным политическим событиям
«Слово» и правда сейчас — везде. Но есть проблема — я подозреваю, что большая часть поискового интереса к сериалу наверняка содержит его название.
А вот новости про войну, если и ищут до сих пор, то скорее через указание подробностей — например, «Зеленский Байден», «мобилизация», «Авдеевка». Десяток таких тем в сумме легко обгонят запросы «СВО» или «Война в Украине».
В комментариях к посту издания очень верно отметили, что поисковый интерес слабо отражает настоящую заинтересованность людей в чём-либо. Скоро начнётся третий год войны — реально интересующимся уже давно не надо вбивать в поиске такие общие запросы.
В общем, на мой взгляд, картинка эта ни о чём не говорит.
Любопытный пример использования генеративных нейросетей в визуализации данных
Студия CLEVER°FRANKE решила проиллюстрировать данные о лесах на планете с помощью целой цепочки нейросетей — сначала там использовали ChatGPT-4, потом Midjourney, потом Stable Diffusion, потом снова ChatGPT, а ещё тренировали какую-то собственную модель.
В общем, от описания процесса лично у меня уже голова пошла кругом.
А как вам результат?
Подробности:
https://www.instagram.com/p/C0jfnmSImjj/
Астрологи объявили неделю выступлений на конференциях
Завтра выступаю в онлайн-студии на главной технологической конференции Яндекса. Буду просвещать там широкую аудиторию о том, какие исследования можно создавать на основе данных, и чем конкретно занимается команда Исследований Яндекса.
Как посмотреть: на сайте ищете большую кнопку «Смотреть трансляцию», оказываетесь в разделе Live. Это оно!
Мой блок планируется в 16:30. Буду рад увидеться ☺️
В продолжение нашего знакомства
Яндекс наконец-то выпустил эпизод подскаста «Войти в айти», где техноблогер Сергей Романцев и студент Вышки Арсений Бородулин спрашивают меня, чем занимаются дата-журналисты, и как я в своё время искал работу.
Рассказываю там, как вообще так получилось, что я стал заниматься дата-журналистикой и делюсь неочевидными лайфхаками, как можно выстраивать свой карьерный путь.
Вообще это проект Яндекс Образования, который ориентирован в первую очередь на школьников и студентов — поэтому обсуждаем мы разное: например, пытаемся разобрать мифы об айти или придумать свой стартап. Но надеюсь, что вам будет интересно 🙌
Лично я бы выбрал видео-версию и смотрел бы на скорости 1,25. Но сам подкаст доступен и на всех традиционных площадках.
Видео:
https://www.youtube.com/watch?v=QYeAqbDb7iQ
Аудио:
https://voyti-v-it.mave.digital/ep-9
Хороший пример, как избавиться от «лапши» на графиках.
«Лапша» — это запутанная кучка линейных графиков (слева), в которой невозможно разобраться.
Способов борьбы с этим явлением несколько, всё зависит от вашей цели. Оставлять так — точно нельзя. Единственное исключение — это интерактив, но и тогда стоит по умолчанию предусмотреть состояние, в котором график о чём-то говорит.
Если действительно важно показать динамику каждого из объектов, лучше всего делать это на отдельном графике. Как сделали РБК (справа).
Какие проблемы мешают вам красиво визуализировать данные?
В последнее время мы много общались с подписчиками (спасибо всем, кто согласился!). И пытались узнать — что именно мешает вам делать красивые графики.
Основные сложности были такие:
❌ Проблемы с данными — трудно найти, трудно привести в нужную форму. И качество исходных данных — шлак.
❌ Нет понимания, какой вид визуализации подходит для вашей задачи
❌ Нет понимания, как работать с элементами диаграммы и как упорядочить их, чтобы было «красиво»
❌ Не знаете, какой инструмент использовать, чтобы сделать график. Или знаете — но плохо им владеете.
❌ Не знаете, какие приёмы использовать, чтобы ваш график выделялся и привлекал внимание
Напишите в комментариях, есть ли еще какие-то проблемы, которые мешает вам делать ваши графики понятными и красивыми?
Давно мечтал сделать датавиз в виде нот, но тут меня опередили.
Бразильское издание пишет об итогах премии «Грэмми» и говорит, что Бразилия становилась победителем конкурса всего три раза. Ну а на графике — количество номинаций на конкурсе. Красный квадратик означает отсутствие номинаций.
Как вам?
Нравится? (🔥) или слишком странно? (🤯)
https://www1.folha.uol.com.br/ilustrada/2023/11/no-grammy-latino-brasil-so-tem-5-dos-indicados-aos-quatro-premios-principais.shtml
🔥 Live-интенсив: разбираем тестовое задание в OZON на junior-аналитика!
Реклама. ООО "Айти Резюме". ИНН 4025460134. Erid:LjN8KLY1H. Текст клиента
📣 Всем привет! Хотим пригласить вас на интенсив, где мы в прямом эфире будем разбирать настоящее тестовое задание в OZON на аналитика данных!
Нам предстоит провести аналитику продаж и доставок с помощью Pandas в Python, а также проиллюстрировать это все графиками.
📅 Дата: 22 ноября
🕘 Время: 19:00 по Мск
Что будем делать на интенсиве:
◾️ Проанализируем заказы пользователей по retention, времени доставки, сумме заказа т.д.
◾️ Научимся легко генерировать большой DataFrame с синтетическими данными
◾️ Посчитаем описательные статистики
◾️ Изучим полезные фичи Pandas: apply, map, pct_change и др.
◾️ Построим интерактивные графики с помощью Plotly
◾️ Научимся строить и читать необычные графики - например, violinplot
Интенсив подойдет всем — от новичков до тех, кто уже знаком с Python.
В прямом эфире мы также расскажем о частых ошибках новичков и поделимся лайфхаками — как достойно пройти собеседование и удивить ревьюера крутыми фишками 🤩
А вы готовы бустануть свои знания и скиллы в аналитике?
👉🏻 Зарегистрироваться на интенсив
Тут в комментариях к кейсу с корью спрашивали, что делать, если значения настолько маленькие, что их вообще не видно.
Вот один из вариантов, который мы когда-то делали в Т—Ж: можно отдельно зазумить область, которую нужно рассмотреть более детально. Но и оригинальный масштаб тоже сохранить — чтобы отчётливо была видна драматичная разница
Вот такой график опубликовало издание «Медвестник», чтобы рассказать, какая страшная в России ситуация с корью.
Вообще в нём прекрасно всё. Прямо кандидат на конкурс отвратительных графиков — только сравните числа в 2015 и 2016 году. Но дополнительно отмечу, что обрезать столбики здесь — это прямо как стрелять себе в ногу.
Произошло нечто экстраординарное, но дизайнер по какой-то причине постеснялся об этом рассказывать и решил масштабы проблемы «преуменьшить»
Если вам было интересно, как работают большие генеративные модели вроде ChatGPT, ловите красивый (и очень короткий!) эксплейнер от The Guardian.
Меня в нём удивило, что концепцию координат вектора объясняют через координаты городов. Дорогие читатели-гуманитарии, напишите, вам реально так понятнее?
Или можно было сразу говорить про координаты точек на плоскости?
https://www.theguardian.com/technology/ng-interactive/2023/nov/01/how-ai-chatbots-like-chatgpt-or-bard-work-visual-explainer
Если вы ещё не подписались на мой инстаграм, то сегодня зову вас туда почитать историю про Ханса Рослинга — шведского врача, ставшего всемирно известным лектором благодаря навыкам дата-сторителлинга.
И бонусом рассказываю в сториз, как легко сделать такой же эффектный график:
https://www.instagram.com/p/CzYuZwfih6E/
Трепетно.
Год назад я решил, что буду рассказывать о дата-журналистике не только тут, но и в инстаграме.
Но всё это время никак не мог начать. И сегодня решил — ждать больше не хочу. Приглашаю вас присоединиться:
https://instagram.com/dataviz.me
Буду пробовать там новые форматы и писать немного иначе, чем здесь :)
История The Pudding о том, как на Spotify появилось много непонятных музыкальных жанров. Несмотря на то, что я музыкант и сам пишу песни, даже для меня вся музыка сводится примерно к пяти популярным. Кто реально разбирается в тысячах разных названий — для меня загадка.
Понравился один приём в материале — чтобы показать, как сильно выросла популярность K-pop на сервисе, часть графика вывели за ось. Считывается как «жанр вылез из такого дна, что туда даже дотянуться трудно». Эффектно получилось — если бы масштаб сохранили, трудно было бы вызвать такую эмоцию.
https://pudding.cool/2023/10/genre/
💼 Какие навыки прокачать в 2023, чтобы оставаться востребованным?
Аналитика — главный навык для сотрудников на ближайшие 5 лет согласно рейтингу Всемирного экономического форума. Причем актуально это для продактов, проджектов, лидов.
С этим универсальным скиллом вы научитесь:
▪️ подкреплять гипотезы реальными данными;
▪️ качественнее развивать продукт и растить метрики;
▪️ говорить с аналитиками и разработчиками на одном языке.
Если вы еще не внедрили аналитику в свои рабочие процессы — ловите бесплатный гайд по аналитическим фреймворкам от Changellenge >> Education. Внутри вы найдете 20+ шаблонов для оптимизации рабочих процессов с пояснениями и примерами: PSW, модель Кано, матрица BCG, RICE, модель Грейнера и многие другие.
Гайд поможет:
▪️ познакомиться с аналитическими методами быстро и структурно;
▪️ систематизировать знания и получить незаменимую шпаргалку;
▪️ внедрить фреймворки в работу команды;
▪️ научиться быстро, но эффективно принимать решения.
Забрать бесплатный гайд: https://u.to/A2IKIA
Реклама. https://changellenge-education.com/ ИНН 7716917009 erid=2VtzqumTnzA
Хочу узнать о ваших проблемах
Недавно я сделал ещё один канал, в котором публикую только образовательный контент — о том, как правильно и классно визуализировать данные.
Кстати, в этом канале уже на неделе пройдут разборы графиков. Если вы хотите прислать свой — не забудьте подписаться)
Так вот — на днях мы запустили там опрос, чтобы узнать, с какими проблемами при визуализации вы сталкиваетесь. Возможно, вы этот опрос не видели, а нам очень важно набрать много респондентов, чтобы результаты были репрезентативными.
Опрос должен занять 5-7 минут, почти всё там надо прокликать — развёрнутых пунктов почти нет. В подарок за ваши старания мы отправим вам полезный гайд о визуализации данных. Какой? Это мы собираемся понять как раз из опроса 😄
Чтобы пройти опрос, кликните по ссылке ниже:
🔗 https://forms.gle/P4MMPvL1L23WvYjS7
Улыбаюсь и рассказываю про своё самое любимое дата-журналистское исследование в эфире YaTalks
Запись можно посмотреть тут:
https://yatalks.yandex.ru/ru/live
Вкладка «про жизнь» / Live, на 7:02:00
Т—Ж снова «играет» с темой инфляции, на этот раз рассказывая, как изменилась ваша зарплата в айфонах.
Ещё когда я там работал, мы с коллегами придумали большой калькулятор, который измерял вашу зарплату в большом количестве товаров — от шариковых ручек до квартир. Тот калькулятор обещали обновить, ждём его 😌
А сейчас, специально для техно-редакции, коллеги сделали «лайт-версию», только с айфонами:
https://journal.tinkoff.ru/iphone-index/
В визуализации, кстати, вижу проблему.
Айфоны сделали разных размеров — опираясь, видимо, на реальные размеры устройств.
Но сравнивать числа такая визуализация не помогает совсем.
Если уж и сохранять размеры, то надо было «не достающую» часть телефона сделать прозрачной. В таком случае хотя бы будет видно долю.
Мой новый канал о том, как научиться делать залипательные графики
Опросы в канале говорят, что среди моей аудитории есть люди, которые пока не умеют делать понятные графики, которые цепляют взгляд.
И мне есть, что вам рассказать!
Но это не очень вписывается в концепцию основного канала. Поэтому я решил сделать ещё один — именно для вас.
📊 В этом канале всё будет по-старому: вдохновляющие проекты, новости дата-журналистики и мои размышления о сфере в целом 😌
📊 В новом будет больше образовательного контента. Буду писать там, как сделать ваши графики лучше; какими программами пользоваться; и как, наконец, сделать так, чтобы ваш график рассказывал историю.
Ещё в середине декабря мы проведём там разборы ваших графиков. Оказалось, на это есть большой запрос, так что следите за постами.
Если вам это интересно, и вы хотите, чтобы ваши графики выделялись, а на работе сказали «круто, а сделай нам тоже так» — жмите на ссылку ниже и подписывайтесь.
➡ /channel/+PO7tLH9FhQY0NWRi
На канале вас уже ждет небольшой подарок — три приёма, как сделать ваши графики понятнее 🎁
Я к вам с классным анонсом сегодня.
Мой замечательный коллега Андрей Дорожный в следующую субботу (9 декабря) делает конференцию по дата-сторителлингу. Состав — огонь, буду выступать сам и с большим интересом послушаю остальные доклады.
Я готовлю спич на свою любимую тему — про визуальные метафоры в датавизе. Расскажу, как дата-художники в разные годы делали графики в виде крови, цветочков и других интересных образов, и почему это не всегда так плохо, как говорил Тафти.
Это онлайн и бесплатно. Регистрируйтесь тут:
https://dorozhnij.com/conference
За последние пару месяцев мы вместе с командой провели три десятка интервью, и я обнаружил одну грустную вещь.
Многие из тех, кто любезно согласились поговорить с нами, понятия не имеют, кто ведёт этот канал 🥲
Предлагаю начать наши отношения с чистого листа и всё-таки познакомиться.
Меня зовут Лёша, и я — дата-журналист. Моя главная задача — проанализировать данные и придумать, как заинтересовать ими максимально широкую аудиторию. Я создавал развлекательные, познавательные и общественно-значимые истории для самых разных медиа в России —
РБК, Новая Газета, Т—Ж, The Village, Студия инфографики РИА (и это не полный список),
а сейчас работаю в команде Исследований Яндекса.
Ещё я преподаю дата-журналистику и визуализацию данных — сотрудничал с ВШЭ, Нетологией, веду тренинги по запросу самых разных организаций
Вот работы, которыми я горжусь больше всего:
* В погоне за Оскаром — о том, как фильмы получают награды не за «гениальность», а за то, что пытаются понравиться жюри
* Судьи держат нас за болванку (VPN) — как российские судьи копируют целые фрагменты судебных решений, заменяя в них только даты и имена, и почему это заставляет усомниться в честности правосудия
* Сколько вы зарабатываете по сравнению с коллегами противоположного пола — большая интерактивная история про gender-pay-gap, где можно вбить свою зарплату и сравнить себя с другими сотрудниками в своей сфере.
А чтобы этот пост был полезным для вас, предлагаю в комментариях спросить, что вам интересно о работе дата-журналиста 👇
Хочу узнать, какая аудитория, собралась здесь в канале, чтобы учитывать это при подготовке контента. Проголосуйте пожалуйста 🙏
Читать полностью…
Я вообще довольно часто выступаю, но лекции эти чаще всего остаются в сердцах людей, а в интернет попадают не так часто.
Но сегодня я обнаружил, что Летняя Школа выложила запись моей лекции полуторогодовалой давности. Смотрю на себя и думаю, что целая жизнь с тех пор прошла.
Но лекция интересная — здесь я, например, рассказываю, как мы когда-то проверяли на честность московский сервис «электронной демократии» «Активный гражданин», объясняю из каких этапов состоит работа дата-журналиста и показываю свои любимые работы — от New York Times до Медиазоны.
Добавляйте в закладки:
https://www.youtube.com/watch?v=w8Q2grAslH4
А мою любимую картинку про корь когда-то сделала Мона Чалаби.
Это визуальная журналистка и дата-художник, которая делает инфографику от руки, она известна своими визуальными метафорами и провокационным стилем.
Для медицинского издания такая картинка вряд ли подойдёт, но зато шерить в соцсетях такое классно
Привет!
Я вместе с командой продолжаю исследовать ваш образовательный опыт и ищу больше респондентов для интервью.
Мы очень хотим поговорить с вами, если:
1. Вам интересна сфера визуализации данных
2. Вы когда-либо покупали любое обучение (не обязательно связанное с данными)
Если это вы — напишите, пожалуйста. Ваш опыт очень нам поможет ☺️
Контакт: @BlackPineapple
UPD: Пока респондентов набрали! Спасибо большое за ваш тёплый отклик. Личку разгребаю 🌿
Инструмент для визуализации данных RawGraphs анонсировал на внешнюю аудиторию новую функцию — возможность создавать и использовать «кастомные виды графиков».
Это значит, что теперь любой член комьюнити может написать шаблон для отображения нового вида визуализации, а любой другой пользователь — просто построить по этому шаблону свой график.
Ну и пару слов о RawGraphs — если вы о нём не слышали. Это сервис, который позволяет делать «основу» для вашей инфографики, которую, как правило, потом надо дорабатывать в графическом редакторе. Там нет настройки подписей, заголовков и прочих мелочей, зато есть много видов графиков, которые сложно где-то ещё построить без кода. А теперь, видимо, будет ещё больше ☺️
Одна из причин, почему я обожаю дата-материалы — они позволяют узнать много интересного о мире.
Сегодня я узнал, что районы Нью Йорка — это весьма условные территориальные единицы, рождающиеся буквально «в народе». Однажды кто-то решил, что стоит называть это место определённым образом, и если это название закрепилось — его начинают использовать другие. Такая вольность приводит к тому, что у разных людей может быть разное мнение о том, где кончается тот или иной район 🤯
Чтобы построить максимально подробную карту города, NYT опросили 37 тысяч респондентов. Оказалось, что по большей части города у жителей Нью-Йорка консесусов нет.
А карту советую глянуть — это как минимум красиво. Любопытно, что материал состоит из двух частей — отдельно статья, отдельно — интерактивная карта.
Смотреть:
Поясняющий материал, интерактивная карта
Вероятно, для просмотра потребуется подписка, режим инкогнито или расширение Bypass Paywalls
Ещё одна статья про то, как стереотипно мыслят генеративные нейросети. До этого я выкладывал публикацию Bloomberg, в которой, например, рассказывали, что нейросети почти всегда рисуют террористов как выходцев с Ближнего Востока, а уборщиков — как людей из центральной Азии.
В этот раз проект Rest of World рассказывает про стереотипы, касающиеся культуры определённых стран. Например, мексиканца Midjourney рисует как человека в сомбреро, индуса — как мудрого старца, а индонезийскую еду — как нечто в банановых листьях.
Но если находки из предыдущего материала действительно показались мне важными, то в этот раз стереотипы как будто кажутся безобидными и даже полезными.
Если я прошу нейросеть без всяких уточнений нарисовать что-то, связанное с культурой другой страны, то ожидаю увидеть что-то стереотипно-типичное.
Давайте подискутируем? Напишите в комментариях, должны ли нейросети по таким запросам выдавать более разнообразные изображения.
https://restofworld.org/2023/ai-image-stereotypes/
NYT Opinion поднимает проблему сокращения населения Земли. По оценкам демографов, количество людей достигнет пика в 80-х годах этого века, а потом начнёт стремительно уменьшаться.
Почти все развитые страны уже сейчас находятся ниже уровня воспроизводства (это значит, что на каждую женщину приходится в среднем менее двух детей). И во всех без исключения странах рождаемость падает. Кажется, что спустя десятилетия даже Африка не сможет спасти человечество от вымирания.
Оцените, кстати, какую лаконичную визуальную метафору сделали NYT в графике, который иллюстрирует рождаемость.
https://www.nytimes.com/interactive/2023/09/18/opinion/human-population-global-growth.html
А вот тут можно прочитать ещё один завораживающий материал NYT о том, как изменится структура населения планеты.
Вероятно, для просмотра потребуется подписка, режим инкогнито или расширение Bypass Paywalls
В копилку классных визуальных метафор — график Т—Ж в материале про горнолыжные курорты:
https://journal.tinkoff.ru/ski-resort-stat/