data_csv | Unsorted

Telegram-канал data_csv - data.csv

13755

Блог о журналистике данных и дата-сторителлинге Ведёт @BlackPineapple — аналитик в службе дата-журналистики Яндекса

Subscribe to a channel

data.csv

«Вёрстка» пишет, что интерес к сериалу «Слово пацана» в Яндексе сейчас выше, чем даже к очень крупным политическим событиям

«Слово» и правда сейчас — везде. Но есть проблема — я подозреваю, что большая часть поискового интереса к сериалу наверняка содержит его название.

А вот новости про войну, если и ищут до сих пор, то скорее через указание подробностей — например, «Зеленский Байден», «мобилизация», «Авдеевка». Десяток таких тем в сумме легко обгонят запросы «СВО» или «Война в Украине».

В комментариях к посту издания очень верно отметили, что поисковый интерес слабо отражает настоящую заинтересованность людей в чём-либо. Скоро начнётся третий год войны — реально интересующимся уже давно не надо вбивать в поиске такие общие запросы.

В общем, на мой взгляд, картинка эта ни о чём не говорит.

Читать полностью…

data.csv

Любопытный пример использования генеративных нейросетей в визуализации данных

Студия CLEVER°FRANKE решила проиллюстрировать данные о лесах на планете с помощью целой цепочки нейросетей — сначала там использовали ChatGPT-4, потом Midjourney, потом Stable Diffusion, потом снова ChatGPT, а ещё тренировали какую-то собственную модель.

В общем, от описания процесса лично у меня уже голова пошла кругом.
А как вам результат?

Подробности:
https://www.instagram.com/p/C0jfnmSImjj/

Читать полностью…

data.csv

Астрологи объявили неделю выступлений на конференциях

Завтра выступаю в онлайн-студии на главной технологической конференции Яндекса. Буду просвещать там широкую аудиторию о том, какие исследования можно создавать на основе данных, и чем конкретно занимается команда Исследований Яндекса.

Как посмотреть: на сайте ищете большую кнопку «Смотреть трансляцию», оказываетесь в разделе Live. Это оно!

Мой блок планируется в 16:30. Буду рад увидеться ☺️

Читать полностью…

data.csv

В продолжение нашего знакомства

Яндекс наконец-то выпустил эпизод подскаста «Войти в айти», где техноблогер Сергей Романцев и студент Вышки Арсений Бородулин спрашивают меня, чем занимаются дата-журналисты, и как я в своё время искал работу.

Рассказываю там, как вообще так получилось, что я стал заниматься дата-журналистикой и делюсь неочевидными лайфхаками, как можно выстраивать свой карьерный путь.

Вообще это проект Яндекс Образования, который ориентирован в первую очередь на школьников и студентов — поэтому обсуждаем мы разное: например, пытаемся разобрать мифы об айти или придумать свой стартап. Но надеюсь, что вам будет интересно 🙌

Лично я бы выбрал видео-версию и смотрел бы на скорости 1,25. Но сам подкаст доступен и на всех традиционных площадках.

Видео:
https://www.youtube.com/watch?v=QYeAqbDb7iQ

Аудио:
https://voyti-v-it.mave.digital/ep-9

Читать полностью…

data.csv

Хороший пример, как избавиться от «лапши» на графиках.

«Лапша» — это запутанная кучка линейных графиков (слева), в которой невозможно разобраться.

Способов борьбы с этим явлением несколько, всё зависит от вашей цели. Оставлять так — точно нельзя. Единственное исключение — это интерактив, но и тогда стоит по умолчанию предусмотреть состояние, в котором график о чём-то говорит.

Если действительно важно показать динамику каждого из объектов, лучше всего делать это на отдельном графике. Как сделали РБК (справа).

Читать полностью…

data.csv

Какие проблемы мешают вам красиво визуализировать данные?

В последнее время мы много общались с подписчиками (спасибо всем, кто согласился!). И пытались узнать — что именно мешает вам делать красивые графики.

Основные сложности были такие:
Проблемы с данными — трудно найти, трудно привести в нужную форму. И качество исходных данных — шлак.
Нет понимания, какой вид визуализации подходит для вашей задачи
Нет понимания, как работать с элементами диаграммы и как упорядочить их, чтобы было «красиво»
Не знаете, какой инструмент использовать, чтобы сделать график. Или знаете — но плохо им владеете.
Не знаете, какие приёмы использовать, чтобы ваш график выделялся и привлекал внимание

Напишите в комментариях, есть ли еще какие-то проблемы, которые мешает вам делать ваши графики понятными и красивыми?

Читать полностью…

data.csv

Давно мечтал сделать датавиз в виде нот, но тут меня опередили.

Бразильское издание пишет об итогах премии «Грэмми» и говорит, что Бразилия становилась победителем конкурса всего три раза. Ну а на графике — количество номинаций на конкурсе. Красный квадратик означает отсутствие номинаций.

Как вам?
Нравится? (🔥) или слишком странно? (🤯)

https://www1.folha.uol.com.br/ilustrada/2023/11/no-grammy-latino-brasil-so-tem-5-dos-indicados-aos-quatro-premios-principais.shtml

Читать полностью…

data.csv

🔥 Live-интенсив: разбираем тестовое задание в OZON на junior-аналитика!

Реклама
. ООО "Айти Резюме". ИНН 4025460134. Erid:LjN8KLY1H. Текст клиента

📣 Всем привет! Хотим пригласить вас на интенсив, где мы в прямом эфире будем разбирать настоящее тестовое задание в OZON на аналитика данных!

Нам предстоит провести аналитику продаж и доставок с помощью Pandas в Python, а также проиллюстрировать это все графиками.

📅 Дата: 22 ноября
🕘 Время: 19:00 по Мск

Что будем делать на интенсиве:

◾️ Проанализируем заказы пользователей по retention, времени доставки, сумме заказа т.д.
◾️ Научимся легко генерировать большой DataFrame с синтетическими данными
◾️ Посчитаем описательные статистики
◾️ Изучим полезные фичи Pandas: apply, map, pct_change и др.
◾️ Построим интерактивные графики с помощью Plotly
◾️ Научимся строить и читать необычные графики - например, violinplot

Интенсив подойдет всем — от новичков до тех, кто уже знаком с Python.

В прямом эфире мы также расскажем о частых ошибках новичков и поделимся лайфхаками — как достойно пройти собеседование и удивить ревьюера крутыми фишками 🤩

А вы готовы бустануть свои знания и скиллы в аналитике?

👉🏻 Зарегистрироваться на интенсив

Читать полностью…

data.csv

Тут в комментариях к кейсу с корью спрашивали, что делать, если значения настолько маленькие, что их вообще не видно.

Вот один из вариантов, который мы когда-то делали в Т—Ж: можно отдельно зазумить область, которую нужно рассмотреть более детально. Но и оригинальный масштаб тоже сохранить — чтобы отчётливо была видна драматичная разница

Читать полностью…

data.csv

Вот такой график опубликовало издание «Медвестник», чтобы рассказать, какая страшная в России ситуация с корью.

Вообще в нём прекрасно всё. Прямо кандидат на конкурс отвратительных графиков — только сравните числа в 2015 и 2016 году. Но дополнительно отмечу, что обрезать столбики здесь — это прямо как стрелять себе в ногу.

Произошло нечто экстраординарное, но дизайнер по какой-то причине постеснялся об этом рассказывать и решил масштабы проблемы «преуменьшить»

Читать полностью…

data.csv

Если вам было интересно, как работают большие генеративные модели вроде ChatGPT, ловите красивый (и очень короткий!) эксплейнер от The Guardian.

Меня в нём удивило, что концепцию координат вектора объясняют через координаты городов. Дорогие читатели-гуманитарии, напишите, вам реально так понятнее?
Или можно было сразу говорить про координаты точек на плоскости?

https://www.theguardian.com/technology/ng-interactive/2023/nov/01/how-ai-chatbots-like-chatgpt-or-bard-work-visual-explainer

Читать полностью…

data.csv

Если вы ещё не подписались на мой инстаграм, то сегодня зову вас туда почитать историю про Ханса Рослинга — шведского врача, ставшего всемирно известным лектором благодаря навыкам дата-сторителлинга.

И бонусом рассказываю в сториз, как легко сделать такой же эффектный график:
https://www.instagram.com/p/CzYuZwfih6E/

Читать полностью…

data.csv

Трепетно.
Год назад я решил, что буду рассказывать о дата-журналистике не только тут, но и в инстаграме.

Но всё это время никак не мог начать. И сегодня решил — ждать больше не хочу. Приглашаю вас присоединиться:
https://instagram.com/dataviz.me

Буду пробовать там новые форматы и писать немного иначе, чем здесь :)

Читать полностью…

data.csv

История The Pudding о том, как на Spotify появилось много непонятных музыкальных жанров. Несмотря на то, что я музыкант и сам пишу песни, даже для меня вся музыка сводится примерно к пяти популярным. Кто реально разбирается в тысячах разных названий — для меня загадка.

Понравился один приём в материале — чтобы показать, как сильно выросла популярность K-pop на сервисе, часть графика вывели за ось. Считывается как «жанр вылез из такого дна, что туда даже дотянуться трудно». Эффектно получилось — если бы масштаб сохранили, трудно было бы вызвать такую эмоцию.

https://pudding.cool/2023/10/genre/

Читать полностью…

data.csv

💼 Какие навыки прокачать в 2023, чтобы оставаться востребованным?

Аналитика — главный навык для сотрудников на ближайшие 5 лет согласно рейтингу Всемирного экономического форума. Причем актуально это для продактов, проджектов, лидов.

С этим универсальным скиллом вы научитесь:
▪️ подкреплять гипотезы реальными данными;
▪️ качественнее развивать продукт и растить метрики;
▪️ говорить с аналитиками и разработчиками на одном языке.

Если вы еще не внедрили аналитику в свои рабочие процессы — ловите бесплатный гайд по аналитическим фреймворкам от Changellenge >> Education. Внутри вы найдете 20+ шаблонов для оптимизации рабочих процессов с пояснениями и примерами: PSW, модель Кано, матрица BCG, RICE, модель Грейнера и многие другие.

Гайд поможет:
▪️
познакомиться с аналитическими методами быстро и структурно;
▪️ систематизировать знания и получить незаменимую шпаргалку;
▪️ внедрить фреймворки в работу команды;
▪️ научиться быстро, но эффективно принимать решения.

Забрать бесплатный гайд: https://u.to/A2IKIA

Реклама. https://changellenge-education.com/ ИНН 7716917009 erid=2VtzqumTnzA

Читать полностью…

data.csv

Хочу узнать о ваших проблемах

Недавно я сделал ещё один канал, в котором публикую только образовательный контент — о том, как правильно и классно визуализировать данные.
Кстати, в этом канале уже на неделе пройдут разборы графиков. Если вы хотите прислать свой — не забудьте подписаться)

Так вот — на днях мы запустили там опрос, чтобы узнать, с какими проблемами при визуализации вы сталкиваетесь. Возможно, вы этот опрос не видели, а нам очень важно набрать много респондентов, чтобы результаты были репрезентативными.

Опрос должен занять 5-7 минут, почти всё там надо прокликать — развёрнутых пунктов почти нет. В подарок за ваши старания мы отправим вам полезный гайд о визуализации данных. Какой? Это мы собираемся понять как раз из опроса 😄

Чтобы пройти опрос, кликните по ссылке ниже:
🔗 https://forms.gle/P4MMPvL1L23WvYjS7

Читать полностью…

data.csv

Улыбаюсь и рассказываю про своё самое любимое дата-журналистское исследование в эфире YaTalks

Запись можно посмотреть тут:

https://yatalks.yandex.ru/ru/live

Вкладка «про жизнь» / Live, на 7:02:00

Читать полностью…

data.csv

Т—Ж снова «играет» с темой инфляции, на этот раз рассказывая, как изменилась ваша зарплата в айфонах.

Ещё когда я там работал, мы с коллегами придумали большой калькулятор, который измерял вашу зарплату в большом количестве товаров — от шариковых ручек до квартир. Тот калькулятор обещали обновить, ждём его 😌

А сейчас, специально для техно-редакции, коллеги сделали «лайт-версию», только с айфонами:
https://journal.tinkoff.ru/iphone-index/

В визуализации, кстати, вижу проблему.
Айфоны сделали разных размеров — опираясь, видимо, на реальные размеры устройств.
Но сравнивать числа такая визуализация не помогает совсем.

Если уж и сохранять размеры, то надо было «не достающую» часть телефона сделать прозрачной. В таком случае хотя бы будет видно долю.

Читать полностью…

data.csv

Мой новый канал о том, как научиться делать залипательные графики

Опросы в канале говорят, что среди моей аудитории есть люди, которые пока не умеют делать понятные графики, которые цепляют взгляд.

И мне есть, что вам рассказать!
Но это не очень вписывается в концепцию основного канала. Поэтому я решил сделать ещё один — именно для вас.

📊 В этом канале всё будет по-старому: вдохновляющие проекты, новости дата-журналистики и мои размышления о сфере в целом 😌

📊 В новом будет больше образовательного контента. Буду писать там, как сделать ваши графики лучше; какими программами пользоваться; и как, наконец, сделать так, чтобы ваш график рассказывал историю.

Ещё в середине декабря мы проведём там разборы ваших графиков. Оказалось, на это есть большой запрос, так что следите за постами.

Если вам это интересно, и вы хотите, чтобы ваши графики выделялись, а на работе сказали «круто, а сделай нам тоже так» — жмите на ссылку ниже и подписывайтесь.

/channel/+PO7tLH9FhQY0NWRi

На канале вас уже ждет небольшой подарок — три приёма, как сделать ваши графики понятнее 🎁

Читать полностью…

data.csv

Я к вам с классным анонсом сегодня.

Мой замечательный коллега Андрей Дорожный в следующую субботу (9 декабря) делает конференцию по дата-сторителлингу. Состав — огонь, буду выступать сам и с большим интересом послушаю остальные доклады.

Я готовлю спич на свою любимую тему — про визуальные метафоры в датавизе. Расскажу, как дата-художники в разные годы делали графики в виде крови, цветочков и других интересных образов, и почему это не всегда так плохо, как говорил Тафти.

Это онлайн и бесплатно. Регистрируйтесь тут:
https://dorozhnij.com/conference

Читать полностью…

data.csv

За последние пару месяцев мы вместе с командой провели три десятка интервью, и я обнаружил одну грустную вещь.

Многие из тех, кто любезно согласились поговорить с нами, понятия не имеют, кто ведёт этот канал 🥲

Предлагаю начать наши отношения с чистого листа и всё-таки познакомиться.

Меня зовут Лёша, и я — дата-журналист. Моя главная задача — проанализировать данные и придумать, как заинтересовать ими максимально широкую аудиторию. Я создавал развлекательные, познавательные и общественно-значимые истории для самых разных медиа в России —

РБК, Новая Газета, Т—Ж, The Village, Студия инфографики РИА (и это не полный список),
а сейчас работаю в команде Исследований Яндекса.


Ещё я преподаю дата-журналистику и визуализацию данных — сотрудничал с ВШЭ, Нетологией, веду тренинги по запросу самых разных организаций

Вот работы, которыми я горжусь больше всего:
* В погоне за Оскаром — о том, как фильмы получают награды не за «гениальность», а за то, что пытаются понравиться жюри
* Судьи держат нас за болванку (VPN) — как российские судьи копируют целые фрагменты судебных решений, заменяя в них только даты и имена, и почему это заставляет усомниться в честности правосудия
* Сколько вы зарабатываете по сравнению с коллегами противоположного пола — большая интерактивная история про gender-pay-gap, где можно вбить свою зарплату и сравнить себя с другими сотрудниками в своей сфере.

А чтобы этот пост был полезным для вас, предлагаю в комментариях спросить, что вам интересно о работе дата-журналиста 👇

Читать полностью…

data.csv

Хочу узнать, какая аудитория, собралась здесь в канале, чтобы учитывать это при подготовке контента. Проголосуйте пожалуйста 🙏

Читать полностью…

data.csv

Я вообще довольно часто выступаю, но лекции эти чаще всего остаются в сердцах людей, а в интернет попадают не так часто.

Но сегодня я обнаружил, что Летняя Школа выложила запись моей лекции полуторогодовалой давности. Смотрю на себя и думаю, что целая жизнь с тех пор прошла.

Но лекция интересная — здесь я, например, рассказываю, как мы когда-то проверяли на честность московский сервис «электронной демократии» «Активный гражданин», объясняю из каких этапов состоит работа дата-журналиста и показываю свои любимые работы — от New York Times до Медиазоны.

Добавляйте в закладки:
https://www.youtube.com/watch?v=w8Q2grAslH4

Читать полностью…

data.csv

А мою любимую картинку про корь когда-то сделала Мона Чалаби.

Это визуальная журналистка и дата-художник, которая делает инфографику от руки, она известна своими визуальными метафорами и провокационным стилем.

Для медицинского издания такая картинка вряд ли подойдёт, но зато шерить в соцсетях такое классно

Читать полностью…

data.csv

Привет!
Я вместе с командой продолжаю исследовать ваш образовательный опыт и ищу больше респондентов для интервью.

Мы очень хотим поговорить с вами, если:
1. Вам интересна сфера визуализации данных
2. Вы когда-либо покупали любое обучение (не обязательно связанное с данными)

Если это вы — напишите, пожалуйста. Ваш опыт очень нам поможет ☺️
Контакт: @BlackPineapple

UPD: Пока респондентов набрали! Спасибо большое за ваш тёплый отклик
. Личку разгребаю 🌿

Читать полностью…

data.csv

Инструмент для визуализации данных RawGraphs анонсировал на внешнюю аудиторию новую функцию — возможность создавать и использовать «кастомные виды графиков».

Это значит, что теперь любой член комьюнити может написать шаблон для отображения нового вида визуализации, а любой другой пользователь — просто построить по этому шаблону свой график.

Ну и пару слов о RawGraphs — если вы о нём не слышали. Это сервис, который позволяет делать «основу» для вашей инфографики, которую, как правило, потом надо дорабатывать в графическом редакторе. Там нет настройки подписей, заголовков и прочих мелочей, зато есть много видов графиков, которые сложно где-то ещё построить без кода. А теперь, видимо, будет ещё больше ☺️

Читать полностью…

data.csv

Одна из причин, почему я обожаю дата-материалы — они позволяют узнать много интересного о мире.

Сегодня я узнал, что районы Нью Йорка — это весьма условные территориальные единицы, рождающиеся буквально «в народе». Однажды кто-то решил, что стоит называть это место определённым образом, и если это название закрепилось — его начинают использовать другие. Такая вольность приводит к тому, что у разных людей может быть разное мнение о том, где кончается тот или иной район 🤯

Чтобы построить максимально подробную карту города, NYT опросили 37 тысяч респондентов. Оказалось, что по большей части города у жителей Нью-Йорка консесусов нет.

А карту советую глянуть — это как минимум красиво. Любопытно, что материал состоит из двух частей — отдельно статья, отдельно — интерактивная карта.

Смотреть:
Поясняющий материал, интерактивная карта

Вероятно, для просмотра потребуется подписка, режим инкогнито или расширение Bypass Paywalls

Читать полностью…

data.csv

Ещё одна статья про то, как стереотипно мыслят генеративные нейросети. До этого я выкладывал публикацию Bloomberg, в которой, например, рассказывали, что нейросети почти всегда рисуют террористов как выходцев с Ближнего Востока, а уборщиков — как людей из центральной Азии.

В этот раз проект Rest of World рассказывает про стереотипы, касающиеся культуры определённых стран. Например, мексиканца Midjourney рисует как человека в сомбреро, индуса — как мудрого старца, а индонезийскую еду — как нечто в банановых листьях.

Но если находки из предыдущего материала действительно показались мне важными, то в этот раз стереотипы как будто кажутся безобидными и даже полезными.

Если я прошу нейросеть без всяких уточнений нарисовать что-то, связанное с культурой другой страны, то ожидаю увидеть что-то стереотипно-типичное.

Давайте подискутируем? Напишите в комментариях, должны ли нейросети по таким запросам выдавать более разнообразные изображения.

https://restofworld.org/2023/ai-image-stereotypes/

Читать полностью…

data.csv

NYT Opinion поднимает проблему сокращения населения Земли. По оценкам демографов, количество людей достигнет пика в 80-х годах этого века, а потом начнёт стремительно уменьшаться.

Почти все развитые страны уже сейчас находятся ниже уровня воспроизводства (это значит, что на каждую женщину приходится в среднем менее двух детей). И во всех без исключения странах рождаемость падает. Кажется, что спустя десятилетия даже Африка не сможет спасти человечество от вымирания.

Оцените, кстати, какую лаконичную визуальную метафору сделали NYT в графике, который иллюстрирует рождаемость.

https://www.nytimes.com/interactive/2023/09/18/opinion/human-population-global-growth.html

А вот тут можно прочитать ещё один завораживающий материал NYT о том, как изменится структура населения планеты.

Вероятно, для просмотра потребуется подписка, режим инкогнито или расширение Bypass Paywalls

Читать полностью…

data.csv

В копилку классных визуальных метафор — график Т—Ж в материале про горнолыжные курорты:

https://journal.tinkoff.ru/ski-resort-stat/

Читать полностью…
Subscribe to a channel