data_csv | Unsorted

Telegram-канал data_csv - data.csv

13755

Блог о журналистике данных и дата-сторителлинге Ведёт @BlackPineapple — аналитик в службе дата-журналистики Яндекса

Subscribe to a channel

data.csv

Планируя 2025 год, важно помнить о правиле: за каждым большим делом всегда стоят маленькие шаги

Очень мне нравится эта метафора в картиночках @newhappyco

У них вообще клёвый стиль: выглядит как визуализация данных, но в основе скорее что-то философское про жизнь

Источник:
https://www.instagram.com/newhappyco

Читать полностью…

data.csv

Мой дата-год ❤‍🔥

Хочется зафиналить 2024, рассказав себе и вам о самых важных своих дата-активностях

1⃣ Придумал и запустил свой курс по визуализации данных. Испытываю огромное удовольствие от обсуждений со студентами и особенно работы над финальными проектами.

Прошло уже два потока, за время которых ребята сделали много крутейших работ. Посмотреть их можно тут: #работы_студентов@data_csv

2⃣ Выпустил два исследования вместе со своей прекрасной командой в Яндексе: про то, как изменился климат России за 70 лет, и о том, что заказывают в доставке в разных городах страны.

3⃣ Много выступал. Съездил на фестиваль TIME CODE в Екатеринбург, выступил на главной сцене Матемаркетинга, прочитал две лекции на Летней Школе под Дубной; ходил в гости к магистрам из Вышки, а ещё провёл тренинги для своих коллег из Яндекс Лавки и команды 1C.

А ещё — вёл вебинары для студентов своего курса и профессии «Дата-журналист» в Нетологии.

4⃣ Сделал исследование для Картетики о рынке ГИС-специлистов, которые они презентовали на своей конференции Мапакон. Некоторые выводы есть в двух материалах, которые они выпустили «по следам»: 1, 2

5⃣ Разработал небольшой курс по дата-журналистике в МГУ. Коллега в рамках этого курса предложил использовать платформу «Яндекс Контест» для проверки заданий. Студенты загружали эксельки в систему, мы писали тесты, и программа автоматически проверяла работы. Опыт был любопытный, хотя и местами стрессовый

6⃣ Написал для Т—Ж цикл авторских материалов под кодовым названием «Одураченные статистикой»: о том, какие манипуляции осознанно или неосознанно используют авторы графиков, чтобы нас запутать

Спасибо, что следите и читаете! 20 тысяч пересылок и почти полторы тысячи комментариев — это мощь 😍

Читать полностью…

data.csv

Дата-сторителлинг по-шанхайски: заходишь во двор жилого дома, а там цифры висят. Эти цифры — доля вакцинированных жителей в доме.

Увидишь низкое число, значит, к этим не ходи, люди это нехорошие 😁

Читать полностью…

data.csv

«Если быть точным» не так давно обновили датасет с супер-детализированными статистическими данными — в разрезе муниципальных образований. Такие данные достать очень непросто: Росстат почти всегда даёт статистику в разрезе региона и на уровни ниже в легкодоступных датасетах не спускается. Кроме того, коллеги уже сами свели таблички за разные годы в один датасет и почистили ошибки.

Остаётся приятная, но в то же время необъятная работа — исследовать это всё! Своих героев ждут 582 социально-экономических показателя.

Если у вас есть знакомые аналитики — покажите это им. Особенно ценен будет интерес со стороны тех, у кого есть отраслевая или региональная экспертиза, — с ней будет проще найти интересные сюжеты и интерпретировать результаты.

Го делать классные истории?
https://tochno.st/datasets/bdmo

P.S. картинка случайная из интернета, просто чтобы вы понимали уровень детализации

Читать полностью…

data.csv

Сделали с коллегами из Яндекса тур по гастрономическим предпочтениям жителей разных городов России, изучив заказы из доставки.

Для меня одним из главных вызовов в этом проекте стала разметка категорий блюд по названиям и категориям. Оказалось, что в Яндекс Еде бургерные гиганты типа «Вкусно и точка» или «Бургер кинг» мало того, что не называют свои бургеры бургерами (а придумали всякие вопперы и биг хиты...), у них ещё и категорий таких в каталоге нет. В общем, приходилось изучать всю сетку их названий, чтобы корректно ловить такое регулярками 🥵

Долго стоически держался Калининград — когда в какой-то версии разметки бургеры лидировали почти во всех городах, там первыми были супы. В итоге бургеры всё же победили — с небольшим отрывом.

А что ещё помимо бургеров заказывают в доставке, читайте в нашем интерактивном проекте:
https://yandex.ru/company/researches/2024/food-in-cities

Читать полностью…

data.csv

Новая порция дата-шарад от @datacitron! В этом году отгадываем музыкальные группы. Кого узнали? Пишите в комменты! Лично мне очень сложно 🙈

Год назад были книги и фильмы:
/channel/data_csv/1024

Читать полностью…

data.csv

Знаете ли вы, что такое докс или вонёнизм?

Коллеги исследовали, какие новые слова интересовали пользователей Яндекса последние 10 лет. На лендинге можно посмотреть сами слова, их расшифровку, а также пройти тест на знание современного сленга:

https://yandex.ru/company/researches/2024/new-words

Читать полностью…

data.csv

Т-Банк изучил, кто в России какими телефонами пользуются, и как отличаются траты этих людей

В среднем по России пользователей Android больше, чем пользователей iPhone. Айфоны в основном у людей помоложе и у девушек.

Айфоны преобладают в Москве и почему-то в республиках Северного Кавказа (кто-то понимает причину этого феномена?)

Самый популярный айфон в стране — это iPhone 11, прошлогодний флагман вошёл в топ-5.

По тратам предсказуемое — яблочники тратят больше, чаще ходят по барам и ездят на такси. Хотя судя по тексту исследования, мы наблюдаем тут не «эффект айфона», а скорее различие между городами-миллионерами и остальной Россией. Думаю, я бы при подсчётах учитывал бы разницу в среднем по городам.

https://www.tbank.ru/about/news/09122024-t-pay-research-how-do-iphone-and-android-smartphone-owners-differ-from-each-other-in-russia/

Читать полностью…

data.csv

При работе над сложными визуализациями часто нужно вдохновение.

Data Viz Project запустили для этого классный инструмент — Data Viz Inspiration.

1500 интересных визуализаций, кнопочка Random, и вот вы залипли на пару часов.

https://datavizproject.com/inspiration/

Читать полностью…

data.csv

Александр Варламов собрал данные сервиса Getmatch об актуальных российских зарплатах в IT

Если верить этим данным, миддлам-аналитикам при выходе на работу в среднем предлагают 210 тысяч. Самую «жирную» зарплату — обещают некому разработчику C++ — 1,6 млн рублей в месяц, есть в подборке и ещё несколько вакансий с потолком выше мульта.

В топе компаний по зарплатам почти всё — неизвестные имена. Из понятного мне внезапно вылез Островок, Звук (стриминг Сбера). Увидел ещё Яндекс, завуалированный как Плюс Фантех.

В общем, изучайте сами. Посмотреть можно на дашборде:
https://public.tableau.com/app/profile/alexandervar/viz/ITVacancies/ITVacancies

Читать полностью…

data.csv

Bloomberg пишут, что Америка отстаёт от заявленных планов по климатическим целям — снижению выбросов и переход на возобновляемые источники энергии.

Для иллюстрации тезиса выбран очень нестандартный тип графика, который
1) отделяет реальные данные от прогнозных
2) позволяет сконцентировать внимание на увеличивающемся разрыве

https://www.bloomberg.com/graphics/2024-cop29-climate-change-targets

Читать полностью…

data.csv

Запись вчерашних разборов!

Спасибо всем, кто пришёл вчера на стрим! Получилось очень интересно и разнообразно 🙌

Было много просьб выложить запись — делюсь ей с вами. Тут только разборы, запись моего пения пока останется эксклюзивом для тех, кто пришёл послушать вживую 😅

На эфире я также анонсировал основной поток записи на 3-й поток моего курса по визуализации данных «Эстетика в графиках».

На нем вы научитесь делать залипательные, понятные и эстетичные графики, которые будут быстро доносить мысли и помогать в принятии правильных решений. Такой навык точно поможет вам блеснуть на работе и пополнит портфолио.

🔷 Старт — 2 декабря
🔷 Продолжительность — 3 месяца

В результате курса вы:

🟣 Разберётесь как сделать график привлекательным, а также удобным и понятным для читателя;

🟣 Овладеете инструментами визуализации данных (Tableau, Flourish, Figma и другими);

🟣 Узнаете, какой график лучше подходит для вашей задачи, и почему именно он;

🟣 Научитесь дата-сторителингу: поймете, как выстроить графики, чтобы они рассказывали историю;


В этот раз будет только 35 мест с обратной связью, и осталось всего 12: если хотите получать от меня разборы по вашим графикам и дипломной работе — записывайтесь сейчас.

Можно забронировать за собой место за 1000 рублей, а остаток суммы внести до начала обучения.

Есть рассрочки до 12 месяцев, по ним сумма платежа в месяц 2 416 руб.

Присоединяйтесь: https://plus-level.ru/

По любым вопросам, пишите Олегу: подскажет по программе, поможет с рассрочкой и оплатой от работодателя, поддержит и ободрит 😄

Читать полностью…

data.csv

Разберу ваши графики

Давно не проводили такой формат, а я его очень люблю.

Условия простые, с вас — графики, с меня — предложения, как их улучшить. Или, возможно, я просто похвалю вас, и скажу, что всё круто :)

А ещё можно присылать не свои работы, а просто что-то, что вы видели в сети.

Разбор проведём в среду 20 ноября в 20:00 по Москве прямо тут.

Работы присылайте в эту форму:
https://forms.yandex.ru/u/673b275d49363912ace9eafc/

Читать полностью…

data.csv

Антон Мизинов выложил в сеть свой сервис для сбора плиточной карты России

Достаточно приложить свой файл с данными (пример), выбрать цвета, настроить отступы — и можно получить готовое изображение в PNG или SVG.

Раскладка карты из ТАСС — она достаточно сильно отличается от карты, которые используют РИА, Т—Ж, РБК, Медиазона, Datawrapper и прочие медиа. Пока свою настроить нельзя, и для кого-то это может быть минусом.

https://mizinov.pro/tilemapper/

Читать полностью…

data.csv

#работы_студентов

Даже серьёзную аналитику можно оформить ярко и привлекательно. Вот так получилось разобраться с экологической повесткой у моей студентки из Люксембурга.

В рамках хобби и волонтерства я интересуюсь вопросами экологии и устойчивого развития. Меня интересует, какие меры страны предпринимают для экологии и адаптации к изменению климата. Решила проанализировать, что делает Люксембург для обеспечения долгосрочного устойчивого развития, используя открытые данные.

Самым трудоёмким этапом была работа с табличными данными: от выбора подходящих датасетов сквозь кривой перевод с французского до подгона их под требования RAWgraphs и Flourish. С выбором вида графиков сложностей почти не возникло: получилось использовать и простенький донат, и Bumpchart. После обучения стало легче понимать, какие виды графиков сразу можно исключить для определенных данных. Как графический редактор использовала фигму.

Мега-инсайдов [от анализа] я не ожидала, и результаты получились достаточно предсказуемые. Решила разбавить эту предсказуемость неоновыми цветами как ассоциацию с энергетикой и инновациями, что достаточно непривычная гамма после корпоративных презенташек. Также пришлось отказаться от специфических терминов, чтобы материал был доступен более широкой аудитории, хотя обычно в таких темах хочется добавить больше профессиональных фактов.

В целом получилось выразить свои знания и интерес к сфере в новой плоскости. Ну и освоить работу с данными через эффективный визуал.


Если тоже хотите разобраться, как красиво оформлять данные, выбирать подходящие виды графиков, и почему нужно выбирать именно их — бронируйте место на моем курсе. 11 мест уже ушли:

https://clck.ru/3EVxAD

Читать полностью…

data.csv

Анализ новогодних обращений президента от студентов магистратуры ВШЭ

Настроение, популярные темы и пожелания — в карточках

Авторы: Валерия Немна, Филипп Попов, Владимир Малючков

Читать полностью…

data.csv

Моё уважение коллегам из «Новой газеты Европа», которые сделали очень подробный калькулятор инфляции с 2019 года, называется «Новогодняя корзина»

Можно буквально собрать корзину из привычных для вас товаров, и посмотреть, как поменялась цена каждого; можно посмотреть на готовые наборы.

Новая-Европа — нежелательная организация в России, за распространение ссылок на их материалы граждане РФ могут получить наказание, поэтому ссылки здесь не будет.

Читать полностью…

data.csv

Во время моей поездки в Японию я выкладывал много инфографики, которую находил в городе

Кажется, многим это понравилось, мне недавно даже коллега выразила за это отдельный респект. Поэтому продолжим рубрику!

Сейчас я в Шанхае, в музее шоколада. Как вам кажется, что показывает график снизу? Правильный ответ выложу под спойлер в комментарии :)

Читать полностью…

data.csv

Вот такие тренды 2024 года: курьер — одна из самых востребованных и хорошо оплачиваемых профессий

Ещё оказалось, что из-за нехватка рабочей силы работодатели начали снижать требования к сотрудникам, и всё больше становится вакансий, куда готовы брать вообще без опыта.

https://journal.tinkoff.ru/roles-count-2024/

Читать полностью…

data.csv

Моей коллеге и подруге Кристине Уласович нужна помощь

Вы уже могли видеть этот пост в других датавиз-пабликах, но это тот случай, когда максимально широкая огласка может спасти жизнь

Кристина ищет контакты в системе здравоохранения, чтобы спасти маму.
Если вы знаете, как помочь — напишите ей: @ave_kirsten

Дорогие все.

Так случилось, что в моей семье ужасное горе - мама заболела раком, IV стадия.
Не передать словами, насколько ужасный был месяц: 3 недели в реанимации, опасная для жизни операция, ТЭЛА.

Она сейчас в состоянии средней тяжести после всего пережитого — у нее пневмония, нарушены двигательные функции, кислородотерапия. Но есть положительная динамика по восстановлению.

В таком состоянии, как у нее сейчас, химию делать нельзя. А ей она нужна, потому что есть метастазы. Единственный наш шанс — это чтобы мама долечилась и прошла реабилитацию. Однако наша больница долечивать ее не очень хочет и настаивает на паллиативе, но остановиться на полпути, сдать ее в хоспис и опустить руки сердце мне не позволяет.

Я обычно стараюсь все вытянуть сама, но тут мне просто не хватает собственной мощи. Если вы знаете кого-то, кто мог бы помочь в этой ситуации - может быть, маму удастся перевести лечиться в другую больницу, в реабилитационный центр, где ей можно будет дать шанс восстановиться - или знаете, что можно ещё сделать, то напишите мне или просто поделитесь моей историей.

Скоро Новый год, и моей семье очень нужно чудо. Я уже потеряла папу в 2018 году, и я должна попытаться сделать все, чтобы не потерять еще и маму.

P. S. Если вы или ваши родители знакомы с моей мамой, то пока что ей не пишите, пожалуйста. Она не знает всю полноту диагноза, сейчас ей это не нужно — иначе страх застопорит прогресс.

Читать полностью…

data.csv

Рисовали сегодня с магистрантами МГУ

Особенно мне запомнилась работа «что слушает мой дядя, когда выпивает с друзьями» 😁

На карточке нарисован топ треков по числу прослушиваний с разбивкой по жанру (цвет). Каёмка у названия обозначает десятилетие, длина горлышка — оценка, ширина бутылки — общее время прослушивания

В топ попали Chop Suey, Выхода нет и Numb

Читать полностью…

data.csv

Страшно красивый проект ТАСС про магнитные бури

Недавно видел, как российский биолог и популяризатор науки Александр Панчин разоблачал феномен магнитных бурь — именно из его уст я впервые услышал, что они, вопреки распространённому стереотипу, на самом деле не влияют на самочувствие.

Ожидал увидеть и здесь подобную аналитику, но удивился, что в проекте ТАСС мнение не такое однозначное.

В целом проект в большей степени рассказывает про сам механизм возникновения магнитных бурь, и делает это со вкусом. Иллюстрации, видео, графики — секс 🩷

Полистайте обязательно!

https://spec.tass.ru/magnitnye-buri/

Читать полностью…

data.csv

Вы наверняка уже видели анонс конференции «Дата-сторителлинг», которая пройдёт в эту субботу.

На ней много классных спикеров будут рассказывать о том, как использовать данные, чтобы вызывать интерес у публики. Например, год назад я рассказывал про дилемму Тафти и Холмса — один был мастером вызывающих визуальных метафор, другой пропагандировал максимальную строгость и простоту в инфографике.

В этом году я не смог выступить на конфе, но вас — зову! Регистрируйтесь, будет точно интересно 🙌

Читать полностью…

data.csv

В Германии более 9 тысяч улиц с названием Lindenstraße (дословно — липовая улица). Все они — на одной визуализации

Как думаете, какая улица в России могла бы с ней потягаться?

koriander/113529613040260508">Источник

Читать полностью…

data.csv

Почему все так любят песню Creep?

Выпускники предыдущего потока «Эстетики в графиках» сделали много крутейших работ, но эта — скрывать не буду — моя любимая 🥰

Ольга Хлопкова проанализировала творчество Radiohead и нашла там потрясающую историю, связанную с песней Creep. Особенно здорово получилось воплотить оформление:

В процессе работы я стала замечать, что очень негодую по поводу разрыва в количестве прослушиваний песни «Creep» и других треков. Группа выпускала такие сильные и разнообразные пластинки, а мир знает и слушает только «Creep», песню, от которой меня, лично, тошнит! И оказалось, не только меня!

Почитав интернеты, узнала, что вокруг «Creep» есть история. Песню сначала не приняли в Великобритании, но спустя год она с фурором ворвалась в американские чарты и сердца. В штатах настолько любили эту песню, что бедный коллектив заставили 4 раза подряд её сыграть, чтобы снять лучший ракурс. Люди приходили на выступления Radiohead, требовали «Creep» и уходили сразу после того, как группа ее исполняла.

Первые идеи и наброски инфографики я делала в заметках на планшете и это настолько симпатично выглядело, что было принято решение делать весь проект в стиле скетчей. Частично из-за этого, а также чтобы не перегружать аудиторию сложной инфографикой, в проекте, в основном, я использовала барчарты.

Диаграммы были созданы с использованием библиотеки roughViz, а окончательная сборка и оформление выполнены в Figma.
PS. В этой работе нет громких выводов и открытий, это фановая аналитическая история вокруг песни, которую я не люблю :)


Третий поток курса по визуализации данных стартует уже на следующей неделе. Запрыгнуть в последний вагон:
https://clck.ru/3Eqxeb

#работы_студентов

Читать полностью…

data.csv

Инфографика про скалолазание!

В качестве дипломного проекта моя студентка Мария Павлова выбрала тему спортивного скалолазания. Оказалось, по этому виду спорта можно найти много интересных инсайтов, которые хорошо ложатся в интересную, разнообразную и местами даже сложную инфографику.

Отдельный респект выражаю за первую пояснительную карточку, которую Мария сама собрала в фигме 🔥

Моя работа — серия карточек со статистикой спортивного скалолазания.

Этот вид спорта недавно стал олимпийским — с Токио-2020, что повлияло на его развитие. Например, большинство спортсменов специализируются более, чем в одном виде скалолазания. А на первых Олимпийских играх выступали только в многоборье — комбинированном зачете трёх дисциплин: то есть во всех сразу, не каждый — в своей. А ещё — с вступлением в Олимпийское движение стало больше рекордов в лазании на скорость.

Также я постаралась отразить интересные паттерны на основе данных. Например, выигрывают первые места и ставят рекорды — как вчерашние юниоры, так и возрастные спортсмены. А в мировом рейтинге «скорости» в топ-30 входят и спецы, то есть спортсмены одной дисциплины, и универсалы-многоборцы.

Захотелось проследить путь отдельных спортсменов: многие известные скалолазы не раз становились победителями и рекордсменами. Так по рекомендации Лёши появился connected scatter plot, где на временной шкале отражены повторяющиеся победы чемпионов мира. Кстати, российские спортсмены довольно успешны в скалолазании ;)


Записаться на третий поток курса и тоже собрать интересную историю на основе данных под моим руководством можно тут:
https://clck.ru/3Em66L

#работы_студентов

Читать полностью…

data.csv

Через час встречаемся в прямом эфире на разбор графиков!

Эфир будет прямо в канале — вы увидите уведомление в верхней части экрана.

В этот раз я задумал эксперимент. Обычно, ожидая, пока люди собираются на эфир, я пробую разные тактики. Иногда мы смотрим интересные работы из мира дата-журналистики, иногда молчим и смотрим друг на друга :)

В этот раз я спою вам пару песен под гитару. Кто хочет это услышать, подключайтесь ровно в 20:00 😁

А этот пост можно использовать для комментариев к эфиру

Читать полностью…

data.csv

Осталась ли любовь в песнях про любовь?

В этом пытаются разобраться The Pudding, разбирая песни из Billboard Top 10.

Не желая проспойлерить вам выводы, отмечу лишь то, что, судя по всему, представление любви в музыкальной поп-культуре трасформировалось, стало более многообразным и смелым.

Кстати, это пример классного дата-сторителлинга, когда один набор данных рассматривают с разных сторон, и показывают поэтапно с большим количеством подробностей. И виды графиков можно взять на заметку!

https://pudding.cool/2024/11/love-songs/

Читать полностью…

data.csv

Как ест, закупается и спит «синяя» и «красная» Америка

Любопытный анализ опубликовали в The New York Times. Там придумали скрестить данные об организациях и результаты выборов в США. Так открывается интересный взгляд на мнение о том, что типичный «синий» и типичный «красный» избиратель живут совершенно в разных мирах.

Так, в районах, где победили демократы, на одного избирателя приходится больше коктейльных баров, Starbucks, студий йоги и буддистских храмов. В республиканских районах больше мормонских цервкей, магазинов оружия и бейсбольных полей.

Авторы справедливо указывают, что по любви к бейсболу, йоге или религии нельзя прямо говорить о политических предпочтениях человека, и что многие связи банально произрастают из характера местности, где расположены более демократические или более консервативные районы. Так, более демократическими считаются крупные города, а более консервативными — небольшие поселения. Однако публикация все равно заставляет задуматься, в каких разных условиях живут два противостоящих друг другу клана.

https://www.nytimes.com/interactive/2024/11/04/upshot/place-politics.html

Вероятно, для просмотра потребуется подписка, режим инкогнито или расширение Bypass Paywalls

Читать полностью…

data.csv

Два объявления от редакции статистики Т—Ж

1. Отдел ищет новых авторов текстов! Нужен человек с опытом в дата-журналистике, который будет анализировать данные о России, искать там выводы и писать об этом тексты.

Оплата сдельная — платить будут по количеству написанных статей. Совмещать можно с основной работой.

https://journal.tinkoff.ru/author-stat/

2. Объявление для дизайнеров (любых)

Коллеги собирают информацию о зарплатах, чтобы обновить своё классное большое исследование

https://journal.tinkoff.ru/opros-pro-zarplaty-dizainerov/

Прошедшим обещают подарки, а результаты будут полезны всему сообществу

Читать полностью…
Subscribe to a channel