data_csv | Unsorted

Telegram-канал data_csv - data.csv

13755

Блог о журналистике данных и дата-сторителлинге Ведёт @BlackPineapple — аналитик в службе дата-журналистики Яндекса

Subscribe to a channel

data.csv

Яндекс сделал свой генеративный язык, который позволяет рисовать валентинки.

Все параметры можно описать js-подобным кодом, но можно и «натыкать» в интерфейсе, если с кодом вы не дружите

Ну прелесть?
https://ya.ru/lovescript

Читать полностью…

data.csv

Пока москвичи радуются стремительному развитию транспортной доступности, метро в других городах не может похвастаться такими успехами

Собака.ru в новом дата-материале рассказывает, как обстоят дела в Северной столице. За последние 10 лет метро в Питере строилось даже хуже, чем в 90-ые, хотя планы были хорошие...

https://www.sobaka.ru/city/transport/194548

Читать полностью…

data.csv

Вот вам идея для дата-исследования:

1) взять список популярных в мире музыкальных групп (например, из чартов Billboard Hot 100) и отобрать 100 самых прослушиваемых за каждый год
2) выгрузить с Setlist.fm все их концерты (обычно там всё подробно, вот пример)
3) посмотреть, как часто популярные артисты в разных жанрах на своих крупных выступлениях практикут «выход на бис»

Гипотеза — крупные артисты больше на бис не выходят. По крайней мере, так пишет колумнист издания The Paper.

А у меня для вас исследования нет, зато будет песня, которая так и называется — «Мы не выходим на бис». Это задорный и ироничный рок в духе Sum 41, который рассказывает о ценности момента.

Выйдет она в следующий четверг, но по правилам музыкальных площадок, чтобы эту песню могло услышать много людей, она должна получить много «пресейвов». Это заочный «лайк» песне, который напомнит вам о релизе.

Для вас — одна минута и один клик, для меня — возможно — много-много радости от новых слушателей 🥺

Поставить пресейв можно тут: https://band.link/RveEX

Читать полностью…

data.csv

New York Times в своём материале раскрывают проблемы двухпартийной системы США в конгрессе, которая сложилась из принципа «победитель получает всё».

Партия, победившая в избирательном округе, в итоге забирает все места в конгрессе, из-за чего недопредставленными остаются как сторонники проигравшей партии, так и люди, не нашедшие своего кандидата. Отчасти это копенсируется неожиданными союзами, из-за которых в одной партии оказываются сторонники радикально разных взглядов.

Не мне рассуждать об американской политике, но в моих силах заметить тренд на скошенные Scatter Plot'ы в визуализации данных. В этот раз такое необычное положение особнованно метафорой — все либеральные показатели сконцентрированы слева, а все консервативные — справа.

https://www.nytimes.com/interactive/2025/01/14/opinion/fix-congress-proportional-representation.html

Читать полностью…

data.csv

New York Times пишут про проблему, которая может привести к потенциальной стагнации генеративных нейросетей.

Дело в том, что для улучшения моделей нужно много контента, который создатели сеток беспорядочно пылесосят из интернета. Но вот незадача — в интернете становится всё больше контента, который уже сгенерирован нейросетями. И оказывается, что сетки, обученные на сгенерированном контенте, с каждой итерацией начинают выдавать всё большую чушь.

New York Times понятно и популярно объясняют, почему качественное определение сгенерированного контента — это сейчас вопрос выживания для компаний, занимающихся разработкой подобных моделей

https://www.nytimes.com/interactive/2024/08/26/upshot/ai-synthetic-data.html

Вероятно, для просмотра потребуется подписка, режим инкогнито или расширение Bypass Paywalls

Читать полностью…

data.csv

Очаровательный проект про одинаковые имена на выборах в Индии.

Есть там такая проблема на выборах разных уровней: в одном бюллетене могут оказаться кандидаты с крайне созвучными именами. Автор приводит пример, когда однажды выбирать предстояло из четырёх Gandhi, трое из которых к тому же были и Rahul'ами. Неприятно.

Материал притягателен разными формами подачи: тут и иллюстрации, и графы, и интерактив.

https://diagramchasing.fun/2024/votes-in-a-name

Читать полностью…

data.csv

Смотрите, какая очаровательная штучка от NASA!

На лендинге можно ввести своё имя, и получить набор спутниковых снимков, на которых местность напоминает буквы из него. На каждое место можно клинкуть, посмотреть, где оно находится.

https://landsat.gsfc.nasa.gov/apps/YourNameInLandsat-main/index.html

Читать полностью…

data.csv

В материале SCMP помимо прочего есть такой симпатичный дата-арт

На инфографике показана активность Солнца за последние почти 200 лет. Временной ряд идёт по спирали, а цвет и одновременно размер полосочек показывает среднее за год число пятен на Солнце.

Читать полностью…

data.csv

В декабре я побывал в Гонконге, где своими глазами увидел одно из самых впечатляющих шоу в своей жизни. Прямо над бухтой Виктория в воздух взлетели дроны, создавая светящиеся изображения милых панд: они анимировались, искрились и плавно перетекали в другие формы.

Огромные панды на фоне небоскрёбов выглядели так, словно кто-то смонтировал видео со спецэффектами, но всё это происходило на самом деле.

И вот South China Morning Post выпускает инфографику, которая объясняет, как устроены такие шоу, и что может помешать их проведению.

После завершения разработки дизайна каждый дрон программируется со всеми необходимыми данными: точным местоположением, высотой и цветом подсветки в каждый момент шоу. Эти данные загружаются в контроллеры полёта дронов, что позволяет им автономно выполнять представление.

Во время шоу дроны не общаются друг с другом и не получают инструкций в режиме реального времени. Вместо этого они независимо друг от друга следуют по заранее запрограммированным траекториям, подобно танцорам, выступающим по памяти.


https://multimedia.scmp.com/infographics/news/world/article/3292066/drone-shows/index.html

Читать полностью…

data.csv

Планируя 2025 год, важно помнить о правиле: за каждым большим делом всегда стоят маленькие шаги

Очень мне нравится эта метафора в картиночках @newhappyco

У них вообще клёвый стиль: выглядит как визуализация данных, но в основе скорее что-то философское про жизнь

Источник:
https://www.instagram.com/newhappyco

Читать полностью…

data.csv

Мой дата-год ❤‍🔥

Хочется зафиналить 2024, рассказав себе и вам о самых важных своих дата-активностях

1⃣ Придумал и запустил свой курс по визуализации данных. Испытываю огромное удовольствие от обсуждений со студентами и особенно работы над финальными проектами.

Прошло уже два потока, за время которых ребята сделали много крутейших работ. Посмотреть их можно тут: #работы_студентов@data_csv

2⃣ Выпустил два исследования вместе со своей прекрасной командой в Яндексе: про то, как изменился климат России за 70 лет, и о том, что заказывают в доставке в разных городах страны.

3⃣ Много выступал. Съездил на фестиваль TIME CODE в Екатеринбург, выступил на главной сцене Матемаркетинга, прочитал две лекции на Летней Школе под Дубной; ходил в гости к магистрам из Вышки, а ещё провёл тренинги для своих коллег из Яндекс Лавки и команды 1C.

А ещё — вёл вебинары для студентов своего курса и профессии «Дата-журналист» в Нетологии.

4⃣ Сделал исследование для Картетики о рынке ГИС-специлистов, которые они презентовали на своей конференции Мапакон. Некоторые выводы есть в двух материалах, которые они выпустили «по следам»: 1, 2

5⃣ Разработал небольшой курс по дата-журналистике в МГУ. Коллега в рамках этого курса предложил использовать платформу «Яндекс Контест» для проверки заданий. Студенты загружали эксельки в систему, мы писали тесты, и программа автоматически проверяла работы. Опыт был любопытный, хотя и местами стрессовый

6⃣ Написал для Т—Ж цикл авторских материалов под кодовым названием «Одураченные статистикой»: о том, какие манипуляции осознанно или неосознанно используют авторы графиков, чтобы нас запутать

Спасибо, что следите и читаете! 20 тысяч пересылок и почти полторы тысячи комментариев — это мощь 😍

Читать полностью…

data.csv

Дата-сторителлинг по-шанхайски: заходишь во двор жилого дома, а там цифры висят. Эти цифры — доля вакцинированных жителей в доме.

Увидишь низкое число, значит, к этим не ходи, люди это нехорошие 😁

Читать полностью…

data.csv

«Если быть точным» не так давно обновили датасет с супер-детализированными статистическими данными — в разрезе муниципальных образований. Такие данные достать очень непросто: Росстат почти всегда даёт статистику в разрезе региона и на уровни ниже в легкодоступных датасетах не спускается. Кроме того, коллеги уже сами свели таблички за разные годы в один датасет и почистили ошибки.

Остаётся приятная, но в то же время необъятная работа — исследовать это всё! Своих героев ждут 582 социально-экономических показателя.

Если у вас есть знакомые аналитики — покажите это им. Особенно ценен будет интерес со стороны тех, у кого есть отраслевая или региональная экспертиза, — с ней будет проще найти интересные сюжеты и интерпретировать результаты.

Го делать классные истории?
https://tochno.st/datasets/bdmo

P.S. картинка случайная из интернета, просто чтобы вы понимали уровень детализации

Читать полностью…

data.csv

Сделали с коллегами из Яндекса тур по гастрономическим предпочтениям жителей разных городов России, изучив заказы из доставки.

Для меня одним из главных вызовов в этом проекте стала разметка категорий блюд по названиям и категориям. Оказалось, что в Яндекс Еде бургерные гиганты типа «Вкусно и точка» или «Бургер кинг» мало того, что не называют свои бургеры бургерами (а придумали всякие вопперы и биг хиты...), у них ещё и категорий таких в каталоге нет. В общем, приходилось изучать всю сетку их названий, чтобы корректно ловить такое регулярками 🥵

Долго стоически держался Калининград — когда в какой-то версии разметки бургеры лидировали почти во всех городах, там первыми были супы. В итоге бургеры всё же победили — с небольшим отрывом.

А что ещё помимо бургеров заказывают в доставке, читайте в нашем интерактивном проекте:
https://yandex.ru/company/researches/2024/food-in-cities

Читать полностью…

data.csv

Новая порция дата-шарад от @datacitron! В этом году отгадываем музыкальные группы. Кого узнали? Пишите в комменты! Лично мне очень сложно 🙈

Год назад были книги и фильмы:
/channel/data_csv/1024

Читать полностью…

data.csv

В прошлом году я делал для «Картетики» исследование и инфографику о работе и зарплатах в сфере ГИС, а теперь флаг перехватила моя студентка — Ольга Хлопкова.

Получилось отлично. Если вы работаете в этой области — обязательно следите за серией, пока вышла только первая часть исследования:
https://cartetika.ru/tpost/bfolz40031-analiz-geo-sferi-2024-chast-1-znakomstvo

А если вам нужен такой датавиз — пишите, за два потока «Эстетики в графиках» уже выпустилось немало звёздочек, попробуем найти вам классного инфографера 🙌

#работы_студентов@data_csv

Читать полностью…

data.csv

Коллеги собрали красивый-красивый проект о том, когда ставят встречи пользователи Яндекс Календаря

Помимо «солнца встреч», которым можно полюбоваться в начале лендинга, есть много занятных выводов.

Например, что в начале дня чаще ставят более длинные встречи. Или что раньше всего встречи ставят сотрудники ЖКХ и производств, а позже всех — айтишники и креаторы.

https://yandex.ru/company/researches/2025/calendar

Читать полностью…

data.csv

Т—Ж решил опросить своих читателей, чтобы узнать, действительно ли «троечники» более успешны, чем отличники

По субъективным ощущениям кажется, что — да. По крайней мере, троечники чаще отвечают, что довольный карьерой, и она движется быстрее, чем у окружающих.

Но метод, как мне кажется, мудрённый. Сходу не понять — среди троечников довольных примерно в два раза больше?
Я бы предпочёл смотреть на долю довольных, чем на не очень понятные коэфициенты.

Ещё прикольно, что «троечники» и «отличники» по-разному отвечали про качества, которые помогают им в работе. Первые значительно больше опираются на умение учиться на ошибках и смекалку, а вторые — на терпение и широкий кругозор.

И жаль про зарплаты ничего, хотелось бы опираться на что-то объективное, а не на самоощущения!

https://journal.tinkoff.ru/opros-pro-otsenki-rez/

Читать полностью…

data.csv

Дата-сторителлинг на большой сцене

Если вы посмотрите видео, то обнаружите на нём человека, выкрикивающего разные источники данных. Это титры к спектаклю «Человек среднестатистический», премьера которого состоялась вчера в Театре Ермоловой (Москва).

Вся постановка строится на данных официальной статистики, опросах и данных частных компаний, рисуя портреты персонажей. Особенно я порадовался, когда в какой-то момент со сцены цитировали данные одного из исследований Яндекса 😄

Спектакль очень сильно отличается от всего, что я раньше видел в театре. Это непривычно и может зайти не каждому. Но мне понравилось: получилось необычно, мило и моментами смешно.

Повторные показы планируют 5 и 27 февраля, так что берите билеты, если вдруг вас заинтересовало:
https://www.ermolova.ru/afisha/view/218/

Читать полностью…

data.csv

Любопытно. Чтобы серьёзно это воспринимать, критически не хватает чисел и ограничений данных — например, какие страны вошли в выборку и за какой год (UPD: источник намекает, что это может быть только Великобритания)

Но двухсекундный фактчек показал, что это должно быть близко к правде:

В 2021 году 933 тысячи россиян умерли от болезней сердца и сосудов, 283 тысячи — от злокачественных новообразований.

— Т—Ж

В январе - ноябре 2024 года зарегистрировано 6,4 тыс. убийств (с покушениями), что ниже на 7,1% уровня сопоставимого периода 2023 года

— ТАСС

Тут интересно и важно, что инфографика вызывает эмоцию: с гораздо большей вероятностью вы умерёте от заболеваний (проще сказать, от старости), чем от внешних факторов — убийств, несчастных случае и т.д

Это, кстати, можно было и цветом выделить 👀

Читать полностью…

data.csv

Изучал материалы предыдущего года и нашёл такую залипательную анимацию о том, как в мире менялось число ядерных боеголовок

Вообще весь материал NYT про ядерное оружие — это просто какой-то впечатляющий боевик, просто полюбуйтесь:

https://www.nytimes.com/interactive/2024/03/07/opinion/nuclear-war-prevention.html

Вероятно, для просмотра потребуется подписка, режим инкогнито или расширение Bypass Paywalls

Читать полностью…

data.csv

Как начать работать с SQL?

Пройдите бесплатный мини-курс “SQL для новичков” от Changellenge >> Education и освойте SQL всего за 5 часов и получите практические знания, необходимые для работы с базами данных.

🔥 Преимущества курса:
- Выделите всего 5 часов на обучение,
- Изучите ключевые функции и операторы SQL,
- Получите видео-разборы от эксперта,
- Выполните более 30 практических заданий.

🎁 За прохождение мини-курса вы получите скидку 10 000 рублей на обучение на программе "Аналитик данных" от Changellenge >> Education.

📅 Скорее регистрируйтесь, осталось всего 15 свободных мест: https://u.to/TKREIQ

Реклама. ООО «Высшая школа аналитики и стратегии». ИНН 7716917009. erid:2VtzqxAmdq5

Читать полностью…

data.csv

Вот несколько моих видео с того самого шоу в Гонконге, на которое я попал

Читать полностью…

data.csv

Андрон Алексанян собрал список интересных и актуальных авторских каналов, посвящённых аналитике. data.csv уже несколько лет входит в подборки Андрона, что очень приятно 😌

В статье есть ссылки, описания каналов и примеры любопытных постов:

https://habr.com/ru/articles/869116/

Читать полностью…

data.csv

Анализ новогодних обращений президента от студентов магистратуры ВШЭ

Настроение, популярные темы и пожелания — в карточках

Авторы: Валерия Немна, Филипп Попов, Владимир Малючков

Читать полностью…

data.csv

Моё уважение коллегам из «Новой газеты Европа», которые сделали очень подробный калькулятор инфляции с 2019 года, называется «Новогодняя корзина»

Можно буквально собрать корзину из привычных для вас товаров, и посмотреть, как поменялась цена каждого; можно посмотреть на готовые наборы.

Новая-Европа — нежелательная организация в России, за распространение ссылок на их материалы граждане РФ могут получить наказание, поэтому ссылки здесь не будет.

Читать полностью…

data.csv

Во время моей поездки в Японию я выкладывал много инфографики, которую находил в городе

Кажется, многим это понравилось, мне недавно даже коллега выразила за это отдельный респект. Поэтому продолжим рубрику!

Сейчас я в Шанхае, в музее шоколада. Как вам кажется, что показывает график снизу? Правильный ответ выложу под спойлер в комментарии :)

Читать полностью…

data.csv

Вот такие тренды 2024 года: курьер — одна из самых востребованных и хорошо оплачиваемых профессий

Ещё оказалось, что из-за нехватка рабочей силы работодатели начали снижать требования к сотрудникам, и всё больше становится вакансий, куда готовы брать вообще без опыта.

https://journal.tinkoff.ru/roles-count-2024/

Читать полностью…

data.csv

Моей коллеге и подруге Кристине Уласович нужна помощь

Вы уже могли видеть этот пост в других датавиз-пабликах, но это тот случай, когда максимально широкая огласка может спасти жизнь

Кристина ищет контакты в системе здравоохранения, чтобы спасти маму.
Если вы знаете, как помочь — напишите ей: @ave_kirsten

Дорогие все.

Так случилось, что в моей семье ужасное горе - мама заболела раком, IV стадия.
Не передать словами, насколько ужасный был месяц: 3 недели в реанимации, опасная для жизни операция, ТЭЛА.

Она сейчас в состоянии средней тяжести после всего пережитого — у нее пневмония, нарушены двигательные функции, кислородотерапия. Но есть положительная динамика по восстановлению.

В таком состоянии, как у нее сейчас, химию делать нельзя. А ей она нужна, потому что есть метастазы. Единственный наш шанс — это чтобы мама долечилась и прошла реабилитацию. Однако наша больница долечивать ее не очень хочет и настаивает на паллиативе, но остановиться на полпути, сдать ее в хоспис и опустить руки сердце мне не позволяет.

Я обычно стараюсь все вытянуть сама, но тут мне просто не хватает собственной мощи. Если вы знаете кого-то, кто мог бы помочь в этой ситуации - может быть, маму удастся перевести лечиться в другую больницу, в реабилитационный центр, где ей можно будет дать шанс восстановиться - или знаете, что можно ещё сделать, то напишите мне или просто поделитесь моей историей.

Скоро Новый год, и моей семье очень нужно чудо. Я уже потеряла папу в 2018 году, и я должна попытаться сделать все, чтобы не потерять еще и маму.

P. S. Если вы или ваши родители знакомы с моей мамой, то пока что ей не пишите, пожалуйста. Она не знает всю полноту диагноза, сейчас ей это не нужно — иначе страх застопорит прогресс.

Читать полностью…

data.csv

Рисовали сегодня с магистрантами МГУ

Особенно мне запомнилась работа «что слушает мой дядя, когда выпивает с друзьями» 😁

На карточке нарисован топ треков по числу прослушиваний с разбивкой по жанру (цвет). Каёмка у названия обозначает десятилетие, длина горлышка — оценка, ширина бутылки — общее время прослушивания

В топ попали Chop Suey, Выхода нет и Numb

Читать полностью…
Subscribe to a channel