data_csv | Unsorted

Telegram-канал data_csv - data.csv

13755

Блог о журналистике данных и дата-сторителлинге Ведёт @BlackPineapple — аналитик в службе дата-журналистики Яндекса

Subscribe to a channel

data.csv

Привет! Хотела написать тебе большую благодарность. Благодаря тебе, твоему курсу и менторству, у меня в жизни поменялось многое. Наверное самое важное - пропал страх пробовать и ошибаться, учиться на ошибках и идти и расти дальше.
Я подалась на IIB, просто чтоб получить опыт подачи и перешагнуть через страх свой. Не было никаких ожиданий и надежд вообще. И сегодня получила письмо, что работа вошла в long list. Для меня это нечто просто невообразимое. Я сейчас сижу со сломанной ногой и болеющая, и эта новость просто сейчас меня исцелит, кажется 🤣 Очень захотелось поделиться с тобой и еще раз написать спасибо. То, что ты даешь людям, бесценно 🙏

Читать полностью…

data.csv

Зову вас на новый поток своего курса по визуализации данных

На следующей неделе мы завершим работу со студентами третьего потока, и в мире станет немного больше людей, умеющих делать красивую и понятную инфографику. Хотите в наши ряды?

Приходите на курс «Эстетика в графиках», и вы:

🟡Научитесь делать визуализации, которые будут сразу понятны коллегам и начальству. Вопросов «а что тут имелось ввиду» станет кратно меньше;

🟡Поймёте, как делать графики, которые рассказывают истории;

🟡Изучите разные инструменты визуализации данных — Tableau, Flourish, Figma — и поймёте, в каких случаях их стоит использовать;

🟡Получите профессиональное преимущество, ведь любой заказчик любит, когда «красивенько»;

В конце курса все студенты делают собственный проект, где можно будет включить внутреннего исследователя, покопаться в данных и сделать инфографику, которая станет украшением для портфолио. Вот несколько примеров с прошлых потоков:

раз, два, три, четыре, больше по тегу #работы_студентов@data_csv

Посмотреть программу, отзывы и подробности, а также записаться можно тут: https://clck.ru/3HJc6r

❗️По предзаписи — самые большие скидки, тариф с обратной связью стоит 24.900 вместо 35.000 руб.

Вы можете оплатить полную стоимость, а можете только забронировать место и цену за 1000₽. Для этого при оплате нужно нажать кнопку «Частичная оплата»

Предзапись будет открыта до 15 марта включительно. Есть рассрочка на срок до 12 месяцев, по ней ваша переплата — 0 руб.


Старт — 12 апреля
Длительность 3 месяца

Если будут вопросы по программе, формату или способу оплаты, пишите моему коллеге Олегу @Oleggiios — он всё расскажет!

Читать полностью…

data.csv

Пять (!) лет назад мы запирались дома, носили маски и активно осваивали зум. Вы можете в это поверить?

Последствия пандемии коронавируса до сих пор ощущаются в статистике: если некоторые показатели вернулись «в тренд», то другие уже никогда не станут прежними. New York Times собрали 30 графиков о том, как изменился мир после COVID-19:

https://www.nytimes.com/interactive/2025/03/09/upshot/covid-lockdown-five-year-charts.html

А в вашей жизни что-то изменилось после пандемии?

Читать полностью…

data.csv

Как повышение ключевой ставки отразилось на вкладах и кредитах?

Отвечает Т—Ж в своём новом материале: «шоковое» повышение в начале 22 года повлияло в первую очередь на снижение кредитов, постепенное повышение ставки в 23 году стало работать уже на вклады.

Показательна и карта долгов и накоплений:
Напрочь закредитованный Северный Кавказ, бедная Сибирь и сберегательный Центр.

Кстати, в Ямало-Ненецком АО, судя по статистике, на одного человека приходится в среднем 640 тысяч рублей кредита 🤯

https://t-j.ru/debet-kredit-stat/

Читать полностью…

data.csv

Необычная визуализация от сотрудницы Datawrapper

Она записывала, какие овощи приходят к ней по подписочному сервису в течение года, и в итоге сделала об этом график.

Поражает, что такая нестандартная визуализация собрана внутри сервиса — и по сути это кастомизированный Scatter Plot.

Картинка длинная и интерактивная, так что вдохновиться приходите сюда:
https://blog.datawrapper.de/my-vegetable-subscription/

Читать полностью…

data.csv

Любопытная база данных, которая позволяет выбирать книгу по месту действия, полу, возрасту и расе персонажей, а также по ряду оценок: от весёлой до грустной, от возвышенной до приземлённой, от сексуализированной до асексуальной.

Если вы искали, что почитать, теперь вы знаете, ещё один способ подобрать книгу:
https://www.whichbook.net/character-plot/

Читать полностью…

data.csv

Яндекс сделал свой генеративный язык, который позволяет рисовать валентинки.

Все параметры можно описать js-подобным кодом, но можно и «натыкать» в интерфейсе, если с кодом вы не дружите

Ну прелесть?
https://ya.ru/lovescript

Читать полностью…

data.csv

Пока москвичи радуются стремительному развитию транспортной доступности, метро в других городах не может похвастаться такими успехами

Собака.ru в новом дата-материале рассказывает, как обстоят дела в Северной столице. За последние 10 лет метро в Питере строилось даже хуже, чем в 90-ые, хотя планы были хорошие...

https://www.sobaka.ru/city/transport/194548

Читать полностью…

data.csv

Вот вам идея для дата-исследования:

1) взять список популярных в мире музыкальных групп (например, из чартов Billboard Hot 100) и отобрать 100 самых прослушиваемых за каждый год
2) выгрузить с Setlist.fm все их концерты (обычно там всё подробно, вот пример)
3) посмотреть, как часто популярные артисты в разных жанрах на своих крупных выступлениях практикут «выход на бис»

Гипотеза — крупные артисты больше на бис не выходят. По крайней мере, так пишет колумнист издания The Paper.

А у меня для вас исследования нет, зато будет песня, которая так и называется — «Мы не выходим на бис». Это задорный и ироничный рок в духе Sum 41, который рассказывает о ценности момента.

Выйдет она в следующий четверг, но по правилам музыкальных площадок, чтобы эту песню могло услышать много людей, она должна получить много «пресейвов». Это заочный «лайк» песне, который напомнит вам о релизе.

Для вас — одна минута и один клик, для меня — возможно — много-много радости от новых слушателей 🥺

Поставить пресейв можно тут: https://band.link/RveEX

Читать полностью…

data.csv

New York Times в своём материале раскрывают проблемы двухпартийной системы США в конгрессе, которая сложилась из принципа «победитель получает всё».

Партия, победившая в избирательном округе, в итоге забирает все места в конгрессе, из-за чего недопредставленными остаются как сторонники проигравшей партии, так и люди, не нашедшие своего кандидата. Отчасти это копенсируется неожиданными союзами, из-за которых в одной партии оказываются сторонники радикально разных взглядов.

Не мне рассуждать об американской политике, но в моих силах заметить тренд на скошенные Scatter Plot'ы в визуализации данных. В этот раз такое необычное положение особнованно метафорой — все либеральные показатели сконцентрированы слева, а все консервативные — справа.

https://www.nytimes.com/interactive/2025/01/14/opinion/fix-congress-proportional-representation.html

Читать полностью…

data.csv

New York Times пишут про проблему, которая может привести к потенциальной стагнации генеративных нейросетей.

Дело в том, что для улучшения моделей нужно много контента, который создатели сеток беспорядочно пылесосят из интернета. Но вот незадача — в интернете становится всё больше контента, который уже сгенерирован нейросетями. И оказывается, что сетки, обученные на сгенерированном контенте, с каждой итерацией начинают выдавать всё большую чушь.

New York Times понятно и популярно объясняют, почему качественное определение сгенерированного контента — это сейчас вопрос выживания для компаний, занимающихся разработкой подобных моделей

https://www.nytimes.com/interactive/2024/08/26/upshot/ai-synthetic-data.html

Вероятно, для просмотра потребуется подписка, режим инкогнито или расширение Bypass Paywalls

Читать полностью…

data.csv

Очаровательный проект про одинаковые имена на выборах в Индии.

Есть там такая проблема на выборах разных уровней: в одном бюллетене могут оказаться кандидаты с крайне созвучными именами. Автор приводит пример, когда однажды выбирать предстояло из четырёх Gandhi, трое из которых к тому же были и Rahul'ами. Неприятно.

Материал притягателен разными формами подачи: тут и иллюстрации, и графы, и интерактив.

https://diagramchasing.fun/2024/votes-in-a-name

Читать полностью…

data.csv

Смотрите, какая очаровательная штучка от NASA!

На лендинге можно ввести своё имя, и получить набор спутниковых снимков, на которых местность напоминает буквы из него. На каждое место можно клинкуть, посмотреть, где оно находится.

https://landsat.gsfc.nasa.gov/apps/YourNameInLandsat-main/index.html

Читать полностью…

data.csv

В материале SCMP помимо прочего есть такой симпатичный дата-арт

На инфографике показана активность Солнца за последние почти 200 лет. Временной ряд идёт по спирали, а цвет и одновременно размер полосочек показывает среднее за год число пятен на Солнце.

Читать полностью…

data.csv

В декабре я побывал в Гонконге, где своими глазами увидел одно из самых впечатляющих шоу в своей жизни. Прямо над бухтой Виктория в воздух взлетели дроны, создавая светящиеся изображения милых панд: они анимировались, искрились и плавно перетекали в другие формы.

Огромные панды на фоне небоскрёбов выглядели так, словно кто-то смонтировал видео со спецэффектами, но всё это происходило на самом деле.

И вот South China Morning Post выпускает инфографику, которая объясняет, как устроены такие шоу, и что может помешать их проведению.

После завершения разработки дизайна каждый дрон программируется со всеми необходимыми данными: точным местоположением, высотой и цветом подсветки в каждый момент шоу. Эти данные загружаются в контроллеры полёта дронов, что позволяет им автономно выполнять представление.

Во время шоу дроны не общаются друг с другом и не получают инструкций в режиме реального времени. Вместо этого они независимо друг от друга следуют по заранее запрограммированным траекториям, подобно танцорам, выступающим по памяти.


https://multimedia.scmp.com/infographics/news/world/article/3292066/drone-shows/index.html

Читать полностью…

data.csv

Formula is Beautiful

Одна из моих студенток, Светлана Задедюрина, отправила свою дипломную работу с курса на конкурс инфографики Information is Beautiful, и получила вчера весточку — работа вошла в лонглист!

Если вы не из мира датавиза, то расшифрую: жюри ведущей международной премии в области инфографики решило, что работа достойна внимания — и теперь она навсегда останется в подборке крутейших работ по визуализации данных.

Комментарий к своей дипломной работе Светлана изначально отправила мне на английском, поэтому оставлю здесь свой авторский перевод

Мой «роман» с Формулой-1 начался совсем недавно. Увлекаться гонками я начала в этом [2024] году, но всё закрутилось с бешеной скоростью — словно турбированный двигатель. И вот я на Monza Grand Prix — смотрю на соревнования своими глазами.

С другой стороны, страсть к стилю, искусству, моде и, конечно, технологиям со мной всю жизнь. Сочетание этих интересов стало вызовом, перед которым невозможно было устоять, хотя для этого потребовалось серьёзное погружение в данные.

Для работы я в основном использовала Flourish и Observable. В последний инструмент я совершенно влюбилась, несмотря на мою нелюбовь к JavaScript (которое всё ещё лучше то вспыхивающих, то угасающих отношений с Python).

Эксперименты с разными визуализациями стали настоящим приключением. Я попробовала бесчисленное количество графиков, перспектив, историй и инсайтов, добавляла необычные аннотации, направляя читателей по сюжету, и сочетала разные визуалы на одном холсте. <...>

В какой-то момент я поняла, что идеала не достичь — но проект стал по-настоящему моим. А «готово» лучше, чем «идеально».


#работы_студентов

Напомню, что на курсе «Эстетика в графиках» вы тоже сможете поработать над своим датавиз-проектом, получить удовольствие от исследования и блеснуть результатом. А я буду сопровождать вас на всех этапах работы над проектом.

Ещё 4 дня можно записаться на курс с самыми большими скидками, или внести предоплату, сохранив за собой цену:
https://clck.ru/3HNqM6

Читать полностью…

data.csv

всего несколько раз в год открывается набор на мой курс по визуализации данных
если вы ждали — этот пост для вас👇

Читать полностью…

data.csv

Никогда такого не было и вот опять — The Pudding упаковали скучные опросные данные так, что листаешь проект и не можешь оторваться.

В США переход из младшей школы в среднюю совпадает с непростым для подростков возрастом 11–14 лет. В этом возрасте дети острее реагируют на любые социальные взаимодействия: и на поддержку, и на негативный опыт вроде буллинга.

Почему такое совпадение, мягко говоря, не очень удачно?

Если в младшей школе есть один педагог, который устанавливает тесный контакт со своими учениками и способен их морально поддержать, в средней акцент преподавателей смещается на дисциплину и выполнение программных требований. Добавим к этому новые классы, возможную потерю друзей — и получим подростков, которые в свой сложный жизненный период оказались в среде куда менее дружелюбной, чем привыкли.

Ну а если развитие подростков вас не интересует, посмотреть проект в любом случае советую: это потрясающей пример того, как сухая статистика превращается в историю, за которой видишь реальных людей.

https://pudding.cool/2025/02/middle-school/

Читать полностью…

data.csv

Потрясающей красоты датавиз / дата-арт про шутинги в американских школах.

Формы, цвета, анимация — всё тут заставляет прилипнуть к экрану.

Вдохновиться и оценить красоту (лучше с компьютера):
https://alhadaqa.github.io/wakeup/

Читать полностью…

data.csv

«Собака» рассказывает как «Ленфильм», бывший некогда флагманом отечественной киноиндустрии, медленно скатывается в пропасть. Меньше картин, хуже качество, и всё меньше внимания они привлекают.

Почему так получилось:
https://www.sobaka.ru/entertainment/cinema/194995

Читать полностью…

data.csv

Про цензуру на Супербоуле в США

Супербоул — это одно из самых значимых ежегодных событий в Штатах: его смотрят десятки миллионов зрителей, собираются компаниями друзей и семьями. И неминуемо это шоу смотрят дети, поэтому на него налагают множество требований.

Приличные костюмы, приличные песни, приличные жесты. Только вот популярные музыканты, которых приглашают выступать в перерыве между играми, в своих треках в выражениях обычно не стесняются.

Но чего не сделаешь ради шоу! Вот Dr. Dre и Snoop Dogg в своём выступлении заменили 22 из 392 слов. Среди них как и мат, так и просто потенциально оскорбительные выражения — в адрес чернокожих или даже полиции.

О том, как ещё преобразились песни популярных артистов, читайте в материале Washington Post

Читать полностью…

data.csv

В прошлом году я делал для «Картетики» исследование и инфографику о работе и зарплатах в сфере ГИС, а теперь флаг перехватила моя студентка — Ольга Хлопкова.

Получилось отлично. Если вы работаете в этой области — обязательно следите за серией, пока вышла только первая часть исследования:
https://cartetika.ru/tpost/bfolz40031-analiz-geo-sferi-2024-chast-1-znakomstvo

А если вам нужен такой датавиз — пишите, за два потока «Эстетики в графиках» уже выпустилось немало звёздочек, попробуем найти вам классного инфографера 🙌

#работы_студентов@data_csv

Читать полностью…

data.csv

Коллеги собрали красивый-красивый проект о том, когда ставят встречи пользователи Яндекс Календаря

Помимо «солнца встреч», которым можно полюбоваться в начале лендинга, есть много занятных выводов.

Например, что в начале дня чаще ставят более длинные встречи. Или что раньше всего встречи ставят сотрудники ЖКХ и производств, а позже всех — айтишники и креаторы.

https://yandex.ru/company/researches/2025/calendar

Читать полностью…

data.csv

Т—Ж решил опросить своих читателей, чтобы узнать, действительно ли «троечники» более успешны, чем отличники

По субъективным ощущениям кажется, что — да. По крайней мере, троечники чаще отвечают, что довольный карьерой, и она движется быстрее, чем у окружающих.

Но метод, как мне кажется, мудрённый. Сходу не понять — среди троечников довольных примерно в два раза больше?
Я бы предпочёл смотреть на долю довольных, чем на не очень понятные коэфициенты.

Ещё прикольно, что «троечники» и «отличники» по-разному отвечали про качества, которые помогают им в работе. Первые значительно больше опираются на умение учиться на ошибках и смекалку, а вторые — на терпение и широкий кругозор.

И жаль про зарплаты ничего, хотелось бы опираться на что-то объективное, а не на самоощущения!

https://journal.tinkoff.ru/opros-pro-otsenki-rez/

Читать полностью…

data.csv

Дата-сторителлинг на большой сцене

Если вы посмотрите видео, то обнаружите на нём человека, выкрикивающего разные источники данных. Это титры к спектаклю «Человек среднестатистический», премьера которого состоялась вчера в Театре Ермоловой (Москва).

Вся постановка строится на данных официальной статистики, опросах и данных частных компаний, рисуя портреты персонажей. Особенно я порадовался, когда в какой-то момент со сцены цитировали данные одного из исследований Яндекса 😄

Спектакль очень сильно отличается от всего, что я раньше видел в театре. Это непривычно и может зайти не каждому. Но мне понравилось: получилось необычно, мило и моментами смешно.

Повторные показы планируют 5 и 27 февраля, так что берите билеты, если вдруг вас заинтересовало:
https://www.ermolova.ru/afisha/view/218/

Читать полностью…

data.csv

Любопытно. Чтобы серьёзно это воспринимать, критически не хватает чисел и ограничений данных — например, какие страны вошли в выборку и за какой год (UPD: источник намекает, что это может быть только Великобритания)

Но двухсекундный фактчек показал, что это должно быть близко к правде:

В 2021 году 933 тысячи россиян умерли от болезней сердца и сосудов, 283 тысячи — от злокачественных новообразований.

— Т—Ж

В январе - ноябре 2024 года зарегистрировано 6,4 тыс. убийств (с покушениями), что ниже на 7,1% уровня сопоставимого периода 2023 года

— ТАСС

Тут интересно и важно, что инфографика вызывает эмоцию: с гораздо большей вероятностью вы умерёте от заболеваний (проще сказать, от старости), чем от внешних факторов — убийств, несчастных случае и т.д

Это, кстати, можно было и цветом выделить 👀

Читать полностью…

data.csv

Изучал материалы предыдущего года и нашёл такую залипательную анимацию о том, как в мире менялось число ядерных боеголовок

Вообще весь материал NYT про ядерное оружие — это просто какой-то впечатляющий боевик, просто полюбуйтесь:

https://www.nytimes.com/interactive/2024/03/07/opinion/nuclear-war-prevention.html

Вероятно, для просмотра потребуется подписка, режим инкогнито или расширение Bypass Paywalls

Читать полностью…

data.csv

Как начать работать с SQL?

Пройдите бесплатный мини-курс “SQL для новичков” от Changellenge >> Education и освойте SQL всего за 5 часов и получите практические знания, необходимые для работы с базами данных.

🔥 Преимущества курса:
- Выделите всего 5 часов на обучение,
- Изучите ключевые функции и операторы SQL,
- Получите видео-разборы от эксперта,
- Выполните более 30 практических заданий.

🎁 За прохождение мини-курса вы получите скидку 10 000 рублей на обучение на программе "Аналитик данных" от Changellenge >> Education.

📅 Скорее регистрируйтесь, осталось всего 15 свободных мест: https://u.to/TKREIQ

Реклама. ООО «Высшая школа аналитики и стратегии». ИНН 7716917009. erid:2VtzqxAmdq5

Читать полностью…

data.csv

Вот несколько моих видео с того самого шоу в Гонконге, на которое я попал

Читать полностью…

data.csv

Андрон Алексанян собрал список интересных и актуальных авторских каналов, посвящённых аналитике. data.csv уже несколько лет входит в подборки Андрона, что очень приятно 😌

В статье есть ссылки, описания каналов и примеры любопытных постов:

https://habr.com/ru/articles/869116/

Читать полностью…
Subscribe to a channel