13755
Блог о журналистике данных и дата-сторителлинге Ведёт @BlackPineapple — аналитик в службе дата-журналистики Яндекса
Привет! Хотела написать тебе большую благодарность. Благодаря тебе, твоему курсу и менторству, у меня в жизни поменялось многое. Наверное самое важное - пропал страх пробовать и ошибаться, учиться на ошибках и идти и расти дальше.
Я подалась на IIB, просто чтоб получить опыт подачи и перешагнуть через страх свой. Не было никаких ожиданий и надежд вообще. И сегодня получила письмо, что работа вошла в long list. Для меня это нечто просто невообразимое. Я сейчас сижу со сломанной ногой и болеющая, и эта новость просто сейчас меня исцелит, кажется 🤣 Очень захотелось поделиться с тобой и еще раз написать спасибо. То, что ты даешь людям, бесценно 🙏
Зову вас на новый поток своего курса по визуализации данных
На следующей неделе мы завершим работу со студентами третьего потока, и в мире станет немного больше людей, умеющих делать красивую и понятную инфографику. Хотите в наши ряды?
Приходите на курс «Эстетика в графиках», и вы:
🟡Научитесь делать визуализации, которые будут сразу понятны коллегам и начальству. Вопросов «а что тут имелось ввиду» станет кратно меньше;
🟡Поймёте, как делать графики, которые рассказывают истории;
🟡Изучите разные инструменты визуализации данных — Tableau, Flourish, Figma — и поймёте, в каких случаях их стоит использовать;
🟡Получите профессиональное преимущество, ведь любой заказчик любит, когда «красивенько»;
В конце курса все студенты делают собственный проект, где можно будет включить внутреннего исследователя, покопаться в данных и сделать инфографику, которая станет украшением для портфолио. Вот несколько примеров с прошлых потоков:
раз, два, три, четыре, больше по тегу #работы_студентов@data_csv
Посмотреть программу, отзывы и подробности, а также записаться можно тут: https://clck.ru/3HJc6r
❗️По предзаписи — самые большие скидки, тариф с обратной связью стоит 24.900 вместо35.000 руб.
Вы можете оплатить полную стоимость, а можете только забронировать место и цену за 1000₽. Для этого при оплате нужно нажать кнопку «Частичная оплата»
Предзапись будет открыта до 15 марта включительно. Есть рассрочка на срок до 12 месяцев, по ней ваша переплата — 0 руб.
Пять (!) лет назад мы запирались дома, носили маски и активно осваивали зум. Вы можете в это поверить?
Последствия пандемии коронавируса до сих пор ощущаются в статистике: если некоторые показатели вернулись «в тренд», то другие уже никогда не станут прежними. New York Times собрали 30 графиков о том, как изменился мир после COVID-19:
https://www.nytimes.com/interactive/2025/03/09/upshot/covid-lockdown-five-year-charts.html
А в вашей жизни что-то изменилось после пандемии?
Как повышение ключевой ставки отразилось на вкладах и кредитах?
Отвечает Т—Ж в своём новом материале: «шоковое» повышение в начале 22 года повлияло в первую очередь на снижение кредитов, постепенное повышение ставки в 23 году стало работать уже на вклады.
Показательна и карта долгов и накоплений:
Напрочь закредитованный Северный Кавказ, бедная Сибирь и сберегательный Центр.
Кстати, в Ямало-Ненецком АО, судя по статистике, на одного человека приходится в среднем 640 тысяч рублей кредита 🤯
https://t-j.ru/debet-kredit-stat/
Необычная визуализация от сотрудницы Datawrapper
Она записывала, какие овощи приходят к ней по подписочному сервису в течение года, и в итоге сделала об этом график.
Поражает, что такая нестандартная визуализация собрана внутри сервиса — и по сути это кастомизированный Scatter Plot.
Картинка длинная и интерактивная, так что вдохновиться приходите сюда:
https://blog.datawrapper.de/my-vegetable-subscription/
Любопытная база данных, которая позволяет выбирать книгу по месту действия, полу, возрасту и расе персонажей, а также по ряду оценок: от весёлой до грустной, от возвышенной до приземлённой, от сексуализированной до асексуальной.
Если вы искали, что почитать, теперь вы знаете, ещё один способ подобрать книгу:
https://www.whichbook.net/character-plot/
Яндекс сделал свой генеративный язык, который позволяет рисовать валентинки.
Все параметры можно описать js-подобным кодом, но можно и «натыкать» в интерфейсе, если с кодом вы не дружите
Ну прелесть?
https://ya.ru/lovescript
Пока москвичи радуются стремительному развитию транспортной доступности, метро в других городах не может похвастаться такими успехами
Собака.ru в новом дата-материале рассказывает, как обстоят дела в Северной столице. За последние 10 лет метро в Питере строилось даже хуже, чем в 90-ые, хотя планы были хорошие...
https://www.sobaka.ru/city/transport/194548
Вот вам идея для дата-исследования:
1) взять список популярных в мире музыкальных групп (например, из чартов Billboard Hot 100) и отобрать 100 самых прослушиваемых за каждый год
2) выгрузить с Setlist.fm все их концерты (обычно там всё подробно, вот пример)
3) посмотреть, как часто популярные артисты в разных жанрах на своих крупных выступлениях практикут «выход на бис»
Гипотеза — крупные артисты больше на бис не выходят. По крайней мере, так пишет колумнист издания The Paper.
А у меня для вас исследования нет, зато будет песня, которая так и называется — «Мы не выходим на бис». Это задорный и ироничный рок в духе Sum 41, который рассказывает о ценности момента.
Выйдет она в следующий четверг, но по правилам музыкальных площадок, чтобы эту песню могло услышать много людей, она должна получить много «пресейвов». Это заочный «лайк» песне, который напомнит вам о релизе.
Для вас — одна минута и один клик, для меня — возможно — много-много радости от новых слушателей 🥺
Поставить пресейв можно тут: https://band.link/RveEX
New York Times в своём материале раскрывают проблемы двухпартийной системы США в конгрессе, которая сложилась из принципа «победитель получает всё».
Партия, победившая в избирательном округе, в итоге забирает все места в конгрессе, из-за чего недопредставленными остаются как сторонники проигравшей партии, так и люди, не нашедшие своего кандидата. Отчасти это копенсируется неожиданными союзами, из-за которых в одной партии оказываются сторонники радикально разных взглядов.
Не мне рассуждать об американской политике, но в моих силах заметить тренд на скошенные Scatter Plot'ы в визуализации данных. В этот раз такое необычное положение особнованно метафорой — все либеральные показатели сконцентрированы слева, а все консервативные — справа.
https://www.nytimes.com/interactive/2025/01/14/opinion/fix-congress-proportional-representation.html
New York Times пишут про проблему, которая может привести к потенциальной стагнации генеративных нейросетей.
Дело в том, что для улучшения моделей нужно много контента, который создатели сеток беспорядочно пылесосят из интернета. Но вот незадача — в интернете становится всё больше контента, который уже сгенерирован нейросетями. И оказывается, что сетки, обученные на сгенерированном контенте, с каждой итерацией начинают выдавать всё большую чушь.
New York Times понятно и популярно объясняют, почему качественное определение сгенерированного контента — это сейчас вопрос выживания для компаний, занимающихся разработкой подобных моделей
https://www.nytimes.com/interactive/2024/08/26/upshot/ai-synthetic-data.html
Вероятно, для просмотра потребуется подписка, режим инкогнито или расширение Bypass Paywalls
Очаровательный проект про одинаковые имена на выборах в Индии.
Есть там такая проблема на выборах разных уровней: в одном бюллетене могут оказаться кандидаты с крайне созвучными именами. Автор приводит пример, когда однажды выбирать предстояло из четырёх Gandhi, трое из которых к тому же были и Rahul'ами. Неприятно.
Материал притягателен разными формами подачи: тут и иллюстрации, и графы, и интерактив.
https://diagramchasing.fun/2024/votes-in-a-name
Смотрите, какая очаровательная штучка от NASA!
На лендинге можно ввести своё имя, и получить набор спутниковых снимков, на которых местность напоминает буквы из него. На каждое место можно клинкуть, посмотреть, где оно находится.
https://landsat.gsfc.nasa.gov/apps/YourNameInLandsat-main/index.html
В материале SCMP помимо прочего есть такой симпатичный дата-арт
На инфографике показана активность Солнца за последние почти 200 лет. Временной ряд идёт по спирали, а цвет и одновременно размер полосочек показывает среднее за год число пятен на Солнце.
В декабре я побывал в Гонконге, где своими глазами увидел одно из самых впечатляющих шоу в своей жизни. Прямо над бухтой Виктория в воздух взлетели дроны, создавая светящиеся изображения милых панд: они анимировались, искрились и плавно перетекали в другие формы.
Огромные панды на фоне небоскрёбов выглядели так, словно кто-то смонтировал видео со спецэффектами, но всё это происходило на самом деле.
И вот South China Morning Post выпускает инфографику, которая объясняет, как устроены такие шоу, и что может помешать их проведению.
После завершения разработки дизайна каждый дрон программируется со всеми необходимыми данными: точным местоположением, высотой и цветом подсветки в каждый момент шоу. Эти данные загружаются в контроллеры полёта дронов, что позволяет им автономно выполнять представление.
Во время шоу дроны не общаются друг с другом и не получают инструкций в режиме реального времени. Вместо этого они независимо друг от друга следуют по заранее запрограммированным траекториям, подобно танцорам, выступающим по памяти.
Formula is Beautiful
Одна из моих студенток, Светлана Задедюрина, отправила свою дипломную работу с курса на конкурс инфографики Information is Beautiful, и получила вчера весточку — работа вошла в лонглист!
Если вы не из мира датавиза, то расшифрую: жюри ведущей международной премии в области инфографики решило, что работа достойна внимания — и теперь она навсегда останется в подборке крутейших работ по визуализации данных.
Комментарий к своей дипломной работе Светлана изначально отправила мне на английском, поэтому оставлю здесь свой авторский перевод
Мой «роман» с Формулой-1 начался совсем недавно. Увлекаться гонками я начала в этом [2024] году, но всё закрутилось с бешеной скоростью — словно турбированный двигатель. И вот я на Monza Grand Prix — смотрю на соревнования своими глазами.
С другой стороны, страсть к стилю, искусству, моде и, конечно, технологиям со мной всю жизнь. Сочетание этих интересов стало вызовом, перед которым невозможно было устоять, хотя для этого потребовалось серьёзное погружение в данные.
Для работы я в основном использовала Flourish и Observable. В последний инструмент я совершенно влюбилась, несмотря на мою нелюбовь к JavaScript (которое всё ещё лучше то вспыхивающих, то угасающих отношений с Python).
Эксперименты с разными визуализациями стали настоящим приключением. Я попробовала бесчисленное количество графиков, перспектив, историй и инсайтов, добавляла необычные аннотации, направляя читателей по сюжету, и сочетала разные визуалы на одном холсте. <...>
В какой-то момент я поняла, что идеала не достичь — но проект стал по-настоящему моим. А «готово» лучше, чем «идеально».
всего несколько раз в год открывается набор на мой курс по визуализации данных
если вы ждали — этот пост для вас👇
Никогда такого не было и вот опять — The Pudding упаковали скучные опросные данные так, что листаешь проект и не можешь оторваться.
В США переход из младшей школы в среднюю совпадает с непростым для подростков возрастом 11–14 лет. В этом возрасте дети острее реагируют на любые социальные взаимодействия: и на поддержку, и на негативный опыт вроде буллинга.
Почему такое совпадение, мягко говоря, не очень удачно?
Если в младшей школе есть один педагог, который устанавливает тесный контакт со своими учениками и способен их морально поддержать, в средней акцент преподавателей смещается на дисциплину и выполнение программных требований. Добавим к этому новые классы, возможную потерю друзей — и получим подростков, которые в свой сложный жизненный период оказались в среде куда менее дружелюбной, чем привыкли.
Ну а если развитие подростков вас не интересует, посмотреть проект в любом случае советую: это потрясающей пример того, как сухая статистика превращается в историю, за которой видишь реальных людей.
https://pudding.cool/2025/02/middle-school/
Потрясающей красоты датавиз / дата-арт про шутинги в американских школах.
Формы, цвета, анимация — всё тут заставляет прилипнуть к экрану.
Вдохновиться и оценить красоту (лучше с компьютера):
https://alhadaqa.github.io/wakeup/
«Собака» рассказывает как «Ленфильм», бывший некогда флагманом отечественной киноиндустрии, медленно скатывается в пропасть. Меньше картин, хуже качество, и всё меньше внимания они привлекают.
Почему так получилось:
https://www.sobaka.ru/entertainment/cinema/194995
Про цензуру на Супербоуле в США
Супербоул — это одно из самых значимых ежегодных событий в Штатах: его смотрят десятки миллионов зрителей, собираются компаниями друзей и семьями. И неминуемо это шоу смотрят дети, поэтому на него налагают множество требований.
Приличные костюмы, приличные песни, приличные жесты. Только вот популярные музыканты, которых приглашают выступать в перерыве между играми, в своих треках в выражениях обычно не стесняются.
Но чего не сделаешь ради шоу! Вот Dr. Dre и Snoop Dogg в своём выступлении заменили 22 из 392 слов. Среди них как и мат, так и просто потенциально оскорбительные выражения — в адрес чернокожих или даже полиции.
О том, как ещё преобразились песни популярных артистов, читайте в материале Washington Post
В прошлом году я делал для «Картетики» исследование и инфографику о работе и зарплатах в сфере ГИС, а теперь флаг перехватила моя студентка — Ольга Хлопкова.
Получилось отлично. Если вы работаете в этой области — обязательно следите за серией, пока вышла только первая часть исследования:
https://cartetika.ru/tpost/bfolz40031-analiz-geo-sferi-2024-chast-1-znakomstvo
А если вам нужен такой датавиз — пишите, за два потока «Эстетики в графиках» уже выпустилось немало звёздочек, попробуем найти вам классного инфографера 🙌
#работы_студентов@data_csv
Коллеги собрали красивый-красивый проект о том, когда ставят встречи пользователи Яндекс Календаря
Помимо «солнца встреч», которым можно полюбоваться в начале лендинга, есть много занятных выводов.
Например, что в начале дня чаще ставят более длинные встречи. Или что раньше всего встречи ставят сотрудники ЖКХ и производств, а позже всех — айтишники и креаторы.
https://yandex.ru/company/researches/2025/calendar
Т—Ж решил опросить своих читателей, чтобы узнать, действительно ли «троечники» более успешны, чем отличники
По субъективным ощущениям кажется, что — да. По крайней мере, троечники чаще отвечают, что довольный карьерой, и она движется быстрее, чем у окружающих.
Но метод, как мне кажется, мудрённый. Сходу не понять — среди троечников довольных примерно в два раза больше?
Я бы предпочёл смотреть на долю довольных, чем на не очень понятные коэфициенты.
Ещё прикольно, что «троечники» и «отличники» по-разному отвечали про качества, которые помогают им в работе. Первые значительно больше опираются на умение учиться на ошибках и смекалку, а вторые — на терпение и широкий кругозор.
И жаль про зарплаты ничего, хотелось бы опираться на что-то объективное, а не на самоощущения!
https://journal.tinkoff.ru/opros-pro-otsenki-rez/
Дата-сторителлинг на большой сцене
Если вы посмотрите видео, то обнаружите на нём человека, выкрикивающего разные источники данных. Это титры к спектаклю «Человек среднестатистический», премьера которого состоялась вчера в Театре Ермоловой (Москва).
Вся постановка строится на данных официальной статистики, опросах и данных частных компаний, рисуя портреты персонажей. Особенно я порадовался, когда в какой-то момент со сцены цитировали данные одного из исследований Яндекса 😄
Спектакль очень сильно отличается от всего, что я раньше видел в театре. Это непривычно и может зайти не каждому. Но мне понравилось: получилось необычно, мило и моментами смешно.
Повторные показы планируют 5 и 27 февраля, так что берите билеты, если вдруг вас заинтересовало:
https://www.ermolova.ru/afisha/view/218/
Любопытно. Чтобы серьёзно это воспринимать, критически не хватает чисел и ограничений данных — например, какие страны вошли в выборку и за какой год (UPD: источник намекает, что это может быть только Великобритания)
Но двухсекундный фактчек показал, что это должно быть близко к правде:
В 2021 году 933 тысячи россиян умерли от болезней сердца и сосудов, 283 тысячи — от злокачественных новообразований.
В январе - ноябре 2024 года зарегистрировано 6,4 тыс. убийств (с покушениями), что ниже на 7,1% уровня сопоставимого периода 2023 года
Изучал материалы предыдущего года и нашёл такую залипательную анимацию о том, как в мире менялось число ядерных боеголовок
Вообще весь материал NYT про ядерное оружие — это просто какой-то впечатляющий боевик, просто полюбуйтесь:
https://www.nytimes.com/interactive/2024/03/07/opinion/nuclear-war-prevention.html
Вероятно, для просмотра потребуется подписка, режим инкогнито или расширение Bypass Paywalls
Как начать работать с SQL?
Пройдите бесплатный мини-курс “SQL для новичков” от Changellenge >> Education и освойте SQL всего за 5 часов и получите практические знания, необходимые для работы с базами данных.
🔥 Преимущества курса:
- Выделите всего 5 часов на обучение,
- Изучите ключевые функции и операторы SQL,
- Получите видео-разборы от эксперта,
- Выполните более 30 практических заданий.
🎁 За прохождение мини-курса вы получите скидку 10 000 рублей на обучение на программе "Аналитик данных" от Changellenge >> Education.
📅 Скорее регистрируйтесь, осталось всего 15 свободных мест: https://u.to/TKREIQ
Реклама. ООО «Высшая школа аналитики и стратегии». ИНН 7716917009. erid:2VtzqxAmdq5
Вот несколько моих видео с того самого шоу в Гонконге, на которое я попал
Читать полностью…
Андрон Алексанян собрал список интересных и актуальных авторских каналов, посвящённых аналитике. data.csv уже несколько лет входит в подборки Андрона, что очень приятно 😌
В статье есть ссылки, описания каналов и примеры любопытных постов:
https://habr.com/ru/articles/869116/