data_csv | Unsorted

Telegram-канал data_csv - data.csv

13755

Блог о журналистике данных и дата-сторителлинге Ведёт @BlackPineapple — аналитик в службе дата-журналистики Яндекса

Subscribe to a channel

data.csv

В одном из кафе Джорджтауна (Малайзия) внезапно обнаружилась инфографика о вкусах кофе из китайской провинции Юннань

Это Yunnan Coffee Flavor Map (云南咖啡风味地图) — попытка «картографировать» вкусы кофе из Юньнани на данных массовых каппингов — для исследования взяли больше 17 тысяч оценок.

Центр круга — «Юньнань в целом»: какие дескрипторы встречаются чаще (там явно доминируют орехово-шоколадные и цитрусово-карамельные направления). Сектора — крупные кофейные зоны провинции.

Фулл на китайском можно найти тут, а в комменты приложу фото файлом — оно на английском, но качество будет чуть хуже.

Как по мне — это пример не самой эффективной инфографики, и лучше такое не делать. Но на стене смотрится красиво, спору нет!

Читать полностью…

data.csv

Визуализация ароматов духов была замечена в креативном молле Куала-Лумпура

Ароматы вообще любят наносить на графики: вот, например, духи и благовония в Японии

Но мне всегда было интересно, действительно ли такие описания помогают лучше понимать, как духи будут пахнуть. Устроим голосование:

🦄 — реально помогают
🤯 — не понимаю, как в этом ориентироваться

Напомню, что больше заметок из путешествий у меня в канале в глазах смотрящего

Читать полностью…

data.csv

Проект datacitron уже третий год подряд делает милый адвент — дата-шарады. В графиках здесь зашифрованы популярные фильмы. Ваша задача — угадать, какие именно.

Поиграем? Пишите в комменты, что узнали ⚡️

Читать полностью…

data.csv

Рождественский хит, разобранный на графики

Эта серия карточек — работа моей студентки, Карины Шургучиновой; по сути первая проба в креативной инфографике.

Карина изучила чарт Billboard Hot 100 и смогла найти в нём симпатичную историю, посвящённую праздничной песне

За время курса я так вдохновилась необычными графиками, что руки чесались сделать что-то креативное. Для меня это было невероятно, ведь раньше я никогда не рисовала, нигде и ни в чём. А тут даже появилась уверенность, что что-то может получиться — может и не идеальное, но хорошее. Сами графики в Flourish и RawGraphs составились быстро (данные, конечно, не суперсложные, Tableau даже не понадобился). А вот с Figma я повозилась, зато освоила кучу новых фич.

И это оказалось самым удивительным: я шла на курс, чтобы просто научиться строить понятные графики и лучше разобраться с Tableau, а в итоге почувствовала себя настоящим дата-артистом. До нормального художника мне, конечно, далеко, но кто знает — может, это ступень к чему-то совершенно новому. В конце концов, скоро Новый год и Рождество — почему бы не помечтать?


P.S. — у нас буквально на днях выпустился новый поток курса, так что в январе покажу много классных работ.

А сейчас у нас открыт лист ожидания — записавшимся мы напомним про обучение и предложим самую низкую цену.

#работы_студентов

Читать полностью…

data.csv

Cursor (платформа для разработки при помощи ИИ) дропнули персональные итоги года в виде визуального сторителлинга с графиками.

К некоторым решениям есть вопросики, но в целом выглядит симпатично. И круто, что такое есть — обычно в итогах с визуализацией никто не заморачивается.

Если тоже писали код там, гляньте!
https://cursor.com/2025

Читать полностью…

data.csv

Яндекс выпустил очень вдохновляющий ролик про использование искусственного интеллекта.

Начиная от понятных кейсов — типа собрать аптечку для похода в горы, заканчивая тем, что я даже сам не знал: типа автоматического поиска лучшей цены на товар и подбора целого лука по фотографии!

Ну и в случае с Яндексом здорово, что это будет легко доступно не только технически подкованной части населения, но и даже вашей бабушке или тёте из Якутска

Рекомендую:
https://youtu.be/c2aXtFI0VaI?si=io34O-kPP6koJ0gF

Читать полностью…

data.csv

Какой невероятный музыкально-инфографический труд!

The Pudding выпустили материал о том, как мелодические мотивы работают в мюзиклах, кино и популярной музыке.

Повторяющиеся музыкальные фрагменты создают устойчивые ассоциации — они помогают выделять персонажей, идеи и отслеживать развитие сюжета. В материале много примеров, которые можно послушать и сверить с собственными ощущениями: например, посмотреть, как с помощью музыки развивается драматургия в мультфильме «Вверх!», или вспомнить, с каким персонажем у вас ассоциируется знаменитая мелодия из «Звёздных войн» (ту-ду-ду ту-ду-ду ту-ду-дуу).

В конце можно изучить все мотивы из мюзиклов Гамильтон (Hamilton), Отверженные (Les Misérables) и Злая (Wicked)!

https://pudding.cool/2025/12/motifs/

Читать полностью…

data.csv

Конференция «Дата-сторителлинг»

Андрей Дорожный третий год подряд собирает нас на онлайн-конференции, где мы обсуждаем подходы к визуализации данных и разбираем кейсы интересной аналитики.

В этом году много говорим про применение ИИ в визуализации данных — в том числе со своим таким докладом выступлю и я.

Среди других спикеров
Автор книги «Графики, которые убеждают всех» и канала «Чартомойка» Александр Богачев,
Автор каналаprostoecon"> «Простая экономика» Николай Мячин
Основатель проекта ДатаЙога Андрей Демидов

Купить билет

Читать полностью…

data.csv

Смешной формат придумала команда аналитики FlyByMetrics

Они проанализировали telegram-канал бывшего президента России Дмитрия Медведева и нашли в нём уникальные слова —

⭕️почти не используемые (в базе словаря современного русского языка Ляшевской и С.А.Шарова менее 0,4 раза на 1 млн слов) — педикулез, шобла, наркоклоун, самокастрация
⭕️ крайне редкие (примерно 0,4 раза на 1 млн слов в корпусе словаря) — дефекация, русофобский, маразматик, псалтирь, шагреневый, дегенеративный.

Интересно теперь посмотреть на каналы других известных персон 🌚

А больше интересной аналитики на основе данных Telegram, YouTube, Instagram и других социальных платформ — в их канале FBM API Insights.

Читать полностью…

data.csv

У канала 3 тысячи подписчиков! Вас так много 🤩

Мы хотим рассказать, кто делает этот канал, чтобы познакомиться поближе. Заодно этим постом запускаем рубрику #почему — короткие разборы ошибок и приёмов визуализации данных. Так можно с пользой посмотреть на наши лица.

В прошлый раз мы заказывали пиццу, а в этом выпуске на собственном примере рассказываем, почему нельзя обрезать столбики в столбиковой диаграмме (её ещё называют «барчарт»).

Напишите в комментариях, если догадались, постер какого фильма мы пытались повторить 😎


Исследования Яндекса @YaResearches

Читать полностью…

data.csv

Занятная схема повстречалась мне в Китайском саду в Сиднее

На ней конкретные точки обозначены не локаторами с цифрами (поди найди, где на таких картах 1, а где 51), а выбран другой подход: вся карта разбита на сектора — как в таблицах

Например, главный вход L11, а туалеты — K5.

Как вам? Ставьте 🔥, если удобно

Читать полностью…

data.csv

Набор данных, который больше всего впечатлил меня в Мельбурне

… встретился в, пожалуй, самом интересном местном музее города — Старой тюрьме Мельбурна (Old Melbourne Goal).

Историческое тюремное здание сегодня принимает туристов и рассказывает жуткие истории 19-20 веков. В то время особо опасных преступников казнили через повешание, и в одной из комнат даже можно увидеть полный поимённый список казнённых — с 1842 по 1967 годы.

Визуализации тут нет, но надо сказать, что табличка с именами убитых производит впечатление куда большее, чем столбики или даже иконки. Хотя разбивку по годам, типам преступлений и стране рождения было бы глянуть интересно.

Говорят, что среди первых заключённых было много аборигенов, потому что с местным населением они, по понятным причинам, дружить не хотели.

Кто пропустил, заметки, не связанные с данными, я буду публиковать тут:

»
в глазах смотрящего

Читать полностью…

data.csv

deluliu, ngl, sigma, huzz — вот одни из немногих трендовых словечек, которые благодаря распространению соцальных сетей теперь употребляют не только американские подростки, но и их сверстники в других странах

Хотите почувствовать себя старым?
Попробуйте себя в тесте от WP на знание молодёжного сленга:

https://www.washingtonpost.com/opinions/interactive/2025/teen-slang-quiz-delulu/

Читать полностью…

data.csv

Т—Ж в одной картинке показал, как выглядит взросление: за 6 лет фрукты в покупках молодых людей взлетают с 9 на 5 место, а снеки улетают с 4 на 6.

Что ещё покупают в супермаркетах в 17—23 года? Конечно — энергетики. В целом доля чеков с ними составляет 15%, а у мужчин достигает 19.

Батоны и пирожки можно найти в 18% чеков, заморозку (пельмени, котлеты и прочие полуфабрикаты) — в 9,3%, «дошик» — в 3,4%.

Кстати, по данным Т—Банка, в среднем молодые люди тратят 354 ₽ за один поход в продуктовый. Пойду брать у своих студентов уроки финансовой грамотности — кажется, они в этом шарят 🫤

https://t-j.ru/what-students-eat/

Читать полностью…

data.csv

Как люди используют ChatGPT

OpenAI выпустили большое исследование, где рассказали, как люди используют их модели. Что показалось интересным мне:

🔗Модель — не инструмент, модель — друг. В июне 2024 года сообщений, очевидно связанных с работой, было 47%, а к июню 2025 их доля снизилась до 27%! Касается это как новых пользователей, так и тех, кто пользуется нейронкой уже давно.
🔗Три самых частых темы: советы «как что-то сделать», запрос фактов и работа с текстом.
🔗Запросы всё больше про «попросить совета», а не «сделай за меня». Количество сообщений в категории Asking растёт, а Doing — падает. То есть люди всё чаще обсуждают и советуются с моделью, а не просто поручают ей задачу.
🔗Самый высокий уровень удовлетворённости — в личных разговорах. Пользователи чаще всего довольны, когда обсуждают свои мысли и эмоции, а не решают технические задачи. В таких диалогах соотношение положительных реакций к отрицательным превышает 7 к 1 — для сравнения, в технических темах оно около 2 к 1.
🔗В начале ChatGPT был почти полностью «мужским клубом» (80 % имён — мужские). Однако сейчас — баланс, женских имён 52%.

Читать полностью…

data.csv

Коллеги нашли новые слова, значения которых чаще всего искали пользователи Поиска Яндекса в 2025 году.

Я лично грущу, что за три недели в Китае, оказывается, не попробовал одно из самых трендовых слов года!

А какие у вас открытия?

Читать полностью…

data.csv

Вторая порция дата-шарад от проекта datacitron. Задача всё та же — отгадать, какие фильмы отражены в графиках

А вот ответы на предыдущие загадки:
Speed (Cкорость)
The Birds (Птицы)
Lost in Translation (Трудности перевода)
300 (300 спартанцев)
Us (Мы)
No Country For Old Men (Старикам тут не место)
High Anxiety (Страх высоты)
Four Weddings and a Funeral (4 Weddings and a Funeral)


Специфичное, конечно, кино :)
Я слышал меньше, чем про половину из этих фильмов

Ну что, с новой серией справитесь?

Читать полностью…

data.csv

Коллеги по телеграму массово подводят итоги года в виде номинаций, а мне передал эстафету Андрей. Что ж, вот мои!

Проект года:
Необычные туристические места от нейросети. Удалось и хорошенько пощупать новые техологии, и придумать новый формат для дата-материалов.

Выступление года: II Центрально-Азиатский медиафорум в Астане. Очень тёплая публика и возможность дотянуться с идеями до главных специалистов в стране.

Открытие года:
Коучинг. Я примерно полгода занимаюсь с коучем из *insight, и могу сказать, что наши разговоры на меня очень влияют:
1) Я начинаю видеть возможности там, где раньше были только ограничения
2) Я могу посмотреть на результаты своей работы с другой стороны — и не зацикливаться на своей интепретации 
3) Работа с коучем мотивирует меня предпринимать новые действия

Приложение года:
Endel. Это чудо генерирует разные звуки, которые благоприятно воздействуют на нервную систему, помогая работать, засыпать или чувствовать себя мотивированным. А ещё там очень крутой дизайн!

Победа года: Наконец-то вернулся к выпуску песен. Долгое время это занятие приходилось откладывать из-за большого количества работы 🥺
Послушать — тут.

Лайфстайл года: Жизнь в путешествии. Я всегда мечтал увидеть мир — и за этот год посетил 8 стран. Встречаю новый год я тоже в поездке — на юге Китая. Про это больше пишу в личном канале.

Еда года: Моти. Если брать их не в дешёвом азиатском корнере на фудкорте, то окажется, что это десерт богов. Лучшие в Москве — в Ikura, Koji и Alpaca.

Соцсеть года: Сетка. Ребята стремительно развиваются, и хочется верить, что в течение пары лет смогут стать вполне себе российским LinkedIn. У меня там, кстати, тоже есть канал.

Передаю дальше Наде и Лиле

Читать полностью…

data.csv

Для многих из нас первое касание с графиками происходит в школе на уроках математики. Сначала мы учимся понимать, как ведут себя простейшие функции, затем — решаем сложные визуальные задачи. На математике построена и диаграмма Вороного, популярная в инфографике: она делит пространство на области «кому ближе», а их форму и границы вычисляет алгоритм.

А я недавно познакомился с авторами канала «Зачем мне эта математика», которые ведут мои коллеги из Яндекс Образования: и оказалось, что в их постах тоже много красоты и визуальности.

Вот только несколько примеров:
*⃣ Как визуальный глюк из математической программы получил человеческое имя, стал героем Reddit'а и побывал в космосе;
*⃣Что такое филотаксис, как он помогает красиво визуализировать разное количество точек, и как он связан с подсолнухом
*⃣Можно ли визуализировать классическую геометрию

В общем, коллег рекомендую:
» Зачем мне эта математика

Читать полностью…

data.csv

На последней паре со студентами медиакома МГУ мы балуемся (но с пользой) — учимся глубже понимать визуальный язык, повторяя упражнение Dear Data. Ребята собирают набор данных о своей жизни, а потом изображают его в виде креативной визуализации.

Всегда в таких работах получается много трогательного. Например, в этом году меня зацепила работа «Как я скучала по Новосибирску в Москве». На ёлке висят игрушки, которые растут или уменьшаются от силы тоски, появляются на ветках чаще или реже — в зависимости от того, как много раз за месяц эта тоска возвращалась, и меняют цвет в зависимости от того, скольким людям автор успела пожаловаться.

Добрые друзья и семья, светлый воздух, любимые кафе и милая кухня без тараканов.

Хотя прошлогодний шедевр «что слушает мой дядя, когда выпивает с друзьями» я едва ли когда-нибудь забуду.

Читать полностью…

data.csv

Flourish собрали статистику оценок рождественских фильмов и выяснили, что период с 1980 по 2010 был самым богатым на хорошие картины этой тематики.

Напишите, что вы будете смотреть для новогоднего настроения! 🎄

Читать полностью…

data.csv

Последний месяц был оглушительным по количеству задач. Но пожинать их результаты — чудесно!

В субботу у нас завершился внутренний хакатон по дата-журналистике в Яндексе. Участники анализировали данные компании, искали в них интересные инсайты (так хочется рассказать — но пока NDA!) и презентовали результаты на финале.

А специально для хакатона мы сделали офигительный мерч.
Я предложил каламбур — сделать на футболках инфографику про размеры футболок. Идею поддержали, и моя прекрасная коллега Надя сделала дизайн.

График на футболке называется Маримекко. Вертикальные полосы обозначают подразделения Яндекса, а их ширина — количество сотрудников в подразделении, указавших размер футболки в Стаффе (нашем внутреннем портале).

Высота цветного сектора отражает долю сотрудников, выбравших соответствующий размер футболки. Бледные цвета — женские размеры, тёмные — мужские.

Хотели бы себе такой?

Читать полностью…

data.csv

Привет, это шефред дата-редакции Т—Ж Сергей Антонов с гостевым постом для data․csv.

Я очень люблю всякие необычные методики подсчета, вроде тех, когда по спутниковым снимкам анализируют количество пустых нефтяных резервуаров с плавающими крышками и потом прогнозируют изменения цен на нефть. Расскажу про похожий российский кейс.

У рынка радио есть проблема — технически невозможно измерить какие станции слушают больше, а какие меньше. Все существующие рейтинги, как правило, делают на основе опросов, однако это не самый надежный способ — кто там вспомнит, какую станцию он слушал в парикмахерской или в такси? Но, как известно, на любую резьбу всегда найдется свой хитрый болт.

Одна исследовательская компания парсит фото с сайтов по продаже автомобилей. Предпочтение отдают тем, которые использовались в такси. Судя по всему, дальше машинным зрением распознают фото внутри салона авто, а потом так же распознают название станции или частоту на экране магнитолы. На выходе имеют датасет с раскладкой не просто по популярности станций, но и платежеспособность аудитории — ведь машины разной ценовой категории.

В итоге такие исследования продают радиостанциям, на том и зарабатывают.

P.S.: Если вы любите не только цифры, но и буквы, зову подписаться на мой маленький канал «Антонов без Б.», который посвящен истории языка и происхождению слов.

Читать полностью…

data.csv

Как отличаются дни мужчин и женщин

Нейтан Яу продолжает выуживать интересные инсайты из данных большого опросника American Time Use Survey.

Любопытно, что почти всё делают больше в течение дня — женщины. Уход за собой, уборка дома, уход за членами семьи, звонки по телефону, покупки.

У мужчин лидирует работа, спорт и... общение с другими людьми. Судя по всему, с другими мужчинами 👀

https://flowingdata.com/2025/11/04/spend-days-men-women-2024/

Читать полностью…

data.csv

Нейросетевые фичи раскатили на Яндекс Таблицы

Коллеги на днях совершили большой запуск — глобальный апдейт нашей большой языковой модели. Алиса теперь не только стала умнее, но ещё и «проросла» в другие сервисы Яндекса: в Go [пока в режиме закрытого бета-теста] при помощи нейросети можно забронировать столик в ресторане, в Браузере — дать задачу ии-агентам: например, найти какой-то товар на сайте. Но самое долгожданное для меня обновление — это апдейт Яндекс Таблиц. Теперь можно прямо в эксельке закрывать разные нетривиальные задачи, связанные с данными.

К примеру:
— Определить пол человека по его имени;
— Определить континент по названию страны;
— Перевести с одного языка на другой.

Как этим пользоваться

1. Перейти на https://docs.yandex.ru/
2. Создать новую таблицу (проверьте, что у вас включён переключатель «Перейти на новый редактор»)
3. Использовать формулу =АЛИСАПРО(<ПРОМПТ>;<ЯЧЕЙКА С ДАННЫМИ>)

Предостережение 1. При помощи LLM не стоит решать задачи, которые легко решаются стандартным формульным функционалом (складывать числа, искать среднее, выделять первый символ и так далее). Модели имеют свойство ошибаться, и эта ошибка оправдана только там, где нет альтернативы.

Предостережение 2. Качество работы любых моделей зависит от того, насколько грамотно вы напишете промпт. Иногда имеет смысл расписать задачу подробно, а не просто парой слов.

Работает это бесплатно. Наверняка есть какие-то ограничения по количеству данных, которые можно таким образом обработать — но в релизах я не нашёл ничего про лимиты. Попробуйте и расскажите в комментариях.

Читать полностью…

data.csv

Анализируете данные?
Коллеги из HEWHR просят пройти опрос — чтобы узнать, как меняется ваша профессия.

Что исследуют:
👉 Зарплаты и их динамика
👉 Рейтинг работодателей для аналитиков
👉 Где работают аналитики, как работают (удалёнка/офис), какие планы на трудоустройтво.
👉 Как меняется зона ответственности аналитиков и чем хотят заниматься аналитики
👉 Как аналитики ищут работу и выбирают работодателя

Опрос займёт около 20 минут, но вы сделаете большой вклад в исследование профессии. А результаты потом будут доступны всему комьюнити бесплатно

▶️ Ссылка на опросник ◀️

Читать полностью…

data.csv

В ближайшее время посты тут, вероятно, будут выходить реже обычного, потому что я отправляюсь, наверное, в самый длительный свой отпуск.

В планах Австралия, Сингапур, праздник фонарей в северном Таиланде и бухарское биеналле. По традиции, находки визуализации на улицах других стран буду скидывать сюда. А если захотите почитать про приключения, то сделать это можно будет в моём личном канале:

» в глазах смотрящего

Читать полностью…

data.csv

Подписывать ли все значения на графике?

В чате выпусников моего курса в очередной раз разгорелась дискуссия — о том, насколько целесообразно подписывать ВСЕ значения на самом графике. Вот как тут, в примере.

Моя базовая позиция звучит так:
Не надо.

Визуализация показывает общий тренд и идеи, заложенные в данных. Если для понимания этих идей нам надо прочитать 100 чисел глазами, это плохая визуализация

Внимания достойны отдельные точки — например, экстремумы или что-то выделяющееся по другой причине. Всё остальное должно быть приблизительно читаемо благодаря осям, линиям сетки и другим ориентирам.

Обычно я слышу несколько ситуаций, в которых людям нужны все числа:

— Это исследователи, которые потом используют эти числа в своих работах. Таким людям надо просто дать исходную базу данных, а не пытаться переписать все значения на график

— Это руководители, которые не видят инсайта из графиков сотрудников, либо не доверяют результатам — и пытаются прикинуть всё самостоятельно. Возможно, тут со стороны сотрудника надо фиксить умение визуализировать данные, а со стороны руководителя — доверие.

Но есть ли ещё кейсы? Я хочу послушать ваше мнение. Если вам по каким-то причинам надо знать все 100 цифр на графике с максимальной точностью, напишите в комментариях — зачем⬇️

Читать полностью…

data.csv

Может ли ИИ заменить вас на работе?

На этот вопрос пытаются ответить журналисты The Economist, ссылаясь на новую научную работу исследователей из Гарварда.

Учёные проанализировали 200 миллионов вакансий и обнаружили: в компаниях, где нанимали специалистов по внедрению ИИ, наём младших сотрудников за шесть кварталов упал на 7,7% сильнее, чем у прочих. В то же время спрос на «сеньоров» не только не просел — он стабильно продолжает расти.

Иными словами, ИИ пока не отнимает работу у всех — но точечно сокращает спрос на джуниоров. Особенно тех, кто делает умственно тяжёлую, но рутинную работу: от дебага до проверки документов.

Интересно и другое: хуже всего приходится тем, кто окончил вузы среднего уровня.
Компании по-прежнему нанимают людей из топ-университетов — их навыки сложнее автоматизировать. Выпускники слабых вузов тоже остаются в игре: они просто не просят много денег.

А вот средний уровень оказывается слишком дорогим для рутинных задач и недостаточно квалифицированным для сложных.

Паниковать пока рано: в Штатах 17% работников заняты у компаний, активно внедряющих ИИ. Но если тенденция сохранится, вход в профессию может стать сложнее, чем когда-либо.

Оригинал без пейволла

Читать полностью…

data.csv

Эти красивые картинки нарисовали мои коллеги из Бюро точных исследований.

Они занимаются поиском, интерпретацией и анализом данных, визуализируют сложные процессы, помогают автоматизировать и настраивать аналитику, и теперь за исследованиями к ним можете прийти и вы.

В команде много знакомых мне и чудесных коллег — аналитики, учёные, дата-журналисты, инфограферы и редакторы.

А сайт у них — заглядение:
https://www.precise.agency/

Читать полностью…
Subscribe to a channel