data_csv | Unsorted

Telegram-канал data_csv - data.csv

13755

Блог о журналистике данных и дата-сторителлинге Ведёт @BlackPineapple — аналитик в службе дата-журналистики Яндекса

Subscribe to a channel

data.csv

Новый лонгрид Bloomberg заставил по-новому посмотреть на развитие искуственного интеллекта.

Оказывается, у него есть большая цена. Стабильную работу сервисов по всему миру обеспечивают огромные дата-центры, где хранятся и обрабатываются данные. Эти дата-центры потребляют очень много электроэнергии: по оценкам Bloomberg, есть лишь 16 стран в мире, которым за год нужно больше, чем всем дата-центрам в сумме.

Учитывая планы по развитию ИИ, вопрос генерации электричества может стать очень острым уже в ближайшие годы.

https://www.bloomberg.com/graphics/2024-ai-data-centers-power-grids/

Вероятно, для просмотра потребуется подписка, режим инкогнито или расширение Bypass Paywalls

Читать полностью…

data.csv

Прикол. Т⁠—⁠Ж придумал свою банковскую карту с игровыми механиками. Траты всех держателей такой карты будут учитываться в общей статистике, и участникам будут предлагать снизить потребление в определённых категориях — например, всем дружно меньше тратить на фастфуд.

Каждый месяц обещают высылать статистику с агрегированными операциями всех держателей таких карт. Надеюсь, можно будет сравнить себя с остальными, иначе зачем это всё?

https://journal.tinkoff.ru/chelovek-t-j/

Читать полностью…

data.csv

Washington Post продолжает исследовать, как нейросети видят мир — в этот раз материал о стандартах женской красоты.

Из занятного — все модели по умолчанию генерируют картинки в немного разном стиле, но по умолчанию женщина будет с европейским цветом кожи, тонкой талией и умеренным макияжем.

DALL-E 3 даже на промт «very plus-sized woman» выдаёт женщину вполне себе средней комплекции, а запрос «широкий нос» часто выдаёт либо аккуратный нос, либо какой-то баг.

Остальное почитайте в оригинале:
https://www.washingtonpost.com/technology/interactive/2024/ai-bias-beautiful-women-ugly-images/

Вот ещё материалы, про стереотипы нейросетей, связанные с национальностями и с профессиями

Читать полностью…

data.csv

наш телеграм-канал попал в папку каналов для аналитиков

в этот раз состав сделали необычный — в подборку вошли и каналы с «хардовыми» советами по SQL, и каналы, где пишут, как аналитику развивать свои софты, и каналы про визуализацию и представление информации

— — — — —

чтобы вам не было скучно читать про папку, мы с коллегами придумали, что будем по очереди рассказывать друг про друга. мне достался канал Глеба Михайлова.

канал Глеба — это идеальная площадка для аналитиков, которые готовятся к собеседованиям или просто хотят прокачать свои технические навыки.
большая часть его контента — это видео на ютубе, где Глеб один или с коллегами разбирает, как решать задачки на SQL или Python. здорово, что по таким видео можно отследить весь мыслительный процесс, логику и нюансы работы над задачами.

— — — — —

посмотрите на каналы из подборки — вдруг вам что-то актуально :)

/channel/addlist/dMeiok8FCdA3ZTMy

Читать полностью…

data.csv

Прикольно придумали в Т—Ж — измерять покупательную способность через количество времени, которое должен потратить средний работник в России, чтобы приобрести разные товары и услуги.

Шокирующих выводов нет — с 2004 по 2014 год уровень жизни изменился очень сильно, с 2014 по 2024 — «цены» упали либо чуть-чуть, либо вообще выросли. Но залипнуть очень интересно!

А вот что мне не нравится, так это тип визуализации. Формально здесь Stepped Line Chart, который можно начинать не от нуля. С другой стороны — он сделан с заливкой и без оси, из-за чего считывается как столбиковая диаграмма, которую надо строить строго от нуля. Из-за этого разница покупательской способности выглядит сильно больше, чем есть на самом деле.

https://journal.tinkoff.ru/work-hours-stat/

Читать полностью…

data.csv

10 тысяч

Пару дней назад засёк на радарах «магическое» число — 10 тысяч читателей этого блога.

Когда в 2019 году мы с моими коллегами из «Новой газеты» Алесей и Ирой придумали этот канал, я и подумать не мог, что из него вырастет. Кстати, кто ещё помнит дата-блог «Новой», ставьте ⚡️

В связи со своеобразным юбилеем, хочу вас поблагодарить — всех, кто читает, кто ставит реакции и кто комментирует. Большое удовольствие дискутировать с вами!

Ну а может у вас есть, что сказать мне? Напишите, за что вы любите этот канал и какие посты вам тут кажутся наиболее интересными.

А если есть какие-то вопросы — задавайте 😌

Читать полностью…

data.csv

Krisztina Szűcs сделала новый инструмент, который позволит рисовать площадные графики кастомной ширины и высоты, при этом сохраняя площадь.

Это может быть очень полезно, если хочется попробовать какую-нибудь необычную композицию.

UPD: Тут была инструкция о том, как скачать вектор, но буквально пару часов назад на сайте появилась кнопка «Save as SVG», поэтому это больше не проблема

http://krisztinaszucs.com/viz/area/

Читать полностью…

data.csv

В чатик моего курса студентка скинула то, что, наверное, можно назвать дата-мем

Казахское медиа посчитало, что за 10 лет страна заплатила России 30 млрд тенге за подачу воды в Западно-Казахстанскую область, но при этом в бюджете не смогли найти 1 млрд для создания своего водохранилища.

Для иллюстрации подобрали видео — пускай не очень точно, но забавно-метафорично отражающее статьи расходов 😄

Читать полностью…

data.csv

Я уже давно уехал из Японии, но рубрика «инфографика из Японии» продолжается благодаря моему коллеге @lelnat

Заявляю официально: Япония — это страна очумительных благовоний. Там их очень много видов, и они реально вкусно пахнут. Не 100 видов одинаковых запахов между сандалом и стиральным порошком, а прям каждый хочется купить. В других странах я не видел такого выбора.

И да — в магазинах благовоний тоже есть инфографика. Алексей скинул мне её в виде буклетов, но оказалось, что у магазина есть свой сайт, где можно потыкать в интерактивную версию. Помогает ли это при выборе? Не знаю. Но сердечко радуется красоте 😄

Потыкать:
https://store.lisn.co.jp/shop/pages/incense_chart.aspx (откроется под VPN)

Читать полностью…

data.csv

Пришло время выложить урок, который я вам давно обещал

Он о том, как просто и без программирования сделать подобные красивые анимированные графики — Bar Chart Race. Подробный видеоурок о том, как их делать, я как раз выложил пару дней назад в своём втором канале:

/channel/perfectgraphs/85

Читать полностью…

data.csv

Сегодня у меня на курсе «Эстетика в графиках» презентация дипломных работ. Ребята сделали много всего красивого, и в ближайшие недели я буду делиться некоторыми работами.

Вот работа Екатерины Леонтьевой, передаю микрофон ей:

Посещение музея Ван Гога в Амстердаме вдохновило меня на создание инфографики о его жизни и творчестве. Увидеть оригинальные произведения Ван Гога в музее, а также изучить его биографию и переписку, заставило меня задуматься о том, как можно визуально представить его удивительный творческий путь и личную историю.

В процессе создания инфографики я экспериментировала с различными видами графиков и визуализаций. Каждой визуализации предшествует цитата и картина Ван Гога, которая иллюстрирует данный аспект его жизни или творчества, а цветовая палитра для графика взята из соответствующего шедевра.

Мне было интересно исследовать его эволюцию как художника: от ранних реалистических работ до ярких и выразительных постимпрессионистских картин, а также как эта эволюция была связана с его жизнью в разных городах и странах. Младший брат Ван Гога Тео сыграл значительную роль в становлении Винсента как художника, поэтому их переписке посвящена одна из визуализаций.

Этот проект позволил мне глубже погрузиться в детали трагической судьбы и гениального творчества одного из моих любимых художников, и я надеюсь, что он поможет другим увидеть его искусство в новом свете через призму анализа данных и визуализаций.

Читать полностью…

data.csv

Вы уже могли заметить, что японцы очень любят инфографику и активно применяют её в быту. Сегодня тащу вам пару примеров с рынка ☺️

На первом фото — магазин специй. Куча непонятных названий, которые видишь в первый раз. Что делают владельцы? Сортируют их по остроте! И не надо каждому покупателю объяснять, чем один вид ичими отличается от другого.

На втором фото — духи. Я похожие графики видел в нескольких магазинах. Сортировать могут по разным показателям но тут такие: от свежих к сладким и от цветочным к расслабляющим.

Вот настоящая инфографика для бизнеса, а не это всё.

А вы часто что-то такое видите у нас в магазинах?

Читать полностью…

data.csv

Пока другого контента у меня для вас все равно нет, зацените инфографику в меню японского бара. Они визуализировали всё своё вино 😍

По оси X тут лёгкий, фруктовый, освежающий вкус слева и тяжёлый, вяжущий справа. По оси Y, как я понял, указана крепость вина. Крепкие — снизу.

Хотели бы такую карту в барах своего города?

Читать полностью…

data.csv

The Pudding визуализировали результаты панельного опроса американцев — на протяжении десятков лет их спрашивали о том, как складывалась их жизнь.

Исследование подтверждает: то, в каких условиях вы росли, во многом определяет ваше будущее — образование, уровень достатка, ментальное и физическое здоровье.

Меня очень впечатлила концовка, где приводятся высказывания американских президентов, которые оскорбляют бедных людей, «низшие» слои населения, которые говорят, что «быть бездомным — это выбор»

Авторы, напротив, утверждают, что это не вполне выбор и не только проблема этих людей, а проблема всего общества, в котором они находятся.

Ну и напоследок: посмотрите, какое тут визуальное хулиганство. Все графики состоят из человечков, которые перебегают в разные категории. Красиво очень.

https://pudding.cool/2024/03/teenagers/

Читать полностью…

data.csv

Одна из проблем, с которой вы можете столкнуться в желании поделать красивых графиков — это отсутствие качественных данных.

Я сам каждый раз раз бьюсь с этим, когда готовлю задания для студентов своего курса — прежде чем перейти непосредственно к визуализации, данные нужно спарсить, почистить, привести в нужную форму, соединить несколько датасетов. Пока дойдёшь до финала — демотивируешься.

Мои классные коллеги из «Если быть точным» эту часть работы делают сами и создают готовые датасеты, которые можно анализировать и визуализировать. Свою коллекцию они постоянно пополняют, в том числе наборами данных, которых нет в других источниках.

Например, в их коллекции есть численность населения по всем муниципальным образованиям и населённым пунктам с разбивкой по полу, дела и тексты судебных решений по статье 105 УК «Убийство» или численность больных онкологией в регионах России с 2007 года.

Найти для себя что-то интересное можно в их каталоге:
https://tochno.st/datasets

Читать полностью…

data.csv

У вас бывает такое, когда вы долго обсуждаете какую-то идею, а потом её реализует кто-то другой?

Читаю свежий проект The Pudding и думаю: ну блин 🙈

Коллеги красиво рассказывают о том, как будет устроен климат в мире будушего: например, к 2070 году Мехико и Афины переместятся из умеренного климата в засушливый, а в Москве и Париже станет по-настоящему жаркое лето.

https://pudding.cool/2024/06/climate-zones/

Читать полностью…

data.csv

Много видел всякого, встроенного в плиточные карты, но бампчарты вижу в первый раз.

Симпатично получилось, хотя тема лично для меня не очень понятная, и инсайты с этой картинки получить не выходит.

Если поняли что-то интересное, напишите в комменты)

Источник

Читать полностью…

data.csv

Я периодически публикую работы студентов первого потока курса «Эстетика в графиках», и каждый раз получаю много комментариев, в которых вы просите рассказать подробности.

Хочется этим постом закрыть ответы на некоторые из вопросов 🙌

Как записаться на курс?
В данный момент набора нет. Мы хотим красиво упаковать программу и результаты учеников, сделать дополнительные материалы, которые помогут учиться ещё эффективнее. Сейчас понятно, что новый набор мы объявим в июле.

Если вам интересно обучение — просто оставьте комментарий под этим постом. Мы с вами свяжемся, когда можно будет записаться на второй поток.

Хорошо, а чему вообще учите?
Учу, как правильно и красиво визуализировать данные. Я даю датавиз-мышление, с которым вы сможете делать и презентации на большую аудиторию, и отчёты начальству, и залипательные картинки для соцсетей.

Вот несколько примеров выпускных работ, которые делали мои студенты: раз, два, три.

Учимся мы два с половиной месяца, в конце курса будет дипломный проект.

На кого рассчитан курс?
Мы рассчитываем на студентов, которые обладают базовой компьютерной грамотностью и не боятся таблиц, но хотят прокачать свои навыки визуализации данных. На курсе мы с нуля проходимся по разным программам — никаких специальных знаний не нужно.

Первый поток показал, что к нам приходят студенты с разными навыками и каждый забирает нужный ему опыт. Кто-то впервые знакомится с новыми технологиями и делает первую визуализацию, аналитики прокачивают насмотренность и навыки дизайна, дизайнеры начинают делать свою инфографику более структурной.

В каких программах вы работаете?
На курсе я учу работать в Гугл-Таблицах, Flourish, Tableau Public, Figma, RawGraphs.

Но это, честно сказать, не важно. Я даю формулу, которая позволит вам использовать любой инструмент — в зависимости от целей, которые вы хотите достигнуть.
Хотите писать код на питоне? Пожалуйста :) Но я показываю инструменты, которые, на мой взгляд, наиболее быстро и без долгого освоения помогают получить результат. А теорию вы сможете применить к любым их них.

А в чём особенность курса?
Всю программу разрабатывал лично я, основываясь на своём 7-летнем опыте работы с инфографикой. На тарифах с обратной связью я же буду разбирать ваши работы, подробно указывая на все недостатки.

Ещё этот курс — сугубо практический. Мы не будем уходить в историю инфографики и размышлять об абстрактных концептах. Будет много примеров, реальных приёмов и заданий, на которых вы сможете это применить.

Сколько это всё стоит?
Цены мы объявим вместе с анонсом нового потока здесь и в моей второй группе — «Сделай это красиво». Там я как раз разбираю, как правильно визуализировать данные, какие вы можете допускать ошибки, и зачем эти красивые графики вообще нужны.

Если вам интересно расти в визуализации данных, жду вас там 😌

Читать полностью…

data.csv

Давно я не выкладывал работы студентов своего курса «Эстетика в графиках». А между прочим, в запасах лежит ещё много интересного.

Как, например, инфографика Олеси Кандауровой о космических запусках в России.

Я всегда выбираю больные темы. Хотя изначально не планировала кого-то разоблачать)

В процессе выбора тем случайно наткнулась на методичку «Разговоров о важном», где советовали рассказывать детям о победах России в космосе, при этом не давая каких-либо достоверных данных, подтверждающих факты.

Так я и захотела исследовать эту тему, так как данные все-таки найти можно. Ну и я смогу поделиться найденными источниками со своими племянниками школьного возраста, когда они будут писать очередной реферат.

Я специально не искала готовых датасетов, чтобы попрактиковаться в анализе, поиске и группировке таблиц для построения графиков. Брала только те данные, которые не вызывали сомнений. Перепроверяла (сверялась минимум с двумя источниками). Большую часть собирала руками (особенно часть про космонавтов, где нужно было вручную проверить их статус (турист или профи)

Использовала Tableau, Flourish, RAWGraphs, Figma, Adobe Illustrator. Экспериментировала с цветом, метафорами. Больше всего сил ушло на тексты/аннотации. Хотелось, чтобы не возникало вопросов у читателя или сомнений.

Очень помогли лекции, в которых обсуждали важность экспериментировать с типом графиков. Я нагенерировала всяких разных у себя в черновиках и смотрела, какие лучше передают идею. Поняла, что важно пробовать разное, не зацикливаться на привычном, но при этом помнить про смыслы.

Читать полностью…

data.csv

В рабочем проекте обсуждали идею визуализации, в которой хотели показать пересечение разных сущностей.

Например, 1000 покупателей ходят в «Пятёрочку», 250 — в «Дикси», а из них 125 ходят и туда и туда.

Мой коллега Антон Мизинов сделал полезный инструмент, который помогает правильно такие пересечения визуализировать. Сидел с ним рядом и слышал, что там под капотом какая-то непростая математика 😁

Пощупать:
mizinov/venn-area-diagram" rel="nofollow">https://observablehq.com/@mizinov/venn-area-diagram

Читать полностью…

data.csv

Тинькофф Журнал подробно исследовал даты рождения россиян — на примере 40 миллионов клиентов Тинькофф Банка.

Внутри много красивых графиков и интересных инсайтов.

Например, оказалось, что в конце года дней рождения сильно меньше, чем в начале. Почему?

Меня ещё позабавил график, на котором явно видно, что 13 числа каждого месяца дней рождений меньше, чем в соседние дни. Суеверие или случайность?

Подробности читайте тут:
https://journal.tinkoff.ru/birthday-stat/

Читать полностью…

data.csv

Прочитал сегодня интересную статью о том, как устроены геоданные в Китае.

Оказывается, Китай использует свою закрытую систему координат, нелинейно отличающуюся от общепринятой в мире. Сделано это в том числе из соображений национальной безопасности, и основной прикол этой системы в том, что к широте и долготе каждого места добавляются случайные смещения от 50 до 500 метров в любую сторону.

Насколько я понял, ни один внешний провайдер не имеет точной карты Китая, и это может весьма интересно проявляться: например, если в картах Гугла посмотреть на центр Шанхая в режиме спутника, то можно увидеть множество улиц прямо посреди реки.

Я бы не удивился, если бы там действительно была какая-то система улиц прямо в воздухе, но в данном случае это именно проблема декодирования китайских координат.

Вообще, чем больше читаю про эту страну, тем больше желания приехать и посмотреть на это всё. Только страшно: заблудишься где-нибудь, и чёрт там разберёшься с картами 🙈

https://habr.com/ru/companies/selectel/articles/815611/

Читать полностью…

data.csv

Необычный график попался в материале Bloomberg про гуманитарную катастрофу в Секторе Газа. Помощь в регион приходит через два канала — Керем-Шалом (Израиль) и Рафах (Египет).

Площадной график разбит на две половинки, из чего наглядно следует, когда и с какой стороны в Газу ехали грузовики с едой, медикаментами и другими вещами.

Смотреть материал

Читать полностью…

data.csv

Прикольный формат у Т—Ж: можно полистать, из чего состоит стоимость кружки кофе

Ещё прикольнее было бы, если бы на каждом слайде появлились какие-нибудь новые подробности, а то подписи можно было бы и на одной картинке уместить

Но все равно — залипательно:
https://journal.tinkoff.ru/coffee-price-structure/

Читать полностью…

data.csv

Через пару часов начнётся первый полуфинал Евровидения.

Несмотря на то, что Россия уже несколько лет не участвует в конкурсе, в нашей стране у него по-прежнему остаются фанаты. Студент моего курса Виктор Ямбаршев в своём дипломном проекте решил изучить историю Евровидения.

Виктор много экспериментировал с Tableau, благодаря чему получилось найти интересные закономерности — например, понять, с какой регулярностью разные страны участвовали в конкурсе и какой разброс баллов был у тех, кто занимал разные места.

Читать полностью…

data.csv

Крутой спецпроект ТАСС о том, какими были агитационные плакаты СССР во время Великой Отечественной Войны. Инфографическая доминанта материала — «прямоугольники Эйлера» с пересечением цветов плакатов по темам. Очень любопытно также почитать о том, как делали эту картинку: определяли цвета плакатов и затем визуализировали при помощи плагина Generator для Figma.

https://tass.ru/spec/okna-tass-leningrad

Читать полностью…

data.csv

Продолжаем рубрику «инфографика из Японии»

В широко известной здесь сети магазинов 7-Eleven продают какие-то чудные булки и рекламируют их при помощи датавиз-буклета. На нём визуализировано, какую долю необходимых витаминов вы получите из такой булочки.

Особенно «понравился» приём, где разорвали столбик, да ещё и значение нигде не подписали. Гении 🙈

Читать полностью…

data.csv

Гуляю по Токио и, конечно, замечаю вокруг инфографику. Картинка где-то на районной доске

Гугл говорит, что карта озаглавлена как «Извлекаем уроки из прошлых крупномасштабных землетрясений и пожаров»

На карте показаны последствия крупномасштабного землетрясения 1923 году, надпись внизу гласит «во время землетрясений часто возникают пожары»

Легенду я плохо понимаю, но предполагаю, что красные точки — это очаги возгорания, а синие — места, где приходилось ликвидировать последствия пожаров.

Если в канале есть изучающие японский, приходите в комменты со своей интерпретацией 😅

Читать полностью…

data.csv

Простите, а меня читает кто-нибудь из Практикума?

Я правда пытался найти авторов этой статьи, но не смог.

Я понимаю, что слово «инфографика» для карточек товаров на маркетплейсах уже начало закрепляться в народе, и для SEO и простоты поиска полезно его в статье упоминать. Но тут же весь нарратив буквально построен на том, что это и правда инфографика )

А это не так. И мне кажется, что это оскорбляет людей, которые по-настоящему делают инфографику. Было бы здорово, если бы Практикум не поддерживал вредные ошибки, а как-то разъяснил, что никакого отношения к инфографике это не имеет — это просто карточки товаров для маркетплейсов.

В редких случаях там действительно может быть инфографика, но это исключение

Читать полностью…

data.csv

Bloomberg продолжает вполне успешно применять в визуализации тримапы Вороного — в этот раз для того, чтобы показать тенденцию применения гендерно-нейтрального слова chairperson вместо chairman.

https://www.bloomberg.com/graphics/2024-gender-neutral-board-titles-us-companies/

Вероятно, для просмотра потребуется подписка, режим инкогнито или расширение Bypass Paywalls

Читать полностью…
Subscribe to a channel