Курсы Яндекс Практикума для аналитиков данных помогут студентам начать свой путь в анализе или укрепить навыки для эффективной работы и карьерного роста.
На курсах по аналитике вы сможете:
— освоить SQL для анализа данных;
— работать с Data Science, проектировать витрины и хранилища;
— познакомиться с Python и с его помощью анализировать данные;
— подтянуть математику для работы в аналитике и DS;
— визуализировать данные, строить понятные графики, дашборды и Excel-таблицы;
— понять роли и задачи системного, продуктового и бизнес-аналитика, чтобы выбрать то, что близко.
Программы курсов составлены с учётом актуальных требований работодателей. Кроме ревьюеров и команд поддержки и сопровождения, вам будет помогать YandexGPT, которая объяснит непонятные термины, сожмёт материал для повторения и не даст забуксовать в сложных темах.
Начните бесплатную часть любого курса до 30 ноября и получите промокод со скидкой 20%. Пусть Чёрная Пятница станет поводом сделать карьерный рывок!
→ Выбрать курс
Редкое событие!
Работа Никиты Рокотяна получила на престижнейшей Information is Beautiful Awards серебро, а дата-арт Нади Андриановой бронзу! Это действительно крупный успех. Очень за вас рад, коллеги! 👏🏻👏🏻👏🏻
Посмотреть обсуждение наград и премию в целом можно в прошедшем стриме на канале у Никиты: /channel/dataviznews/563
Рома Бунин - единственный спикер, который выступает на Матемаркетинге четвёртый (!) раз подряд.
Секрет в том, что Рома каждый год рассказывает новую серию своего собственного импровизированного сериала.
Пробегитесь по предыдущим докладам, послушайте приглашение Ромы и анонс новой серии, а также регистрируйтесь на сайте, чтобы завтра тоже послушать очередную серию - лекция Ромы будет в публичном доступе, нужно лишь оформить себе free-доступ на странице matemarketing.ru/tickets (купить билет тоже здорово 🙂)
— Процессы для построения BI-системы
— Сериал про систему дашбордов: мафия, ресторан
— Как совмещать разные инструменты и строить команду
Очень красивая интерактивная карта Римской империи, сделанная в Tableau. Залипательно.
(Смотреть только с большого экрана)
Самые востребованные навыки на 2023–2027 годы
Всемирный экономический форум опубликовал рейтинг компетенций на ближайшие 5 лет — на первом месте оказались аналитические навыки. Именно их, по данным 803 компаний из разных сфер, нужно прокачивать сотрудникам для карьерного роста. Успех маркетинговой кампании, эффективность дизайна сайта, вероятность возврата кредита — во всех этих задачах пригодятся аналитические навыки.
Чтобы вырасти в карьере в 2–3 раза и увеличить доход, советую освоить аналитические навыки на программе «Профессия аналитика данных» от Changellenge >> Education.
Под руководством экспертов-практиков из Google, Авито, VK, Revolut и не только вы с нуля освоите все необходимые аналитикам навыки. Обучение на 75% построено на практике, поэтому вы не будете скучать на длинных лекциях, а закрепите навыки на 13+ бизнес-кейсах от компаний-партнеров. Также на онлайн-встречах у вас будет возможность пообщаться с экспертами и получить от них карьерный совет.
По итогам обучения каждый выпускник получит диплом о профпереподготовке установленного образца и сможет подтвердить свои компетенции перед работодателем, а также вернуть 13% стоимости курса через налоговый вычет.
Подать заявку на курс можно до 20 октября по ссылке. А по промокоду CHART10 подписчики канала получат скидку 10 000 рублей!
Реклама. https://changellenge-education.com/ ИНН 7716917009 erid=2VtzqwvEu6C
⚡️Yandex DataLens в open source!
Сегодня для DataLens большой день, теперь доступна open-source версия инструмента. Каждый может предложить улучшения на GitHub или доработать инструмент под себя и использовать на своих серверах. Это первый релиз и со временем работа c открытой версией будет проще и удобнее. Комьюнити очень круто выиграет от того, что это не просто open source, а коммерческий проект, который будет развиваться профессиональной командой.
Я наблюдал за проектом со стороны и был удивлён тем, что выйти в open source — это совсем не «мы просто сейчас возьмём репозиторий, в github переложим и всё». Было проделано много работы: с кодом, сборкой проекта, дизайном, юридическими нюансами (оказывается их очень много!) и работой с зависимостями.
🎉 Поздравляю всю команду проекта! 💪
🔗 Ссылки
— Сайт проекта
— GitHub
— Статья на Хабр
— Чат DataLens
P.S. А ещё классный новый логотип во всех версиях =)
#ссылка
Вообще, Лиза Шарлотта Мут из Датавраппер справедливо указывает, что WCAG не вполне применим к визуализации данных. И рассказывает о том, что Эндрю Сомерс разрабатывает собственный стандарт — APCA, который даёт более адекватные результаты по контрасту цветов, в применении к визуализации данных.
Кроме того, на различимость цветов влияет не только яркость фона и основного цвета, но и размер цветового элемента, характер фона (на темном фоне светлые оттенки более различимы, чем наоборот), качество экрана, конкретные оттенки, освещенность окружающей среды, отступ до краев фона и другие.
В качестве примера, я хочу показать инфографику, которая использовалась в рекламе Экономист про города, наиболее пригодные для жизни. Я проверил их через WCAG — и результаты получились катастрофические. 3 цвета из 5 имели недостаточный уровень контраста по WCAG — 1,02, 1,44, 1,87, а еще один — 2.22 — тоже ниже нормы по контрасту. (Норма — 3:1 и более для крупных элементов и 7:1 и более для мелких)
Эндрю Соммерс предлагает свой инструмент для стандарта APCA. Я проверил картинку от Экономист там... и результаты оказались теми же самыми :))
45% — это минимум для крупного текста (аналог 3:1 для WCAG). 60% — норма для среднего размера объектов. И для мелких объектов контраст должен быть не меньше 75%. Этот тест также прошел лишь один цвет. Добавим, что еще и точки очень маленькие.
(Вообще, я обратил внимание на эту картинку именно потому, что засомневался, что бледно-желтый проходит по читаемости, потому что на телефоне эти точки было не видно вовсе)
Сложно понять, чем руководствовались дизайнеры Экономист, возможно это просто картинка для промо, и она и не должна была быть 100% читаемой, но очевидно, что бледно-голубой и бледно-желтый на этом сером имеют катастрофически низкий контраст.
Пожалуйста, продумывая цвета для датавиз, учитывайте не только их функциональность с точки зрения выполнения датавиз-функций, эстетику, но также не забывайте про различимость их между собой и с фоном.
Артём Иволгин, один из лучших журналистов-инфограферов в нашей стране, выпустил новый проект — про то, как меняется популярность имен в России. Глубокая работа с множеством прекрасных визуализаций, которые могут стать референсами и для ваших проектов. Причем интересны не только вид визуализации, работа с цветом и подписями, но и работа с данными и сторителлинг-ракурсы этих визуализаций.
https://journal.tinkoff.ru/name-stat/
Планы на среду: прокачать SQL и расчет продуктовых метрик!
📣 20 сентября в 19:00 по Мск пройдет бесплатный live-интенсив по теме: “Расчет продуктовых метрик с помощью SQL”.
Мы проводили такой интенсив в прошлом месяце, но многие не успели на него записаться, а очень хотели — поэтому мы решили, почему бы не провести его еще раз 😍
А еще он очень понравился участникам, и мы собрали много положительного фидбека 💫
👉🏻 На live-интенсиве мы с вами подключимся к реальной облачной базе PostgreSQL и с помощью SQL рассчитаем основные продуктовые метрики онлайн-сервиса:
* Activation rate
* MAU
* ARPU и ARPPU
* другие метрики
На интенсиве вы узнаете:
◾️ Как используют SQL в реальной работе — вы сможете сохранить это в портфолио и показать на собеседовании: работодатель точно оценит 🤘🏻
◾️ Профессиональные фишки и лайфхаки SQL: мы копили их годами и хотим рассказать вам 😏
◾️ Как писать код на SQL, а также мы расскажем про продуктовые метрики — подробно объясним всё с нуля 😍
🔗 Регистрируйтесь по ссылке
Реклама. ООО АЙТИ РЕЗЮМЕ. Erid:LjN8KWcDm
Автосумма: одним движением суммы по всем столбцам/месяцам.
Сочетание клавиш Alt + = позволяет получить сумму быстро, не вводя руками функцию СУММ / SUM.
Если выделить ячейку под столбцом с числами и нажать Alt + =, то получим сумму по этому столбцу (одну функцию СУММ).
Уточняем: речь про "просто Alt", то есть левый Alt. Правый Alt заменяет сочетание Ctrl+Alt и в сочетании с плюсом-минусом будет менять масштаб листа.
А если - как в видео - выделить диапазон из нескольких столбцов и строк вместе с пустой строкой под ним и столбцом справа, то мы получим суммы по каждому столбцу и строке (и итоговую справа внизу).
Паспорт Сингапура дает возможность путешествовать в 193 страны без визы. А есть одна страна, которая очень символично лежит на графике почти посерединке и дает возможность путешествовать в 112 стран (что почти среднее значение). Эта же страна объединяет два континента.
А поисследовать можно тут.
ps beeswarm график делала через ladataviz, просто 5 минут и основа графика уже есть, прямо топ
Люди обычно не осознают как важно на графиках "ничего". Часто это "ничего" — именно то, ради чего график и делается.
Читать полностью…Инструмент для визуализации данных RawGraphs анонсировал на внешнюю аудиторию новую функцию — возможность создавать и использовать «кастомные виды графиков».
Это значит, что теперь любой член комьюнити может написать шаблон для отображения нового вида визуализации, а любой другой пользователь — просто построить по этому шаблону свой график.
Ну и пару слов о RawGraphs — если вы о нём не слышали. Это сервис, который позволяет делать «основу» для вашей инфографики, которую, как правило, потом надо дорабатывать в графическом редакторе. Там нет настройки подписей, заголовков и прочих мелочей, зато есть много видов графиков, которые сложно где-то ещё построить без кода. А теперь, видимо, будет ещё больше ☺️
Карты примерно об одном и том же, но отличный пример как не надо и как надо подбирать цвета для подобных порядковых шкал.
Очевидно, что второй вариант с полярной шкалой и оттенками в зависимости от степени выраженности отношения — ровно то, как и нужно делать.
Ещё один удачный пример физикализации данных *. Ранее постил распределение учителей по возрасту.
* Физикализация данных – демонстрация их с помощью объектов реального мира
#физикализация_данных #примеры_визуализаций #разное
Удивительно, но сама концепция гистограммы — визуализации распределения, плохо доходит до студентов, которые только начинают осваивать визуализацию данных.
Равномерные бины (интервалы), в которые попадает количество значений. Звучит достаточно замороченно.
Между тем — это один из типов визуализации, с которым мы сталкиваемся регулярно во все возможных сервисах выбора билетов, бронирований и т. п. Причем зачастую это визуализация совмещена с фильтром (или скорее фильтр с визуализацией), что можно только приветствовать. Это делает гистограмму еще более понятной и "вещественной".
Общество визуализации данных (Data visualization society) опубликовало результаты глобального опроса о состоянии дел в индустрии. Результаты возможно кого-то удивят.
☀️ Наиболее популярный инструмент среди опрошенных - Эксель (63%), далее Табло (44%) и Пауэрпойнт (41%). Просто зафиксировать. Один из наиболее популярных инструментов, где постоянно работают датавизеры - Пауэрпойнт. Как говорится - теперь живите с этим.
☀️ Средняя почасовая оплата для датавизера - 60-70 долларов в час. Сравнили со своей? ;)
☀️ 81% заявили, что предпочитают нарабатывать навыки датавиз прямо во время работы над очередным проектом
☀️ Главная проблема в общении с заказчиками - отсутствие навыков дата-грамотности у них. И - непонимание ценности датавиз вообще. Еще раз - непонимание ценности датавиза. Живите с этим номер два.
Полный отчет только для участников коммьюнити, которые делают взносы.
Надо сделать важную ремарку, что в опросе участвовали совершенно разнородные группы датавизеров - дизайнеры, дата-журналисты, разработчики, аналитики, ученые, менеджеры.
Просто симпатичный график о смертях от ДТП в Осло.
Нравится как решен показ неполноты данных с 1975 по 2000 год. Линия времени непрерывная, и данные показаны только там, где они были.
(И да, в Осло, где живет 600 с лишним тысяч человек за год от ДТП погиб один водитель, 0 пешеходов, 0 велосипедистов)
#датавизприемы
🤖 Rtutor.ai для работы с вашими данными с помощью запросов на естественном языке
Steven Ge написал приложение RTutor, которое позволяет генерировать и тестировать код на языке R, просто "общаясь" с ним. Например, на основе набора данных mpg
можно задавать такие вопросы: "С помощью ggplot2 создай боксплот (boxplot) для зависимости hwy от класса. Цвет по классам. Добавь джиттер" (Use ggplot2 to create a boxplot of hwy vs. class. Color by class. Add jitter).
RTutor сгенерирует функциональный код для ответа на ваш вопрос, что упрощает проведение предварительного анализа и визуализации данных для тех, кто не имеет опыта работы с R. Тем же, кто имеет опыт работы с R, RTutor поможет сэкономить время, предоставляя код, который можно использовать в качестве отправной точки для своих проектов.
RTutor может быть запущен локально как пакет R. Он также генерирует код R в формате Markdown и html-отчеты.
#R #ggplot2 #AI #chatGPT
Sam Epley сделал инструмент для проверки контраста и восприятия цвета. Он опирается на The Web Content Accessibility Guidelines (WCAG) стандартам, чтобы текст и цвет легко читались и воспринимались.
Можно выбрать цвет фона, текста и тип начертания и он подскажет, какие стандарты вы нарушили, и предложит более оптимальные варианты.
Про сам стандарт и как с ним работать.
Есть, кстати, еще один популярный спор насчет инфографики. Джанк-чарты (или графики, сделанные специально, чтобы привлекать внимание, но искажающие значения) могут быть такими же эффективными в точности представления информации, и при этом сильно выигрывать по наглядности, вовлечению и запоминаемости. Противоположное мнение состоит в том, что джанк-чарты должны умереть, ведь они как минимум подают плохой пример.
Давайте сравним. График слева я нашел в интернете. А график справа сделал сам.
Какой лучше?
Если исходный, ставьте ❤️,
если переделанный — 🔥.
Классный получился эфир. Всем спасибо, кто пришел, прокачали компоненты, интерактивные прототипы и конечно же графики 😏
Спасибо Явно.Дизайн в лице Антона, Миши, Ники и Оли, что поучаствовали в Домашке и отдельное спасибо Саше Богачеву, что залетел в нашу движуху и дал полезные комментарии по графикам!
⚡️ Обязательно подписывайтесь на канал Явно.Дизайн и на канал Чартомойка про графики, их критику и переверстки, датавиз-сообщество, который ведет Саша.
И пока тепленькое, ловите полезные ссылки, которые упоминались на эфире и не только:
✦ На русском:
«Графики, которые убеждают всех» лучшая современная книга на русском языке про базовые знания по визуализации данных и графикам;
Постер от Саши, который помогает выбрать тип графика;
Постер по основным ошибкам в графиках от агентства DataYoga;
Сборник шпаргалок по способу выбора типа графика/визуализации от них же;
Подборка папок с ТГ-каналами по инфографике, визуализации данных и аналитике;
✦ На английском:
Заметки Лизы Шарлотты Мут про цвет в блоге инструмента для визуализации Datawrapper, которые скоро станут отдельной книгой. Новости про книгу тут;
Lisa Sharlotte Muth Songbook миро-доска выжимка с подсказками по улучшению графиков по мотивам статей Лизы.
Запись эфира будет чуть позже 😎
Info Design Songbook - Сделали с чудесной @nastengraph сборник do's / don'ts визуализации данных от экспертов
🗺 Борд в Miro
Давно была идея сделать сборник бестпрактик инфодизайна. Причем не своих, а от экспертов в авторитете.
Главная цель консолидировать всю суть без спекуляций в доступном для восприятии виде.
❤️ Серия статей от Lisa Charlotte Muth очевидно была первая в списке.
Этот автор отличается тем, что очень глубоко копает, круто и понятно объясняет. При этом ее рекомендации точны, они практически не вызывают желания их в чем-то оспорить (или есть такие примеры ?)
Борд можно включать в learning paths для data/bi аналитиков, в планы развития, в онбординг планы новичков, вo внутрикорпоративные курсы по визуализации данных.
Мне сложно придумать более наглядного способа показать как нужно и как не нужно дизайнить графики и при этом не заставлять читать книги - это делают единицы в итоге. А залипать в борд пока нравится большинству.
Есть уже идея, какого автора следующим добавить на борд.
Но мы примем и ваши предложения👇
Друг сегодня скинул тред в твиттере и спросил, считаю ли я этот график манипулятивным.
Короткий ответ — да, но не по той причине, о которой пишет автор твитов.
Длинный ответ:
1. Если мы используем в визуализации столбиковую диаграмму, то всегда должны строить её от нуля. Когда мы смотрим на столбики, то всегда сравниваем их длину. Тут кажется, что температура на первом столбике раз в пять меньше, чем температура на последнем столбике, что явно не так.
2. Вообще-то далеко не всегда нам надо сравнивать величины друг с другом, иногда нужно показать динамику или ранжирование. Сравнивать температуры между собой вообще немножко бесполезно, учитывая, что понятие нуля там неоднозначно.
Как можно было бы построить этот график иначе?
Лучший вариант — оставить просто точки или линии на значениях температур. В Data Viz Project это называется Dot Chart.
На худой конец можно использовать «леденцовый» график.
В этих случаях мы акцентируем внимание на положениях точек друг относительно друга, не сравнивая сами величины друг с другом.
Линейный график здесь использовать нельзя, потому что значения идут не в хронологическом порядке. Об этом — в следующем пункте.
3. Я не считаю ранжирование по значению температур манипуляцией. Здесь была задача показать рейтинг, это валидная задача.
Правда, в данном случае рейтинг очень сложно считать, потому что подписи лет перевёрнуты.
Лучше всего было бы располагать столбики друг под другом, а не слева направо.
Можно было бы попробовать ещё раскрасить подписи лет разными цветами — например, более близкие к современности красным, а более близкие к прошлому — синим. Тогда бы сразу стало понятно, что на первых местах в рейтинге — последние годы.
Какие ещё мнения? Пишите в комменты :)
Переверстка графиков — отличная инициатива. Я постараюсь быть на разборе работ!
/channel/cogload/102
Как строить прогнозы в нестабильное время?
И что делать, когда модели перестают работать, а сезонность больше не актуальна? На эти вопросы продуктовые аналитики Тинькофф и Яндекс Еды ответят на IT’s Tinkoff Product Analytics Meetup 30 августа.
Команды обсудят:
— как работала команда Тинькофф Путешествий в периоды резкого повышенного спроса;
— как под воздействием внешних обстоятельств и целей адаптировался алгоритм ценообразования в Яндекс Еде;
— из чего должны складываться прогнозы в нестабильное время.
После докладов будет нетворкинг и душевные разговоры о цифрах и не только.
📆 Митап пройдет 30 августа в Москве в офисе Тинькофф на «Водном». Не забудьте зарегистрироваться и позвать с собой коллег.
#направахрекламы
Политическое разнообразие и широкая представленность альтернативных политических сил по-русски. Со столбиками, логарифмической шкалой и без нуля.
На самом деле столбики не используют с лог-шкалой. Именно потому, что человек привык сравнивать длины столбиков для того, чтобы понимать какие значения больше или меньше других и насколько. Площадь столбика штука сугубо вещественная.