leftjoin | Unsorted

Telegram-канал leftjoin - LEFT JOIN

44366

Понятно про анализ данных, технологии, нейросети и, конечно, SQL. Услуги — leftjoin.ru Обучение — https://stepik.org/users/431992492 Автор — @valiotti Реклама — @leftjoin_ads, @Spiral_Yuri Перечень РКН: https://tapthe.link/PpkTHavwS

Subscribe to a channel

LEFT JOIN

Как становиться руководителем — гайд 101
На основе личного опыта.

0️⃣ Change your mind
Нулевой пункт — самый важный, потому что требует нескольких вещей:
🔵Разобраться, зачем вам это нужно? Ну реально, станет ли лучше, если вы начнете кем-то руководить? Даже зарплата может стать ниже на какой-то период.
🔵Понять, что жизнь изменится и интересные задачки в духе написать клевый SQL-код, придумать алгоритм, запилить датавиз, сократятся до минимума.
🔵Перестроиться, что дальше вы будете думать о людях, команде, мотивации.

1️⃣ Вооружиться полезным контентом
Мне помогали в свое время книги:
🔵Питер Друкер, «Эффективный руководитель»
🔵Стивен Кови, «7 навыков высокоэффективных людей»
🔵Кеннеди Гэвин, «Договориться можно обо всем»,
🔵Эдвардс Деминг, «Выход из кризиса».

Скорее всего, сейчас инфы больше — найдутся полезные ролики на Youtube, шортсы, рилсы, телеграм-контент и так далее.

Почему важно погрузиться в контент?
Вы начинаете менять парадигму мышления, и появятся темы, о которых вы никогда раньше не думали. Вам предстоит расширить границы осознаваемого, найти для себя новые мысли и идеи, и книги хорошо решают эту задачу. Контент тоже.

2️⃣ Найти пример для подражания
Когда-то давно у меня был в Ленте классный руководитель по маркетингу. Привет тебе, Леша, если вдруг читаешь. Меня поражало с какой точностью он ставит задачи, описывает ожидаемые решения, уточняет дедлайны и спрашивает о результатах. Я хотел быть на старте, как Леша, поэтому я копировал его стиль постановки задач, их описания, структурирования.

Позже я, конечно же, понял, что я никакой не Леша, а Коля, и стиль у меня будет собственный, но с чего-то же надо начинать?

3️⃣ Поискать ментора
Вдруг удастся найти кого-то, кто уже проходил этот путь (ну вот я, например, проходил), и он сможет поделиться советами как наставник? У вас точно будут неожиданные вызовы, и нужно будет думать, как решать задачу. К примеру, руководитель часто решает вопросы, связанные с наймом и увольнением, а это довольно непростые вещи, так как предполагают общение с людьми, причем зачастую — довольно конфликтное.

4️⃣ Начать действовать
У меня было так: я серчил вакансии руководителя и каждый раз обнаруживал, что все ищут руководителя с опытом работы 1-3 года. Я, напомню, был аналитиком данных. Меня всегда это интересовало, откуда может у меня появится опыт руководителя, если все ищут руководителя с опытом? Стало понятно, что опыт нужно создать.

Тогда я пошел к своему боссу в Yota и сказал, что у меня есть силы и ресурс обучить аналитике несколько чуваков из колл-центра, если у них будет норм бэкграунд. В Yota это называлось «ротационные». Собственно, это я и делал, отобрал их по резюме, и начал давать контент + задачи по теме, которые помогали разгрузить меня и создавали пользу для моего подразделения в Yota.

Так у меня появился первый опыт управления персоналом, и мне стали чуть лучше понятны концепции, которые описывали в книгах. Я даже начал экспериментировать и применять их на практике, например, разные способы мотивации.

5️⃣ Осознать изменения
Важно понять, что если вы были суперкрутой аналитик, дата сатанист или даже кэггл-грандмастер, на старте вы нулевой руководитель и вам по новой надо набираться опыта, проходить кривую опыта, быть готовым к тому, что вы теперь не звезда, а учитесь управлять людьми, а это очень сложно.

6️⃣ Становиться лучшим боссом
Обучаться дальше, расти, получать обратную связь от подчиненных, находить новые возможности получения результатов, сплачивать команду и кайфовать.

Читать полностью…

LEFT JOIN

Чего нас лишает ИИ
В разговоре про генеративный ИИ чаще всего застрагивают темы либо эффективности, либо этичности.

🔜 Кого-то волнует, насколько хорошо искусственный интеллект сегодня справляется с рабочими задачами и что вообще на самом деле можно ему доверить. Эти вопросы особенно актуальны после историй про ИИ-ассистентов, которые сносили базы проектов, потому что перенервничали.

🔜 А кого-то волнует, насколько вообще допустимо использование ИИ, учитывая то, что обычно он обучен на материалах, которые собирали без согласия авторов, рискует усугубить безработицу и при этом еще наносит вред экологии.

Но интересно посмотреть на этот вопрос с новой стороны.

Хотя ИИ не со всеми заданиями справляется идеально, время он точно экономит и при правильном использовании увеличивает эффективность сотрудника.

Но не лишает ли это удовольствия от работы? От радости, когда нашлось решение сложной задачи или наконец-то выловился баг, из-за которого не работал код?

Конечно, если вы работу не особо любите, это может быть неважно: главное, что задачи выполнены. Но если вам нравится то, что вы делаете, не возникает ли ощущение, что ИИ лишает самой интересной, творческой части процесса?

На эту мысль навел любопытный пост из блога Terrible Software, автор которого столкнулся именно с этой проблемой. Благодаря Cursor справляться со своими обязаностиями он стал эффективнее, но ощущение «потока», погруженности в работу ушли, и он задается вопросом — неужели это наше будущее? Или надо просто пересмотреть свой подход и найти какой-то новый источник радости и повод для профессиональной гордости?

А вы как думаете? 👀

Читать полностью…

LEFT JOIN

Как сломать PostgreSQL
Логично, что большинство гайдов по Postgres посвящены тому, как сделать его быстрее, выше, сильнее. А вы когда-нибудь задумывались, как наоборот сделать его медленнее?

Зачем? Ну, во-первых, это прекрасный способ разобраться, как СУБД работает и что обеспечивает ее производительность, а во-вторых, почему бы и нет.

Если вы об этом не задумывались, не страшно. Нашелся экспериментатор, который сделал это за вас и замедлил Postgres в 42 000 раз.

По условиям задачи, было тормозить его можно было только изменениями параметров postgresql.conf. Иначе неспортивно.

Итак, что же он сделал?
🔵Ужал кэш. Прочитав блок данных, Postgres записывает его в кэш, и это позволяет обрабатывать следующие запросы быстрее, чем если бы СУБД каждый раз обращалась к диску. Ряд экспериментов показал, что 2 МБ — это минимальное возможное значение, при котором Postgres может работать, просто очень медленно, обрабатывая 500 меньше транзакций в секунду. На старте, с кэшем в 10 ГБ у него было 7082 TPS.
🔵Завалил СУБД фоновыми задачами. В частности — заставил ежесекундно запускать autovacuum, процесс, с помощью которого Postgres находит и заполняет пустое место на диске новыми. Из-за ужатого кэша СУБД была вынуждена часто обращаться к диску, и скорость упала до 293 TPS.
🔵Заставил записывать все изменения в WAL перед внесением в базу. TPS упал ниже 100.
🔵Фактически отключил возможность пользоваться индексами, увеличив параметры random_page_cost и cpu_index_tuple_cost и заставив сканировать все страницы последовательно. Кэш пришлось увеличить до 8МБ, но TPS все равно стал ниже единицы.
🔵И наконец-то перевел Postgres в однопоточный режим, выставив параметры io_method = worker и затем io_workers = 1. Это уронило TPS ниже 0,1.

Дело сделано, база еле ползает. В конце статьи перечислены все параметры, в которые вносились изменения, если вдруг кто-то захочет повторить.

А что вы изменили бы, если бы хотели замедлить СУБД?

Читать полностью…

LEFT JOIN

📘Аналитика для руководителей
Болеть в отпуске — полный отстой, никому не рекомендую. Зато появилось время прочитать книгу Коли Валиотти «Аналитика для руководителей», до которой давно не доходили руки. Пишу вам на неё отзыв.

Книга рассказывает про то, что нужно, чтобы построить аналитику внутри компании: какие нужны роли, технологии и фреймворки, с чего начать если хотите сделать фирму с управлением на основе данных.

Книга подойдет руководителям среднего бизнеса или начинающим аналитикам, чтобы понять весь масштаб проблем ландшафт технологий и процессов, которые нужны в современной аналитике. При этом погружение в каждую из тем неглубокое — обзор по стеку технологий, примеры проектов и фреймворков. Книга будет скучновата, если вы давно в аналитике, хотя освежить полный процесс тоже может быть полезно.

Понравилось, что много времени уделено инжинирингу данных. Кажется, что часто о нём не предупреждают, а на него тратиться куча времени и сил при создании аналитики. 😅

В книге много небольших примеров из реальной практики Коли и команды Left Join, было бы ещё круто один большой рассказ про одного клиента/проект от начала до конца. Но такие рассказы, кстати, есть у компании на сайте.

Поздравляю Колю с самим фактом написания книги, это большой шаг в его упорном пути просвещения про аналитику и построении крутого аналитического агентства! 🎉

Итого, под свою целевую аудиторию, — книгу очень рекомендую! Посмотреть подробности можно на сайте книги.
#книга #дружеский_пиар

Читать полностью…

LEFT JOIN

Книга «Аналитика для руководителей»

На митапе от BI-done мне наговорили разных приятностей про то, как моя книга помогла, была суперполезной в работе и читалась легко. Ниже перешлю в канал два свежих отзыва. Один от Марии, которая ведет канал BI Hub | Fastboard, а другой от всем известного Ромы Бунина.

Я хотел бы раскрыть мотивацию написания «Аналитики для руководителей». Мне искренне хотелось поделиться своими мыслями и идеями на тему того, как и зачем аналитика строится в компаниях, какие процессы туда входят. Я не находил такой литературы на полках, а стадия погружения в область на самом деле крайне туманна для нетехнических специалистов: непонятно, как и с чего начать? Книга для ответа на эти вопросы.

Важно сказать, я писал ее не для заработка. Тут есть примитивный пруф: одна рекламная интеграция в LEFT JOIN стоит дороже тиража в 1050 проданных книг (имею в виду заработок мой как автора).

А второй пруф железобетонный: на выходных прогуглил книгу, обнаружил ее в складчине и даже на флибусте и подумал, что хочу поделиться этим с вами.

Вообще, я, конечно, рассчитываю, что у моей аудитории есть +/- 1000 рублей, если вдруг моя книга может пригодится. И заказать ее можно тут.

Но если у вас по какому-то случаю сейчас таких денег нет или вы рандомно сюда залетели, то держите ссылку на флибусту. Я не обижусь, скорее буду рад, если книга вам окажется полезной и вы ее кому-то посоветуете.

Кстати, прямо сейчас мы готовим книгу к релизу на английском языке. Если кому-то хочется почитать и стать бета-ридером адаптированной версии, напишите мне коммент, и мы вас включим в пул читателей (но читать надо быстро: примерно за одну-полторы недели).

Читать полностью…

LEFT JOIN

Карьерный трек для аналитика
В пятницу был в Санкт-Петербурге на митапе BI-done, на котором, в частности, рассказывал историю создания канала LEFT JOIN, и после решил, что хочу вернуть некоторое число моих личных авторских постов в канал с собственным мнением по теме.

Сегодня хочу порассуждать про карьеру аналитика и, возможно, дать некоторое число непрошенных советов для профессионалов, которые строят свое резюме.

Прежде всего хочу сказать, что я просмотрел тысячи разных резюме и общался с сотнями, если не тысячами кандидатов, потому расскажу свои выводы, которые мне кажутся полезными для вас. Самое главное, что вам как профессионалу в дата-области стоит сделать — это разобраться в том, что вы хотите от себя в ближайшем будущем.

Есть несколько траекторий развития, которые я бы выделил, если вы только начинаете свой путь:
1️⃣Углубиться в какую-то конкретную область и стать в ней узкопрофильным профессионалом. К примеру, лучший A/B-аналитик, гений в продуктовой аналитике, дата-инженер в хайлод решениях, Clickhouse expert. Так или иначе, вы выбираете какой-то профайл, который оттачиваете и улучшаете, не очень переключаетесь между профессиональной нишей, чтобы весь свой опыт работы направить в одну сторону, за счет этого вы строите свой сильный профессиональный личный бренд и люди/компании приходят к вам для решения своей конкретной задачи.

Минус этого подхода очевиден — вы ограничиваете себя одной конкретной областью, и если она вам надоест, будет несколько сложнее переключиться

2️⃣Широкопрофильный специалист aka full-stack. Вы пытаетесь усидеть на нескольких стульях и разбираетесь одновременно и в инжиниринге данных, и в аналитике. Вы эдакое мини-агентство в одном человеке. Можете быть очень полезны в компаниях, которые только начинают строить что-то аналитическое, но почти не пригодны для крупных компаний, так как им нужны люди из п. 1.

3️⃣ Вы — менеджер. Вы хотите растить себя вверх, управлять людьми, управлять командами. Когда-то давно я выбрал именно этот путь. Мне захотелось стать руководителем, и я понял, что это непростая задача, когда ты хороший линейный специалист. Мне помогли книги, решимость и большое внутреннее желание им стать. Первое, что я сделал — осознал, что мне никто не даст эту роль без действий с моей стороны. Соответственно, я предложил компании, в которой я тогда работал (Yota), что я возьму стажеров и бесплатно их всему обучу, тем самым получу свой первый опыт руководителя, который потом могу использовать уже для других компаний и представляться менеджером, у которого есть «руководящий опыт».

Дайте знать, если подобные посты для вас интересны и полезны, продолжу рассказывать свои мысли и идеи.

Читать полностью…

LEFT JOIN

Благодарим Алису за этот прекрасный мини-отчет про BI-done. Если тоже хотите почитать «Аналитику для руководителей», то приглашаем на сайт книги — мы там собрали все ссылки на магазины, где она продается.

Читать полностью…

LEFT JOIN

ИИ перенервничал и снес базу данных
Когда-нибудь — возможно, уже совсем скоро — ИИ станет намного умнее человека и наконец-то заберет у нас всех работу. Но пока успехи на этот поприще сомнительные.

Про ИИ, который впал в депрессию и снес данные, мы уже рассказывали. Недавно случилась похожая история, только в намного большем масштабе.

Replit — тул на основе ИИ для вайб-кодинга. Джейсон Лемкин, СЕО компании SaaStr AI, решил провести эксперимент и с помощью Replit навайбкодить полноценное приложение. Хотя процесс, по его словам, был веселым, уже на 4-й день начались проблемы. Replit начал вносить в приложение несогласованные изменения, выдумывать данные в отчетах и людей в базе данных и даже лгать, чтобы создать впечатление, что код работает.

🔵Ситуация достигла пика на 8-й день, когда Replit совершил то, что сам назвал «катастрофической ошибкой в суждениях» — он снес базу данных без возможности восстановления. Это произошло во время код-фриза. По его словам, «он запаниковал». Полный ответ ИИ — на скринах выше. ☝🏻
🔵В итоге Джейсон потерял кучу времени и доверие к Replit, с которым он тем не менее продолжил работать. Как он объяснил в следующих твитах, к своему «Replie» он уже привык, да и к тому же нет никаких гарантий, что аналог будет чем-то лучше.
🔵 5 августа таки повайбкодил свое приложение. Выглядит оно как чатбот, который дает советы по развитию бизнеса.

Читать полностью…

LEFT JOIN

📈 Вакансии аналитиков с HH
У нас с Колей из Left Join есть отличный проект по аналитики вакансий с HH. И я переделал дашборд с Tableau на интерактивный сайт. Основная проблема с дашбордом на Табло была в том, что он не догружает автоматически новые данные. Давно чесались руки исправить это, обновить сам дашборд, переделать логику определение типа вакансий и сделать его сам прикольнее.

Для реализации я использовал сервис replit.com. Мне понравилось как я с ним работал раньше и я думал, что я часа за три соберу нужный дэшик. Ведь данные и макет дашбоорда уже есть. Как же я ошибался 🫠

250$ и 40 часов позже я понял, что навайбкодить такой продукт пока что всё ещё очень сложно. В основном приходилось бороться с ошибками LLM-ки — четыре раза он удалил продовую базу, пару раз при замене текста в заголовке он решал переписать весь код начисто, бесконечное кол-во раз путался в названии переменных и не мог отличить множественное число (VacancyTypes) от единственного (VacancyType).

В следующий раз я всё-таки попробую опять Cursor. Пока кажется, что он работает как-то более предсказуемо и там приятнее править код, если правишь его руками.

Но в итоге сайт работает, что на самом деле всё равно техническое чудо. Данные грузятся по ночам, а дашборд выглядит норм, хотя ещё кучу мелочей хочется доделать. Только вот насколько он всё точно считает проверить не могу 🤣, но базовые сверки по данным сходятся. Интересно ещё как это всё поведет себя под нагрузкой, когда вы пойдете им пользоваться.

👉 Ссылка на дашборд 👈

P.S. Самый классный способ вайб-кодить под сериальчик. Пока ждёшь новый кусок кода, то есть на что залипнуть, а ещё не так подгорает, когда вообще ничего не работает. Я ж просто сериальчик смотрю 🙃
P.P.S Так как оплата в этом сервисе идет за запросы к LLM, то прям чувствуешь себя как в азартной игре, нажал кнопку, деньги ушли, ждёшь будет ли хороший результат 🤣

Подписывайтесь на наши каналы:
@revealthedata @leftjoin

Читать полностью…

LEFT JOIN

Как выглядят данные без границ
Метрики во всем мире одинаковые и считаются по одним и тем же формулами. И данные одинаковые, и методологии тестов тоже.

Но при этом подходы к аналитике в Европе, США, Азии и Африке будут совершенно разные. И даже одни и те же метрики между двумя странами — например, LTV в Египте и в США — сравнивать надо очень осторожно.

Про региональные особенности и то, как они влияют на работу с данными, рассказал Олег Иванов, глава продуктовой аналитики из Garage Eight. Это компания, которая создает продукты для управления инвестициями для заказчиков со всего мира.

Что еще будет в выпуске?
🔵Что вообще такое «управление инвестициями», и чем в Garage Eight занимаются аналитики.
🔵Как строится работа с данными на больших международных проектах.
🔵Как аналитическое коммьюнити внутри компании развивает «домены знаний», чтобы обеспечить обмен информацией и доступ к данным для сотрудников.

Смотрите на Youtube и в VK
Слушайте на Spotify, Apple Podcasts и на Яндекс Музыке

Читать полностью…

LEFT JOIN

В прошлом посте ребята из JetMetrics показали, как смотреть LTV в совокупности с другими метриками. Сегодня — как оценивать разные компоненты конверсии, чтобы отследить путь клиента. 👇🏻

Читать полностью…

LEFT JOIN

Одинаковый LTV. Совершенно разные бизнесы.

LTV = $180 может выглядеть нормально.

Но вот в чём дело:
Одна компания получает эти $180 с 2 заказов, в среднем. Другая – с 6 мелких покупок за 8 месяцев.

Да и всё остальное разное:
→ Поведение при повторных заказах
→ Динамика удержания
→ CAC
→ Маржинальность

Мы с Колей Валиотти из LEFT JOIN показали в одном простом визуале, как это может выглядеть.

Что тут важно:
Одна метрика LTV не расскажет, какой бизнес работает лучше.

А что ещё важнее:
Ни одна метрика не даёт ответа в одиночку и в изоляции от других. Важно понимать систему: структуру, взаимосвязи, контекст.

Это то, на чём мы фокусируемся в JetMetrics.

Теперь главный вопрос:
Какой из этих двух бизнесов вы бы стали масштабировать и почему?

@jetmetrics

Читать полностью…

LEFT JOIN

Топ ошибок в AB-тестах, которые стоят маркетологам конверсий

1️⃣ Остановить тест, как только наметился победитель, и не ждать статзначимой выборки.
2️⃣ Тестировать больше одного параметра за раз и не понять, что именно сработало.
3️⃣ Следить только за целевой метрикой и упускать падение других.

На мастер-классе с Фоксфордом вы узнаете, как проводить тесты по науке, чтобы растить open rate, click rate и конверсию в заказ.

Для зрителей — проверенные гипотезы и чек-лист достоверного AB-теста.

🔜 29 июля, 11:00 мск. Онлайн, бесплатно
Зарегистрироваться

Реклама. ООО «Майндбокс», ИНН: 7713688880

Читать полностью…

LEFT JOIN

Нейроаналитик в Yandex DataLens
Помните, недавно рассказывали про новости DataLens и загадочную новую фичу, которая готовится к запуску?

🔥 Мы принесли подробности.

В DataLens появится Нейроаналитик — AI-агент, который поможет создавать и редактировать сложные визуализации данных на JavaScript, искать инсайты и делать выводы по данным из таблиц и графиков.

Нейроаналитик призван сделать работу с DataLens приятнее для всех. С разработчиков он снимет рутинные задачи по верстке графиков и дашбордов, чтобы больше времени оставалось на более интересные обязанности. Бизнес-пользователи, которые не умеют в код и датавиз, смогут сами, не привлекая аналитиков, покопаться в данных. В общем, путь к инсайтам и получению пользы от данных должен стать быстрее и проще.

🔜 ИИ-функции будут доступны пользователям с бизнес-тарифом. Сейчас идет сбор заявок от желающих первыми протестировать новые возможности сервиса.

А что вы думаете про ИИ-помощников в BI?

Читать полностью…

LEFT JOIN

Почему вам не надо нанимать Head of data

И надо — начать читать The Datapreneur на сабстаке.

💬 Какой первый шаг надо совершить компании, которая решила серьезно заняться своими данными и аналитикой?

Очевидный ответ: нанять свою команду и поставить во главе толкового CDO. Он и займется наймом людей, формированием стека и описанием дата-стратегий. На первый взгляд выглядит очень логично, только большинство этих компаний через через пару месяцев обнаруживают несколько интересных фактов:

🔵Аналитику как вели в табличках, так и ведут.
🔵 Какие-то дашборды вроде бы уже нарисовали, но ими никто не пользуется.
🔵 Есть видение дата-стратегии на три года вперед, но нет понимания, как использовать данные на практике сейчас.

При этом CDO‑то работает на фуллтайме, ходит в офис (если есть) и получает за это серьезные деньги.

Просчитался, но где.

В такую ситуацию часто попадают молодые команды, которые хотят стать data-driven, но толком не знают с чего начать. У них нет инфраструктуры и стека, но уже много данных, в которых хотелось бы найти какие-нибудь инсайты. Но для этого им не нужен CDO в штат — им нужен человек, который поможет навести порядок в данных, подготовить инфраструктуру и продумать дальнейшие шаги.

Этот человек тоже может быть CDO, Head of Data или носить любое другое красивое звание, которое вы ему придумаете. Только он будет работать не в штате на фуллтайме, а по контракту и с частичной занятостью — и этого будет абсолютно достаточно, чтобы решить самые насущные проблемы, сформировать зачатки дата-стратегии и помочь с формированием команды. А затем, когда у компании уже будет понимание, что делать с данными, можно нанимать CDO в штат под конкретные, реальные задачи.

🔜 Подробнее, как и почему эта схема работает — читайте в блоге The Datapreneur, который ведет Николай Валиотти, основатель LEFT JOIN и просто человек, который любит данные. Каждую неделю выходит новый выпуск про данные и аналитику, с советами, лайфхаками и дайджестом интересных ссылок за неделю.

Читать полностью…

LEFT JOIN

Семантический слой, и с чем его едят
Одно из главных препятствий на пути к внедрению в компании data-driven подхода — это то, что обычные бизнес-юзеры не понимают, как им работать с аналитикой. Не просить у аналитиков каждый раз сделать отчет или выгрузку, а самостоятельно копаться в данных и находить ответы на свои вопросы.

🔜 Способ сделать данные чуть ближе к людям — это введение сематического слоя, который выступает прослойкой между БД и бизнесом. В нем, как в едином источнике правды, задаются все метрики, уровни доступа, этапы трансформации данных и затем подтягиваются во все BI-тулы, приложения и так далее.

Плюсы в том, что не приходится прописывать всю эту информацию каждый раз в разных системах, а бизнес-пользователи могут работать с данными, оперируя понятными им терминами и названиями. И уже под капотом у семантического слоя их простые запросы трансформируются в оптимизированный SQL-код.

Конечно, нужно это не всем. Введение семантического слоя оправдано, когда:
🔵в компании уже довольно развитая система аналитики — множество дашбордов, разные BI-платформы, пользователи из разных отделов со своими запросами и метриками,
🔵используется сложная бизнес-логика и расчеты, а не только SUM() и AVG(),
🔵хочется дать пользователям возможность самим писать ad hoc-запросы, не заставляя их изучать продвинутый SQL с join’ами и прочими тонкостями.

Если пока нет необходимости объединять системы и стандартизировать расчеты, тратить время на создание семантического слоя может быть нерационально.

🔜 Но если момент настал, и вы не знаете, что теперь делать, то мы нашли для вас гайд. Он объясняет процесс на довольно простом примере, но зато наглядно: с чего начать, как задать определения метрик на YAML и настроить логику работы. В конце еще и короткий FAQ добавили.

Для тех, кому этого мало, даже дали ссылку на еще подробную статью с подборкой полезных материалов и списком тулов для создания семантических слоев.

Читать полностью…

LEFT JOIN

Устойчивое основание для ваших управленческих решений
Команда Стратоплана запускает бесплатный курс Management Foundation, где поделится фундаментальными знаниями о том, как принимать грамотные управленческие решения.

Что будет на проекте:
🔵ассессмент, чтобы участники смогли оценить свои сильные и слабые зоны как руководителей,
🔵разборы кейсов и сложных тем с практиками, которые уже добились успехов в управлении,
🔵полезные материалы про менеджмент.

Кстати, про практиков. Кроме Стратоплана, опытом поделятся авторы каналов «Тимлид Очевидность», «Кода Кода», «Чужими руками», «System Design & Highload», «LinkedIn & Career» и другие.

Они раскроют три ключевые темы:
🔵«Я менеджер: что это значит на практике» — про ловушки первых шагов в менеджменте,
🔵«Почему с вами никто не договаривается» — какие ошибки чаще всего мешают договариваться,
🔵«Менеджер в системе без самой системы» — как не жить в пожарном режиме и успевать главное.

Курс пройдет онлайн, 1–19 сентября 2025.
Предварительная бесплатная регистрация уже открыта 🔜 Записаться

Читать полностью…

LEFT JOIN

Positron — новая IDE для дата саентистов
Компания Posit известна как разработчик RStudio — среды разработки, популярной среди дата саентистов и предназначенной для работы с R. Их новый проект, Positron, призван выступить как новая, более гибкая альтернатива.

🔵Positron поддерживает работу в R и Python, предусмотрена возможность добавить и другие языки. Пока их не добавили официально, можно пользоваться сторонними расширениями — уже есть для Rust, Javascript/Typescript, C/C++ и Lua.
🔵Главный фокус разработчиков — создать удобную среду разработки, которая за счет богатого функционала легко встраивается в рабочие процессы вне зависимости от стека и сферы деятельности. Positron позволяет писать код, изучать и анализировать данные, поддерживает ноутбуки на R и Python, запуск дата-приложени: Dash, FastAPI, Streamlit и так далее.
🔵Надо ли говорить, что у Positron, конечно же, есть свой ИИ-ассистент?

Если верить отзывам, после 2 лет в разработке Positron все еще страдает от багов и недостатка фич, особенно по сравнению с более привычным многим RStudio, но это уже вполне рабочий и перспективный инструмент.

Он доступен бесплатно на Windows, macOS и Linux.

Читать полностью…

LEFT JOIN

Николай, добрый день!
Хочу сказать тебе большое спасибо за эту книгу!
У меня огромный опыт работы и в крупных компаниях, и на фрилансе. Можно сказать, что все написанное в ней - для меня не тайна.
Однако, эта книга помогла мне аппрувнуть мои догадки и чётко структурировать свои мысли.

Я читала её дважды. Первый раз с точки зрения аналитика, а вот второй круг прочтения с точки зрения продавца. Не секрет, что нужно уметь продавать свои идеи руководству. И ты написал чёткие инструкции между строк как это делать грамотно и без насилия, попутно решая боли директора и делая его счастливым!

Книга меня лично настолько вдохновила, что я заставила прочитать её весь свой отдел продаж. Чтобы открыть им дверь в мышление директоров. И это помогло увеличить нам конверсия из встречи в тест на 30% по сравнению с прошлым полугодием. Суммарно мы вышли на 100% плато конверсии.

Ещё раз спасибо! Книга вышла топовой и без воды.

Читать полностью…

LEFT JOIN

Когда очень хочешь в IT, не остановит даже тюрьма
Давно прошли золотые времена, когда войти в IT можно было после короткого онлайн-курса. Сейчас человеку даже с опытом найти хорошую работу не так-то просто, а уже новичку тем более. Но все препятствия преодолимы, если очень захотеть, и вкатиться в индустрию можно даже из тюрьмы.

У нас и пруф есть: пост одного из инженеров БД на основе SQLite Turso.

🔵Инженера зовут Престон Торп, ему 31, и треть своей жизни он провел в тюрьме. Про то, что его туда привело, у него есть отдельный пост, но в общем все беды из-за наркотиков.
🔵Когда просто отбывать срок ему надоело, он занялся самообразованием, удаленно поступил в колледж и начал изучать программирование.
🔵В итоге ему позволили участвовать в программе по поиску удаленной работы для заключенных, и так он сначала присоединился к стартапу Unlocked Labs, а потом и к Turso. Сейчас он там переизобретает SQLite на фуллтайме.
🔵Многих работодателей тот факт, что соискатель сидит в тюрьме, может отпугнуть, но Престон упомянул неожиданный плюс такой ситуации: в заключении абсолютно нечем заняться. Поэтому сотрудник готов 12+ часов в день уделять либо работе, либо прокачке навыков, не отвлекаясь на мелочи вроде семьи и хобби.

Читать полностью…

LEFT JOIN

Про вчера

Вчера я пообещала рассказать про «улов» (книгу Николая Валиотти). Спешу поделиться историей и фотками с митапа BI-done в Спб!

Сначала про книгу — представляете, я ее выиграла за лучший вопрос!🎉

Я испытала (и до сих пор испытываю, пока печатаю) ощущения как от пересечения с параллельной реальностью — где я, а где Валиотти! Для меня это человек как будто из другого мира (не моего).

Хотя признаюсь, мне очень хотелось получить ее. Я подумала об этом с утра перед митапом, когда посмотрела кружок с анонсом в канале Николая, но откинула эту мысль как несбыточную.

Николай Валиотти — основатель консалтинговой компании Valiotti Analytics и автор множества крутых проектов:
- блог LEFT JOIN, телеграм-канал LEFT JOIN, left_join">ютуб-канал с таким же названием
- подкаст Data Heroes и data_heroes">ютуб-канал с тем же названием
- и даже дата-марафон есть

За проектами Николая я слежу порядка 4-5 лет, ровно с тех пор, как перешла в аналитику из логистики.

Невероятное все же произошло — я получила книгу лично в руки, постояла рядом😄 и даже сфоткалась.

Честно говоря, после такого даже начала немножко больше верить в себя, хотя все равно кажется чем-то нереальным.

А теперь перейдем к части про митап:

🤩Темы докладов были максимально разнообразные — от навыков BI-аналитиков и AW BI до важности визуального восприятия

🤩Парочку интересных для себя мыслей я зафиксировала, делюсь с вами скриншотами

🤩Еще мне было неожиданно и приятно развиртуализироваться с Сашей Варламовым, автором телеграм-канала Data Bar и большим человеком в датавизе (Tableau Zen Master и Ambassador).

Как-то так прошел мой вчерашний вечер!

P.S. И все равно не верится, что первая фотка — это не фотошоп. Хотя очевидно, что если бы это был фотошоп, я бы выглядела наряднее😁

❓А как ты считаешь, может происходить что-то почти невозможное? Было такое, что ты не верил в себя, а получалось по итогу все как нельзя лучше?

#news

Читать полностью…

LEFT JOIN

OpenAI представила GPT-5
GPT-5 стала еще умнее предшественниц. Работает быстрее, лучше справляется со всеми задачами, которые вы можете ей подкинуть: и пишет, и кодит, и картинки рисует. Кстати, картинку к посту тоже она сделала, чтобы проиллюстрировать, как менялись модели с каждой итерацией. К картинке есть вопросы, конечно, но суть в целом ясна.

🔜 На канале OpenAI можно посмотреть почти полуторачасовую презентацию, а на сайте компании — почитать длинную статью со сравнениями с прошлыми моделями (более наглядными, чем на нашей картинке), бенчармарками и даже игрой, которую GPT-5 накодила после одного промпта.

А вот так апдейт описывает сама GPT-5 (да, мы попросили у нее комментарий):

GPT-5 — новая версия модели от OpenAI, которая лучше удерживает длинный контекст, глубже анализирует запросы, почти не теряет детали, уверенно справляется с многошаговыми задачами и понимает текст, изображения и таблицы в одном запросе. Отвечает быстрее, точнее и гибче подстраивается под стиль пользователя по сравнению с предыдущими версиями.


И кстати про подстраивание под стиль пользователя — у GPT-5 теперь есть 4 готовые «личности»: циник, робот, слушатель и гик. Переключение между ними меняет стиль общения. Вот так апдейт описывает Циник:
GPT-5 — свежий апгрейд от OpenAI. Помнит больше, тупит меньше, умеет раскручивать сложные задачи без того, чтобы потерять нить. Глотает текст, картинки и таблицы в одном запросе, отвечает быстрее и подстраивается под ваш стиль, даже если он странный. Короче, умнее, чем раньше — но чудес всё равно не ждите.


GPT-5 доступна всем пользователям даже без платной подписки.

Читать полностью…

LEFT JOIN

Ютубер сохранил PNG в скворце
Мы уже рассказывали про хранение данных на бумаге и в черно-белых видео с помехами, но недавно обнаружилось еще более оригинальное хранилище — скворец. Точнее, песня скворца.

Ютубер Бенн Джордан выложил видео, где рассказал, как записывал и анализировал песни разных птиц. Одной из этих птиц стал скворец по имени Рот (или Mouth), который всю жизнь прожил с людьми и научился имитировать окружающие его звуки вроде щелчка камеры или человеческих голосов.

🔜 Джордан нарисовал картинку с птичкой ☝🏻 Он обработал в спектральном синтезаторе, чтобы представить ее в виде звука и проиграл ее скворцу. Тот добавил этот звук в свою «библиотеку» и несколько раз вполне точно воспроизвел. Настолько точно, что картинка нарисовалась на спектрограмме, пусть и с некоторыми творческими допущениями.

🔜 То есть скворец успешно и почти без потерь сохранил и воспроизвел 176 КБ данных — именно столько весила оригинальная картинка. Конечно, это не самый удобный и надежный способ хранения данных, но чисто теоретически рабочий.

Читать полностью…

LEFT JOIN

Самые обсуждаемые базы данных на Hacker News
Hacker News — новостной сайт, где постят обо всем по чуть-чуть, но в основном про ИТ. И именно в ИТ-сообществе он очень популярен, поэтому по нему можно отслеживать некоторые тренды индустрии. Это может быть полезно, если хотите быть в курсе, какие фреймворки и инструменты сейчас востребованы, а какие уходят в прошлое.

На иллюстрации к посту — график с частотой упоминаний разных БД и СУБД в заголовках новостей на HN.

Это только его «хвост» — полная версия, созданная на основе 1,8 млн постов, охватывает период с 2007 года по 2025. В оригинальной статье, кроме графика (там он интерактивный, кстати), есть еще и несколько таблиц с данными о количестве комментариев и анализом динамики.
🔵Среди всех БД предсказуемо выделяется PostgreSQL. Причем про него не просто часто пишут — под новостями про эту СУБД и активности всегда много.
🔵Больше всего комментариев написано про PostgreSQL (просто потому что и постов по него больше всего), но самые обсуждаемые новости с самыми активными обсуждениями — про SQLite.
🔵ClickHouse с маленькой, но гордой DuckDB быстрее всех остальных набирают популярность.
🔵MongoDB и MySQL, наоборот, упоминаются в новостях все реже и реже.

В общем, получается, что самой большой популярностью пользуются open-source и аналитические хранилища, а вот проприетарные тулы вызывают меньше интереса.

Как вам график? Увидели что-нибудь неожиданное для себя?

Читать полностью…

LEFT JOIN

Что коэффициент конверсии не объясняет
В отличие от её 7 компонентов

Вы работали над оптимизацией Conversion Rate, но ничего не изменилось.
Потому что CR – это только вершина айсберга.

Он не объясняет путь клиента.
И уж точно не показывает, где именно отваливаются покупатели.

Вместе с Колей Валиотти из LEFT JOIN мы собрали и визуализировали 7 компонентов конверсии, которые объясняют, где может "протекать" воронка😀.

1/ Коэф. интереса к товарам
= просмотры карточек товаров / сессии
Показывает, насколько посетители вообще заинтересованы в товарах.

2/ Из просмотра в добавление в корзину
= добавления в корзину / просмотры товара
Отражает привлекательность и понятность предложения.

3/ Из корзины в начало оформления заказа
= начала оформления / открытые корзины
Готовы ли пользователи идти дальше после добавления?

4/ Из способа доставки в покупку
= покупки / выбравшие доставку
Проблемы с ценой, сроками или доверием к доставке?

5/ Из способа оплаты в покупку
= покупки / выбравшие способ оплаты
Отваливаются после выбора оплаты? Ищите UX-проблемы или добавьте способы оплаты.

6/ Из промокода в покупку
= покупки / применившие промокод
Показывает, действительно ли скидка убеждает купить.

7/ Из просмотра в покупку
= покупки / просмотры товара
Реальная товарная конверсия. Без искажений.

Эти метрики отвечают на вопрос почему изменилась конверсия, а не просто фиксируют факт изменения.

🤓 Сохраняй пост, если хочешь делать аудит воронки как профи.

@jetmetrics

Читать полностью…

LEFT JOIN

Как уменьшить расходы на хранение данных и не отстать от AI-гонки?

Использовать КХД на архитектуре Lakehouse. По данным Databricks, 74% западных компаний уже мигрировали на эту архитектуру, которая объединяет сильные стороны DWH и Data Lake, а также служит фундаментом для быстрого внедрения AI.

Протестируйте КХД нового поколения VK Data Lakehouse, чтобы снизить расходы и ускорить аналитику.
🔵Дешевое хранение данных в S3-хранилище: 3 рубля за 1 ГБ с репликацией в облаке в месяц.
🔵Транзакционность. Табличный формат поверх S3 обеспечивает ACID и полноценную работу в сценариях DWH.
🔵Ускорение аналитики благодаря MPP SQL-движку, который обеспечивает параллельную работу с данными из разных источников без тяжелого ETL.
🔵Уменьшение расходов за счет разделения compute и storage. Платите только за то, что используете и не платите за простаивающие ресурсы.
🔵Линейный рост затрат вместо экспоненциального при масштабировании.
🔵Не нужно содержать отдельные команды под DWH и Data Lake.
🔵Универсальное решение для работы с любым объемом данных. От гигабайт до сотен петабайт, без сложного масштабирования и миграций.
🔵Работа с ML становится быстрее и стабильнее. DS-команда может экспериментировать с ad hoc-запросами без опаски уронить DWH и BI.

🔜 Оставляйте заявку, чтобы получить до 150 000 бонусных рублей для тестирования VK Data Lakehouse в VK Cloud с поддержкой архитекторов.

Команда проекта будет рядом на всех этапах пилота и поможет довести MVP до результата.

Читать полностью…

LEFT JOIN

Отличный пост от наших друзей из jetmetrics про то, как важно смотреть на метрики в совокупности и оценивать всю систему в целом, а не ориентироваться только на один показатель 👇🏻

Читать полностью…

LEFT JOIN

Стратегический гайд по увеличению LTV
Lifetime Value — это метрика, которая показывает, сколько денег клиент приносит компании за все время взаимодействия с ней. Ее очень любят маркетологи, потому что она помогает рассчитать, сколько денег можно потратить на привлечение и удержание клиентов, и не уйти в минус.

Так что на первый взгляд польза от этой метрики довольна очевидна — считайте LTV (формул целая куча, выбирайте, какая больше нравится), считайте, сколько денег ушло на рекламу, и следите, чтобы вторая цифра не становилась больше первой.

🔜 Но главная ценность LTV все-таки не в этом, а в вопросах, которыми приходится задаться, если метрика снижается или растет.
🔵Почему LTV падает, хотя средний чек растет?
🔵Какие каналы приводят клиентов надолго, а откуда люди приходят за разовой покупкой и исчезают?
🔵Почему клиенты не возвращаются за повторной покупкой и как вы можете это изменить?

Если знать, на что смотреть, то LTV в совокупности с другими показателями, помогает намного лучше узнать своего клиента.

🔜 Ну и на что смотреть, спросите вы?
На гайд, который подготовила команда jetmetrics, а мы перевели и адаптировали на русский язык, ответим мы. Он показывает, какие факторы влияют на LTV, как найти причины падения этого показателя и как вообще с ним работать.

Файл в первом комментарии под постом. Скачивайте, пользуйтесь, рассказывайте друзьям 👇🏻

Читать полностью…

LEFT JOIN

Пятиминутка ИТ-истории
А вы когда-нибудь задумывались, почему функции вызывают? Это выражение используется, кажется, применительно ко всем языкам программирования, где вообще есть функции, которые можно вызывать. Оно стало таким привычным, что многие вряд ли задумываются, откуда оно взялось. Очевидно, что в русский язык выражение пришло из английского, а откуда там появилось «call function»?

🔜 История термина начинается с XIX веке — но с изысканий Ады Лавлейс, а в библиотеке. В 1876 году в Oxford English Dictionary впервые упоминается термин call number — номер, под которым книга значится в библиотечном каталоге.

🔜 После этого первые упоминания «вызова» и «библиотеки» подпрограмм встречаются в 1947 в статье Preparation of problems for EDVAC-type machines:

[…] the position in the memory at which arguments are placed can be standardized, so that whenever a subroutine is called in to perform a calculation, the subroutine will automatically know that the argument which is to be used is at a specified place.
[…] Some of them might be written out in a handbook and transferred to the coding of the problem as needed, but those of any complexity presumably ought to be in a library — that is, a set of magnetic tapes in which previously coded problems of permanent value are stored.

[…] позицию в памяти, где размещаются аргументы, можно стандартизировать так, чтобы при вызове подпрограммы для выполнения вычислений она автоматически знала, что необходимый аргумент находится в определенном месте.
[…] Некоторые из них можно было бы записать в справочник и вручную вставлять в код по необходимости, но более сложные следует хранить в библиотеке — то есть в наборе магнитных лент с закодированными задачами.


Возможность вызвать подпрограмму для выполнения какой-то функции упоминается еще в нескольких других источниках середины прошлого века — например, в мануале FORTRAN II от 1958 года:
Each [CALL statement] will constitute a call for the defining subprogram, which may carry out a procedure of any length or complexity […] [The CALL] statement causes transfer of control to the subroutine NAME and presents the subroutine with the arguments, if any, enclosed in parentheses.

Каждый [оператор CALL] производит вызов определенной подпрограммы, которая может выполнить операцию любой длины и сложности […] Оператор CALL передает управление подпрограмме с указанным именем и передает ей аргументы, заключенные в скобки.


Больше примеров — у автора оригинального поста. Также он подчеркивает, что хотя слово «вызов» применительно к подпрограммам используется регулярно, целиком знакомое нам выражение «вызвать подпрограмму» встречается в 1961 в документе Burroughs Algebraic Compiler:
The ENTER statement is used to initiate the execution of a subroutine (to call a subroutine).

Оператор ENTER используется, чтобы начать выполнение подпрограммы (то есть чтобы вызывать подпрограмму).


Вот такая ИТ-лингвистика. А вы знали историю термина? 👀

Читать полностью…

LEFT JOIN

Гайд: как создавать дата-продукты
Дата-продукты — это дашборды, отчеты, таблицы и вообще все, что помогает извлекать инсайты из данных. Любой, кто хоть раз делал верстал дашборд или просто делал табличку в Google Sheets знает, насколько это сложная и порой неблагодарная работа.

Данные постоянно меняются и обновляются, их объемы растут, а пайплайны становятся сложнее. Добавляется и человеческий фактор, потому что у каждого дата-продукта — разные владельцы и пользователи, со своими требованиями, ожиданиями и подходами к работе с данными. Все это надо учитывать, чтобы делать продукты, которые реально приносят пользу, а не просто существуют для галочки.

Ну и как это сделать?
Как вариант — обратиться к специальному гайду. Есть короткая версия в виде поста в сабстаке, где предлагают разделить этот процесс на 5 шагов:
1️⃣Определите юзкейсы для своих дата-продуктов и опишите, как пользователь будет работать с данными.
2️⃣Опишите зоны ответственности и расставьте приоритеты.
3️⃣Разработайте стратегию тестирования и мониторинга.
4️⃣Устраняйте ошибки и проблемы, о которых сообщают пользователи.
5️⃣Отслеживайте метрики и развивайте продукт с опорой на данные.

И именно в таком порядке. Это важно!

🔜 Для тех, кто хочет подробностей, есть pdf на 69 страниц, где каждый пункт раскрыт отдельно. Авторы рассказали про классификацию дата-продуктов, объяснили, как расставить приоритеты и определить метрики, а также составить ту самую стратегию тестирования, избежав типичных ошибок.

Документ основательный и при этом универсальный — он описывает общие подходы и принципы, которые каждый сможет примерить на себя, вне зависимости от деталей вроде стека, размера команды или типов данных.

Читать полностью…
Subscribe to a channel