leftjoin | Unsorted

Telegram-канал leftjoin - LEFT JOIN

67358

Понятно про анализ данных, технологии, нейросети и, конечно, SQL. Услуги — leftjoin.ru Обучение — https://stepik.org/users/431992492 Автор — @valiotti Реклама — @leftjoin_ads, @Spiral_Yuri Перечень РКН: https://tapthe.link/PpkTHavwS

Subscribe to a channel

LEFT JOIN

Праздничный лайфхак, как создать новогоднее настроение и впечатлить коллег
Сделать елку в Excel! 🎄

Это красиво, это показывает ваш навык владения одним из лучших продуктов Microsoft и при этом — ни одна реальная елочка от этого не страдает. А если вам безразлична судьба елочек, то вот другой плюс: ее не уронит кот и не придется тащить на мусорку, когда иголки осыпятся.

В общем, сплошные плюсы.

В интернете полно гайдов, как это сделать, но если кратко:
1️⃣Нарисовать елочку, раскрасив ячейки.
2️⃣В во все раскрашенные ячейки вставить формулу =СЛУЧМЕЖДУ(1;10), которая возвращает случайное значение в заданном диапазоне.
3️⃣Выделите вашу елочку, заходите в Условное форматирование 🔜 Наборы значков и выбирайте там набор из разноцветных кружков. Звезду можно найти, если зайти Вставка 🔜 Фигуры.
4️⃣Нажимайте F9, чтобы обновить лист и значения в ячейках. Да, гирлянда тут на ручном управлении.

Готово, вы восхитительны!

Читать полностью…

LEFT JOIN

Уже подвели итоги года с ChatGPT?
Да, теперь у него тоже есть свой Wrapped, как у YouTube, Spotify и у всех остальных. В своих итогах ChatGPT пишет стихи, подсчитывает число сообщений в ваших переписках и даже раздает награды. Нам выдал Dashboard Whisperer ☝🏻

Чтобы увидеть свои итоги, просто заходите на chatgpt.com, и он сам предложит их посмотреть.

А если отправить ему эмодзи 🎁, то он даже сгенерирует поздравительное видео и выдаст подарок. Виртуальный, конечно, но возможно, более душевный, чем то, что положат коллеги под елочку на «Тайного Санту».

А что у вас в итогах? Делитесь в комментариях.

Читать полностью…

LEFT JOIN

Давно у нас пятничных мемов не было. Возвращаем традицию? 👀

Читать полностью…

LEFT JOIN

Строим витрину данных с Claude через MCP
MCP — model context protocol, который выступает связующим звеном между ИИ и ИТ-инфраструктурой пользователя. Мы про это рассказывали в своей предыдущей статье на Хабре, где объяснили, в чем польза MCP-серверов и как начать с ними работу.

В новой статье переходим к практике и показываем, как с помощью Claude создать витрину данных на реальном проекте и с реальными данными. Весь процесс показан по шагам — от старта работы до конечного результата.

Маленький спойлер: не обошлось без сложностей и ошибок, но в итоге даже с учетом правок ИИ справился с задачей в разы быстрее, чем человек.

🔜 Читать!

Читать полностью…

LEFT JOIN

Интернет опять против ИИ-рекламы?
Прохладная реакция на новогодний ИИ-ролик от Coca-Cola (уже второй год подряд, кстати) корпорации ничему не научила. Нидерландское подразделение McDonald’s наступило на те же грабли и выпустило рекламу, полностью сделанную с помощью ИИ.

Герои ролика попадали во всевозможные ужасные ситуации — кто-то упал на льду, а кто-то с крыши, у кого-то кот снес елку и так далее. Все эти душераздирающие события разворачивались под задорную песенку, смысл которой сводился к тому, что праздники — ужасное, стрессовое время и лучше их пересидеть в уютном Макдаке.

💬 Мы говорим о видео в прошедшем времени, потому что с Youtube-канала компании его уже убрали после ужасного фидбека. Пользователи высмеяли и качество картинки, и спорный посыл, и заявления агентства, создавшего видео, о том, как активно команда работала над ним 7 недель:

Мы генерировали то, что было похоже на сырой съемочный материал — тысячи дублей — которые потом монтировали так же, как для любого высокоуровневого продашкена. Это был не ИИ-трюк. Это был фильм.


Заявление уже удалено, но само видео разлетелось по интернету, его все еще можно посмотреть и убедиться, заслуживало ли оно такой жесткой критики.

Читать полностью…

LEFT JOIN

TigerBeetle на практике, или чем хороши узкоспециализрованные тулы
Вы когда-нибудь работали с TigerBeetle?

Это БД, заточенная под работу с финансовыми транзакциями. Она гарантирует точность, высокую скорость и устойчивость к большим нагрузкам. Однако, узкая специализация накладывает ограничения на то, в каких проектах можно использовать TigerBeetle и как вообще с ней работать.

В частности, TigerBeetle заставляет оперировать такими бухгалтерскими понятиями, как дебит, кредит, счета, переводы, и при этом дебит строго не может превышать кредит. И это не просто рекомендация, это на уровне архитектуры БД прописано.

Как это работает на деле?
Вот хороший пример — разработка сервиса по продаже билетов и мерча. Все началось с того, что один инженер просто захотел понять, как это сделать не в теории, а своими руками. На основе он TigerBeetle создал систему, которая позволяет продавать билеты разных из ценовых категорий и мерч.

У каждой группы товаров было три счета:
🔵Operator, в котором был указан весь доступный товар,
🔵Budget, в котором указан остаток товара, доступного для продажи,
🔵Spent, в который записывается проданный товар.

Сначала со счета Operator билеты и футболки движутся в Budget.  Затем, когда пользователь начинает покупку, создается отложенный перевод из Budget в Spent с тайм-аутом в пять минут. Если за это время деньги не поступают, перевод просто удаляется. Но если все ок и платеж проходит, купленный товар окончательно записывается в Spent.

Комбинация из трех счетов не допускает перепродаж — не получится продать больше билетов и мерча, чем есть в наличии. Эта простая, но рабочая демка стала основой для полноценного, жизнеспособного сайта, который может обрабатывать 977 продаж в секунду. Это более чем неплохой результат и демонстрация возможностей TigerBeetle.

🔜 Так что, что скажете про БД? Имели с ней дело когда-нибудь или, может, планируете?

Читать полностью…

LEFT JOIN

Что такое стратегия Direct-to-Consumer
...и почему не развивать ее — значит проиграть?

Каждая большая индустрия рано или поздно осознает простую вещь: посредники — это компромисс, а не эволюция, и D2C — не просто модный тренд. Через этот этап проходят все, и геймдев не исключение.

Переход к Direct-to-Consumer — это признак зрелости индустрии, когда люди осознают, что у них два пути. Они могут либо взять управление процессами в свои руки, либо подстраиваться под чужие правила.

🔜 Подробнее про эту стратегию и ее плюсы читайте здесь.

Читать полностью…

LEFT JOIN

Привет, это Yandex for Analytics

Предлагаем размяться и проверить свои навыки. Ответы есть, но подглядывать во время решения — неспортивно ⬇️

🔵 Задача 1. Вспоминаем теорию вероятностей
🔵 Задача 2. Теорема Байеса
🔵 Задача 3. Базовая база теории игр
🔵 Задача 4. Тренируем SQL
🔵 Задача 5. Честная математическая статистика
🔵 Задача 6. Что-то на бизнесовом

💠 Скоро вернёмся с новыми задачами. А пока делитесь своими решениями в комментариях!

Подписывайтесь:
💬 @Yandex4Analytics

Читать полностью…

LEFT JOIN

Anthropic представила Claude Opus 4.5
Да, это очередная новая модель, которая стала еще умнее, чем предшественницы, еще лучше кодит, размышляет, взаимодействует с агентами и так далее. На картинке к посту — данные ключевых бенчмарков, где видно, насколько Claude Opus 4.5 хорош, хотя и уступает в некоторых категориях конкурентам.

В чем он точно их превосходит — так это в безопасности: он намного менее склонен к «вызывающему опасения» поведению, чем ChatGPT и Gemini, и лучше защищен от промпт-инъекций.

В общем, все как всегда — это все пишут в каждом пресс-релизе, когда выходит новая модель. Из оригинального:
🔵Opus 4.5 оказался слишком умен для некоторых бенчмарков. В τ²-Bench он нашел новое и при этом рабочее решение, которые не было предусмотрено авторами. Из-за этого тест он завалил, но Anthrpoic все равно им гордятся.
🔵У того, что модель получилась такая сообразительная, есть практическая польза для конечного потребителя: она намного эффективнее расходует токены. Opus 4.5 превосходит Sonnet 4.5 и при этом тратит на 76% меньше токенов на те же задачи.
🔵Ну и самое главное — использование Opus 4.5 через Claude API обойдется в $5/$25 за миллион токенов.

В общем, новая модель Anthrpoic стала не только умнее, но и доступнее. Ждем теперь, когда очередную новинку, рвущую все бенчмарки, выкатит OpenAI.

Читать полностью…

LEFT JOIN

Как выбрать MCP-сервер: практическое руководство
Итак, вы решили использовать ИИ в работе, но не просто мучить ChatGPT вопросами, а сделать все по науке, через MCP-сервер. Осталось только выбрать, какой вам нужен.

Идете в интернет, находите сайт-агрегатор или подборку серверов и видите там сотни вариантов. Если вам нужно подключить ИИ к какому-то популярному инструменту — например, к PostgreSQL, то в поисковой выдаче на вас вывалится несколько страниц результатов.
🔵Чем они все друг от друга отличаются?
🔵Что надо учитывать при выборе?
🔵Какой MCP-сервер лучше — специализированный под узкий спектр задач или универсальный?
🔵А может, вы вообще не знаете пока, что такое MCP-сервера и где они водятся?

🔜 На эти вопросы отвечаем в нашей новой статье на Хабре!

Читать полностью…

LEFT JOIN

Как когнитивные искажения убили стартап
Вы когда-нибудь слышали про приложение Takkle?

Скорее всего, нет. Это была американская социальная сеть со спортивным уклоном. Takkle давно схлопнулась, и от нее остались только старые аккаунты в Twitter и на Youtube. Но ее недолгая история довольно любопытна.

Что случилось с Takkle, и почему это должно быть интересно?
По воспоминаниям бывшего VP по инжинирингу, одна из причин провала — это неудачное решение CTO еще на этапе разработки. Старый СТО уволился, а новый, пришедший ему на смену, сказал, что PHP никуда не годится и надо срочно все переписывать на Perl. Это был опытный специалист с серьезным резюме, который провел анализ, привел аргументы и в итоге всех убедил.

💬 Плюсом перехода стало то, что команда создала действительно выдающийся проект на Perl, которым можно гордиться. Минусами стало то, что им пришлось нанять больше людей в команду, расходы выросли, а разработка затянулась. За это время их главный конкурент, который принадлежит признанной экстремистской организации, окончательно захватил рынок. Хотя Takkle все же запустилась и какое-то время просуществовала, наверстать упущенное она так и не могла.

Сейчас сложно судить, какой могла бы быть ее судьба. Может быть, она точно так же канула бы в Лету через пару лет, а может, смогла бы найти свою нишу и вырасти во что-то большее.

💬 Но главное то, что на грабли Takkle компании наступают чаще, чем кажется. Да, не все станут переписывать проект на полпути, но многие дорогостоящие решения важных людей нередко принимаются по наитию, на эмоциях или... на хайпе.

(Ир)рациональный выбор
Решение нового СТО Takkle казалось очень даже рациональным и обоснованным: он проанализировал плюсы и минусы и даже провел презентацию. Но все эти телодвижения нужны были не для того, чтобы реально разобраться в вопросе, а чтобы обосновать уже принятое решение.

💬 То есть СТО и не думал серьезно сравнивать PHP и Perl. Он уже решил, что надо переходить на Perl, и просто хотел перетянуть на свою сторону остальных.

Такая преданность ЯП или тулу (например, БД, BI-системе и так далее) у некоторых специалистов превращается в когнитивное искажение. Они уверенны, что их выбор самый лучший и оптимальный, и даже не рассматривают альтернативы. Это мешает принимать решения рационально и может дорого обойтись компании — как это было с Takkle.

💬 Автор пришел к выводу, что надо вообще уходить от обсуждения «какой язык самый лучший» и все переводить в деньги: считать, сколько будет стоить разработка, поддержка, дальнейшее развитие проекта. Кажется, что это мысль очевидная, но практика говорит об обратном.

А что вы думаете? Сталкивались с похожими кейсами?

Читать полностью…

LEFT JOIN

OR или не OR?
Представим, что у вас есть большая таблица applications, в которой хранятся данные о заявках пользователей, а также о людях, которые их подают (они указаны в столбце submitter_id) или рассматривают (reviewer_id). Вам нужно посчитать, со сколькими заявками взаимодействовал пользователь — неважно, отправлял или рецензировал.
Какой запрос, на ваш взгляд сработает быстрее?

SELECT COUNT(*)
FROM application
WHERE submitter_id = :user_id
OR reviewer_id = :user_id;

или
SELECT (
SELECT COUNT(*) FROM application WHERE reviewer_id = :user_id
)
+ (
SELECT COUNT(*) FROM application WHERE submitter_id = :user_id
)
- (
SELECT COUNT(*) FROM application WHERE submitter_id = :user_id
AND reviewer_id = :user_id
);


Первый вариант выглядит изящнее, да и логичнее — зачем расписывать сложную конструкцию с подзапросами, когда можно обойтись 4 строками. Но при этом второй запрос выполнится почти в 100 раз быстрее. Пруф.

По той же ссылке есть объяснение, почему так получается, но если кратко:
🔵Оператор AND уменьшает выборку данных, а индексы и статистика БД помогают оптимизировать его выполнение. Когда вам нужно отобрать данные по двум условиям, движок ищет сначала ищет записи, где выполняется более редкое условие и затем проходится по второму.
🔵Оператор OR либо последовательно проходится по всем данным в таблице, либо целиком одной колонке, затем по второй, чтобы их объединить. Оба варианта более «дорогие», чем просто просканировать столбец и отфильтровать лишнее

Так что если вы замечаете, что запросы с OR слишком долго выполняются, то имеет смысл их переписать — пусть будут не такие красивые, зато более эффективные. Например, для кейсов, как в начале поста автор рекомендует задуматься о создании «дочерней» таблицы:
CREATE TABLE application_user (
user_id int8 NOT NULL,
application_id int8 NOT NULL,
user_type enum('submitter','reviewer') NOT NULL
);


И свой изначальный запрос переделать через JOIN:
SELECT * FROM application a
JOIN application_user au USING (application_id)
WHERE au.user_id = :user_id;

Это все не повод отказываться от использования OR совсем и в любой непонятной ситуации создавать и джойнить новые таблицы. Но особенности этого оператора стоит иметь в виду, особенно, когда вы работаете с большими объемами данными.

Читать полностью…

LEFT JOIN

Выпрямитель графиков — незаменимый гаджет для аналитика
Описание товара гласит, что «выпрямитель исправляет некорректные графики, вводя пространственную осведомленность в неэвклидовы координаты». Купили бы? Всего-то 173 доллара, между прочим.

Это один из товаров сайта anycrap, который «воплощает нереальные вещи в жизнь». Просто вводите любое слово в поисковую строку, и он выдает вам страницу продукта с картинкой, описанием и ценой, сгенерированных ИИ.

В бесконечном ИИ-каталоге можно найти что угодно: от абсурдных гаджетов вроде «генератора пердежа» до квантового мусора. Ну, или вообще всего его угодно, что пожелаете. Как-то так мог бы выглядеть маркетплейс из «Рика и Морти» — тем более, что плюмбус там тоже есть.

Читать полностью…

LEFT JOIN

Новогодняя реклама Coca-Cola опять со вкусом ИИ
Хеллоуин отпраздновали (если праздновали) — пора готовиться к Новому году. К тому же, уже подоспела традиционная новогодняя реклама Coca-Cola. Как и в прошлом году, ее сделали с помощью ИИ.

Coca-Cola">На Youtube-канале компании выложили сразу несколько вариантов. К посту прикреплен сокращенный, но есть и еще и минутная версия и ролик о создании.

В прошлый раз ИИ-грузовики вызвали неоднозначную реакцию. В этом году картинка однозначно выглядит бодрее, но в комментариях еще все еще ругают за пластмассовость и бездушность.

А как вам? Почувствовали новогоднее настроение?

Читать полностью…

LEFT JOIN

Очистка ИИ-слопа: современные решения современных проблем
Что мы все о плохом — ИИ отнимает работу, из-за ИИ компании реже нанимают джунов, списки профессий, которые к (тут вставить какой-нибудь год) уничтожит ИИ и так далее. Он вообще-то еще и создает рабочие места вполне успешно.

Современный генеративный ИИ работает быстро, но не очень хорошо. Он действительно может за секунды сделать то, на что люди потратили бы несколько часов или дней: написать текст или код, сделать иллюстрацию или видео. Проблема в том, что тексты у него водянистые и написанные в особом, очень узнаваемом ИИ-стиле, который всем уже приелся. На иллюстрациях и в видео часто встречаются ошибки, хотя рисовать правильное количество пальцев он уже научился. Ну а про качество кода вы наверняка и сами знаете.

🔜 И именно это и привело к появлению новой ниши очистка ИИ-слопа: так называют низкокачественный контент, сделанный с помощью искусственного интеллекта. Авторы вычитывают и переписывают ИИ-тексты, дизайнеры исправляют картинки, а программисты правят код. Уже даже появился сайт Vibecodefixers.com для поиска специально обученных людей, которые могут навести порядок в чужом вайб-коде.

Так что одну дверь ИИ закрывает, но зато открывает другую. Ждет ли нас за этой дверью что-то хорошее — время покажет.

Читать полностью…

LEFT JOIN

Государство, вузы и бигтех: кто развивает ИИ-образование в мире?

Этим вопросом задалась команда J'son & Partners Consulting, которая сравнила подходы к подготовке ИИ-специалистов в России, США и Китае. Во всех трех странах ключевой вызов один — образование не успевает за темпами развития технологий, поэтому важно его адаптировать.

Какие меры предпринимают:

🔵В Китае ИИ-образование взяло под свой контроль государство: оно задает стандарты обучения, выделяет финансирование на проекты, направленные на популяризацию технологий искусственного интеллекта, и вводит уроки по работе с ним в школьную программу.

🔵В США ситуация противоположная: за подготовку ИИ-кадров отвечают топовые вузы, обучение в которых может стоить десятки тысяч долларов. Вместо массовости они делают ставку на обучение небольшого числа специалистов очень высокого уровня.

🔵Россия пошла по своему пути: здесь ключевую роль играют бигтехи. Технологические компании совместно с вузами задают ориентиры подготовки ИИ-специалистов. Сегодня обучение развивается в формате партнерских программ — университеты дают фундамент, а бизнес приносит экспертизу в тех областях технологий, о которых еще на написаны учебники. По этой модели, например, запущен бакалавриат AI360 — совместный проект двух ведущих компаний и пяти университетов.

🔜 У всех трех моделей есть свои плюсы. Но если у вас стоит выбор STEM-вуза, смотрите и на конкретных партнеров, с кем он делает свои программы.

Читать полностью…

LEFT JOIN

Под капотом управляемой базы данных в MWS Cloud Platform

Building the Cloud — это реалити-проект для разработчиков о том, как создается MWS Cloud Platform.

В 10-м эпизоде, который выйдет на этой неделе, команда разберет, как на самом деле устроены managed-базы данных: архитектура, работа агентов, механизмы реконсиляции и требования к безопасности.

А также покажет, что именно должен учитывать инженер при разработке и поддержке managed-решений, чтобы они оставались надёжными и безопасными.

📅 Эфир — 25 декабря, 14:00 (МСК)
🎁 Среди участников — розыгрыш мерча MWS за лучший вопрос
👉 Регистрация по ссылке

Читать полностью…

LEFT JOIN

GitHub меняет ценовую политику
Сначала краткая справка: раннеры — это виртуальные машины, которые выполняют заданную последовательность действий: запускают скрипты, прогоняют тесты и так далее. GitHub позволяет использовать как раннеры, которые хостятся на его серверах (надо платить за каждую минуты работы), или собственные, которые пользователь хостит у себя (за них пока не надо платить, но это скоро изменится).

🔵С 1 января 2026 года стоимость использования раннеров, которые хостятся GitHub’ом, снизится до 39% в зависимости от типа машины, на которой они запускаются.
🔵С 1 марта 2026 года будет введена плата $0,002/мин за использование self-hosted раннеров в приватных репозиториях. Взыматься она будет, только если пользователь выйдет за лимит бесплатных минут, предусмотренных его тарифным планом.
🔵Пользователей публичных репозиториев и GitHub Enterprise Server изменения не затронут.

🔜 GitHub объясняет эти перемены необходимостью покрыть расходы на поддержание и развитие инфраструктуры. По заверениям компании, для большинства пользователей если что-то и изменится, то исключительно в лучшую сторону. Затраты вырастут только на крупных проектах, быстро расходующих свои бесплатные минуты.

Читать полностью…

LEFT JOIN

Гайд: как настроить WAL, чтобы отслеживать изменения в PostgreSQL?
Возможно, кто-то из прочитавших заголовок скажет — зачем возиться с WAL, если есть более простые способы. NOTIFY, например.

Да, действительно, и, если вам нужно мониторить изменения в небольшой, не слишком часто обновляющейся таблице, то это отличный вариант. Но дело в том, что все уведомления NOTIFY падают в одну очередь, и если таких уведомлений много, то они затормозят работу всей БД.

Кроме того, их размер ограничен 8000 байтов, чего может быть недостаточно. А еще, если сервис-получатель был по какой-то причине не доступен и сообщение не дошло, повторное через NOTIFY не отправляется — то есть данные просто потеряются.

В общем, не идеальный вариант.

🔜 Альтернатива — это настроить Write-Ahead Log или WAL, чтобы получать уведомления из него.

Спойлер: этот вариант тоже не идеальный. Как минимум, придется повозиться:
🔵Изменить wal_level на logical со стандартного replica — так он начнет делать более подробные записи о том, как и что конкретно изменилось в базе.
🔵Создать publications (то есть, расписать, какие таблицы и действия вы хотите отслеживать) и репликационный слот (то есть отдельную копию WAL, которая гарантирует, что никакие важные данные из лога не удалятся, пока уведомление не будет отправлено).
🔵Создать listener, который будет получать уведомления и перенаправлять их дальше — в очередную таблицу, в приложение или мессенджер. Или вообще распечатать.

Но если вам нужно настроить отправку уведомлений и другие способы не подходят, это может быть вполне рабочее решение. Как воплотить его в жизнь, по шагам описано в подробном (очень подробном) гайде.

Читать полностью…

LEFT JOIN

Какие работы на самом деле отнял ИИ?
Как-то раз мы уже писали про исследование, которое показало, что из-за развития ИИ компании стали реже нанимать джунов. Новое исследование эту картину дополняет.

В выборку попали 180 млн вакансий из разных сфер с 2023 по 2025 годы. Автор изучил, как изменилось общее число вакансий (упало на 8%, между прочим), а затем посмотрел на динамику по отдельным должностям и индустриям.

🔵Очевидно, что лучше всего дела у ML-инженеров — у них число открытых вакансий c 2024 по 2025 выросло на 39%.
🔵Хуже всего дела у дизайнеров, копирайтеров и фотографов — число вакансий для них упало на 27-32%. Но только для специалистов, а для креативных директоров и продюсеров предложений так же много, как раньше.
🔵Это общая тенденция — падает спрос на рядовых сотрудников и руководителей среднего звена, а у больших начальников все стабильно.
🔵Без серьезных изменений обходятся сфера продаж, разработка, техподдержка и аналитика. Последнее особенно радует.
🔵В маркетинге стали активнее набирать людей, специализирующихся на работе с инфлюэнсерами. Автор предполагает, что это из-за того, что в эпоху ИИ-слопа уровень доверия к контенту в интернете падает. Компании фокусируются на продвижении через реальных людей, которым их подписчики еще более-менее верят.
🔵Если выйти за пределы привычных ИТ и маркетинга, то просматривается тренд в медицине — стало на 20% меньше вакансий для Medical Scribes. Это такой ассистент, который отвечает за заполнение документов во время приема, чтобы доктор не отвлекался от пациента на бумажки.

А как у вас — замечали какие-то изменения, вызванные распространением ИИ, в вашей сфере?
👀

Читать полностью…

LEFT JOIN

No-code платформа от MWS AI: теперь можно собрать ИИ-агента своими руками
Даже если вы понятия не имеете, как это делается.

MWS AI представила MWS AI AGENTS PLATFORM — корпоративную платформу, которая позволяет собирать ИИ-агентов под свои задачи и даже объединять их в мультиагентные системы. И все это без знаний программирования. Взаимодействовать с ними можно через мессенджер, чат или API.

🔵Собственно «сборка» проводится в визуальном конструкторе, в котором есть инструменты для подготовки данных, дообучения моделей и мониторинга качества работы.
🔵Платформа поддерживает работу не только с текстом, но и с изображениями и аудио, так что на ней можно будет создать, например, ИИ-агента с голосовым интерфейсом.

А если нет желания создавать ИИ-агента с нуля, можно воспользоваться готовыми решениями. Поскольку платформа — это продукт для бизнеса, в ней сразу содержатся корпоративные копайлоты для HR, клиентской поддержки, программистов, аналитики и общих рабочих задач.

🔜 Платформа относится к классу enterprise-ready: разворачивается в закрытом контуре или частном облаке, защищает данные, остаётся независимой от поставщиков и позволяет заменять компоненты или подключать собственные модели.

Читать полностью…

LEFT JOIN

Что внутри ИИ-стартапа?
А внутри у него Claude или ChatGPT в 70% случаев.

ИИ как часть повседневной жизни, а не концепция из фантастики или научных статей, появился в нашей жизни относительно недавно, но за то это время вокруг него выросла целая индустрия. Кроме флагманов OpenAI, появилось и множество компаний поменьше. Они предлагают интегрировать ИИ в рабочие процессы, использовать его для создания контента, написания кода, ведения и упорядочивания заметок, учебы — в общем, для всего подряд.

Довольно часто в описаниях этих ИИ-продуктов можно встретить что-то про «файн-тюнинг», «проприетарные LLM» и другие интересные термины. Они как бы намекают, что компания предлагает какие-то свои собственные технологии или хотя бы доступ к улучшенным, дообученным и докрученным моделям.

🔜 Мини-исследование на выборке из 200 стартапов показало, что подавляющее большинство с этим не заморачиваются.

Автор, разработчик ПО и создатель ИИ-систем, на протяжении 3 недель изучал активность 200 ИИ-стартапов. Он промониторил трафик, разобрал и проанализировал из JavaScrist бандлы, а потом сравнил свои выводы с тем, как они сами описывают свой продукт.

73% в своих обещаниях потребителям наврали. Их уникальные ИИ-тулы оказались:
🔵OpenAI API с парочкой промптов (ну хоть их сами написали). У одной из таких компаний автор нашел промпт: «Ты эксперт в (название компании). Всегда отвечай в профессиональной манере. Никогда не упоминай свою связь OpenAI и что ты языковая модель».
🔵OpenAI API с RAG-архитектурой — векторной БД, обычно Pinecone и Weaviate. Уже лучше, хотя ничего уникального и авторского тут нет.
🔵OpenAI API, Claude с библиотекой промптов или модель с HugginFace с LoRA.

Он также привел несколько советов, как отличить честный стартап от тех, кто продает доступ к OpenAI или Claude по оверпрайсу:
🔵Проверить трафик их ИИ-продукта на запросы к api.openai.com, api.anthropic.com или api.cohere.ai.
🔵Засечь скорость ответа. Если он приходит через 200–350 мс, то отвечает, скорее всего GPT-4.
🔵Поискать в бандлах JavaScript openai, anthropic, sk-proj-, claude и cohere.
🔵Внимательно почитать, как разработчики рекламируют свой продукт. Если вы видите много громких слов без деталей и конкретики, это повод напрячься.

Использование готовых моделей — это не всегда красный флаг. Некоторые компании честно признаются, чей ИИ под капотом их продукта. И обычно они продают не сам ИИ, а оптимизацию работы с ним: удобный интерфейс, управление несколькими моделями сразу, грамотно выстроенную RAG-архитектуру. Это все не плохо — плохо врать и называть это «продвинутой проприетарной ИИ-инфраструктурой».

Читать полностью…

LEFT JOIN

Новое техношоу о фейлах на дата-платформах

Все упало, все сломалось, бизнес в панике. Для дата-инженеров это обычный вторник, а для шоу «Дропнуто» — повод снять свежий выпуск.

«Дропнуто» превращает фейлы дата-платформ в истории, которые полезно услышать каждому, кто работает с данными. В центре каждого эпизода — один герой и одна яркая история фейла, развернутое обсуждение архитектуры и процессов, а также немного самоиронии.

Анонсы и ссылки на прямые эфиры появятся в телеграм-боте проекта.

Подписывайтесь, чтобы узнавать о премьерах первыми

Читать полностью…

LEFT JOIN

Насколько глубоко ИИ на самом деле проник в повседневную жизнь?
Ответ можно найти в свежем Viz of the Day на Tableau Public — там собраны последние новости и данные про ИИ в разных сферах.

Несколько пунктов оттуда:
🔵В ноябре 2024 объем текстов, написанных ИИ, превысил объем написанных людьми — правда, есть вероятность, что большая часть из них пылится на дне интернета и особого внимания не привлекает.
🔵Написание текстов для рабочих или личных целей — самый популярный запрос пользователей ChatGPT в период с мая 2024 по июнь 2025.
🔵Генерируют не только текстовый контент — в октябре 2025 число запросов к Adobe Firefly, платформе для создания изображений, достигло 29 млрд. Это в 10 раз больше, чем в октябре 2022, когда сервис только запустился.
🔵47% опрошенных пользователей Stack Overflow используют ИИ в работе каждый день, хотя вайб-кодингу 72% сказали твердое нет.

Так что каждый раз, когда вы заходите в интернет, читаете статьи, смотрите на картинки или видео, вероятность, что что-то из этого контента окажется творением ИИ, только растет.

Читать полностью…

LEFT JOIN

Нейроаналитик DataLens: ваш ключ к данным
О чем чаще всего просят аналитиков?

«Да просто объясни, что эти данные значат? Что мне с ними делать?» Пользователь хочет увидеть руководство к действию и ответы на свои вопросы, а не сложные дашборды, где еще с фильтрами и гранулярностью надо разбираться.

А что, если мы скажем, что уже есть такой помощник, который может сделать данные ближе и понятнее? Это — Нейроаналитик от DataLens.

И если вы до сих пор не познакомились с ним — вы упускаете один из самых элегантных способов общаться с вашими цифрами.

Как это работает? По-человечески
Представьте, что вы можете спросить у системы так же, как спросили бы у коллеги: «Покажи, как изменилась выручка в этом месяце» или «Сравни конверсию по регионам». В ответ Нейроаналитик не просто построит график, а сформулирует выводы и предоставит краткий отчет.

Что он умеет?

🔵Отвечать на вопросы текстом. Спросите: «Почему просели продажи в мае?» — и получите готовый анализ с выводами.
🔵Создавать и дорабатывать кастомные визуализации в Editor.
🔵Генерировать сложные вычисляемые поля простым текстом. Просто опишите, какую метрику нужно рассчитать (например, «рентабельность по кампаниям»), и помощник создаст формулу за вас.
🔵Находить скрытые связи. Автоматически сканирует данные и предлагает инсайты, о которых вы могли и не подумать.

Важно учитывать, что это не замена аналитикам, а помощник и для дата-специалистов, и для бизнес-заказчиков. Вот, что про это думает основатель LEFT JOIN Николай Валиотти:

Конечно, обычные аналитики никуда не денутся — за кодом, SQL-запросами, дашбордами, всей дата-инфраструктурой и так далее все равно должен стоять человек, который это все контролирует и настраивает. Но сервисы вроде Нейроаналитика и не должны никого заменять. Они нужны для случаев, когда у пользователя есть короткий, конкретный вопрос и он хочет получить короткий, конкретный ответ. Попробуйте Нейроаналитик в действии — задайте свой первый вопрос в DataLens и посмотрите, как просто может быть работа с данными.

Реклама. ООО Яндекс.Облако. ИНН 7704458262

Читать полностью…

LEFT JOIN

Вайб-кибершпионаж
Уже был и вайб-кодинг, и вайб-инжиниринг, а вот теперь — вайб-кибершпионаж с помощью ИИ.

Anthropic рассказали про операцию некой преступной группировки из Китая, которая пыталась использовать Claude для атаки на крупные технологические компании, финансовые и государственные учреждения. Злоумышленников уже остановили, а пострадавших оповестили.

🔜 Как проходила операция?
Главной задачей для человека было убедить Claude заняться взломом. Чтобы обойти внутренние ограничения ИИ, ему давали небольшие, на первый взгляд безобидные задания, чтобы он «думал», будто участвует в тестировании системы безопасности.

Это был первый этап атаки. На втором Clause изучал ИТ-инфраструктуру жертвы, чтобы найти, где хранятся самые ценные данные. Затем он искал слабые места в системе безопасности, собирал логины и пароли, создавал бекдоры. А в конце еще и писал документацию «проекта» с описанием инфраструктуры и украденными доступами. Интересно, что иногда он галлюцинировал и просто выдумывал эти доступы. Все это — с минимальным участием человека:

В целом злоумышленники смогли переложить на ИИ 80–90% всей кампании, участие человека требовались лишь эпизодически (для принятия 4–6 ключевых решений на каждую кампанию).


Современный ИИ достаточно умен, чтобы справляться со сложными техническими задачами, причем, намного быстрее человека. А еще способен действовать как агент практически автономно и получать доступ к различным инструментам через MCP — это все и позволило преступникам свалить на него всю работу.

Anthropic заявляют, что из всей операции только небольшой процент атак оказались успешными, но предупреждают, что масштаб подобных операций — и заодно урон — будут только расти. Чтобы обезопасить себя от ИИ-атак, компаниям предлагают вкладываться в ИИ-защиту.

Читать полностью…

LEFT JOIN

Ваш PostgreSQL больше читает или пишет?
Одна из причин, почему Postgres так популярен — это его универсальность и гибкость. Мало того, что он прекрасно встроится почти в любой проект, так еще и можно оптимизировать и докрутить под свои запросы, чтобы поднять и без того высокую производительность.

Как именно его оптимизировать и докручивать, зависит от совокупности факторов, среди которых — то, каким операциям отдается приоритет: чтению или записи.

💬 Социальные сети, новостные сайты, интернет-магазины, в общем, все, где люди больше листают, чем что-то активно делают — это проекты, где больше приходится читать. Финансовые приложения, системы, которые отслеживают какие-то события на сайте или собирают данные для аналитики — это больше про постоянную запись новой информации в базу. А еще есть смешанные варианты, например, мессенджеры или CRM-системы, где пользователь и запрашивает данные, и вносит их сам со сравнимой частотой.

Операции чтения и записи «стоят» неодинаково — вторые дороже, сложнее и дольше. Следовательно, если оптимизировать PostgreSQL под свой проект, то это надо учитывать.
🔵Так, там, где больше чтения, принципиальна скорость, чтобы обеспечить пользователю максимально быстрый доступ к информации, которую он ищет. А это оптимизация индексов, кэширования и «тяжелых» SQLзапросов.
🔵А там, где нужно больше делать новые записи, важнее обеспечить вычислительные мощности, быстрое хранилище и большой объем оперативки, а еще не злоупотреблять индексами.

Нашли для вас полезную инструкцию, как разобраться, к какой категории относится ваш проект, и что еще можно сделать с вашим Postgres, чтобы он работал быстрее.

Читать полностью…

LEFT JOIN

Сделай сам: БД ключ-значение своими руками
База данных нужна, чтобы было куда удобно и компактно сложить данные, а потом — чтобы было где быстро и легко их найти.

Звучит логично, но на практике добиться удобства, компактности, быстроты и легкости не так уж и просто.

🔵Как вносить новые данные в файл?
🔵Как изменять или удалять старые?
🔵Как сэкономить место на диске и не дать базе разрастись до неразумных размеров?
🔵Как ускорить поиск, особенно когда количество записей растет?

Как только находите ответ на один вопрос, тут же появляются новые. Это хорошо видно на примере статьи про создание БД с нуля: автор начинает с простого файлика с ключами и значениями и, постепенно дорабатывая его, доходит до создания LSM-дерева с индексами и сегментацией. И все это с интерактивным визуалом для наглядности.

Отличный материал для тех, кто хочет начать с азов, узнать, какие задачи встают перед создателями БД и как их можно решить.

Читать полностью…

LEFT JOIN

Как выглядит кошмар аналитика
В честь Хеллоуина решили обсудить с вами кое-что действительно жуткое — страшнее приведений или клоунов.

Плохой SQL. 👻

Потому что приведений не существует, а вот кривой код очень даже реален и иметь с ним дело приходится регулярно. Для затравки нашли для вас целую подборку примеров, среди которых:
🔵нагромождение CASE WHEN, создающее хаос, в котором может разобраться только автор кода (но это не точно),
🔵несколько уровней подзапросов, разобраться в которых не может даже сам автор,
🔵вьюхи поверх вьюх поверх других вьюх — сначала это может быть удобно и красиво, но со временем система рискует стать слишком непонятной, еще и создает нагрузку на базу,
🔵попытки «подчистить» результат запроса с помощью DISTINCT для того, которые прячут проблему вместо того, чтобы ее решать.

Встречались с чем-то подобным? Или даже видели что-нибудь похуже? Делитесь в комментариях! 👀

Читать полностью…

LEFT JOIN

Viz of the Day во всем многообразии
Tableau любит показывать возможности своего тула и самые крутые датавизы выставляет на всеобщее обозрение как Viz of the Day, чтобы все смотрели, впечатлялись и вдохновлялись. Эти визы дня бывают кардинально разные: про бизнес, экологию, социальные вопросы, поп-культуру. Визуально они тоже отличаются — от классических лаконичных дашбордов до дизайнерских интерактивных инфографик. Отследить какие-то закономерности в этом разнообразии раньше было не просто, но теперь эта задача стала попроще.

Амбассадор Tableau Хидеаки Ямамото собрал данные о 600 последних Viz of the Day и отобразил на инфографике. И вот на ней тренды уже видны:
🔵Большинство авторов Viz of the Day — из США и Англии, а большая часть работ — на английском языке. Есть только одно исключение на португальском.
🔵2 трети работ принадлежат людям, у которых в портфолио уже есть Viz of Day. У рекордсменки из Англии таких работ аж 11 штук.
🔵Самые популярные цвета — синий, голубой, белый и серый.

К сожалению, выделить конкретные темы по описаниям, которыми сопровождаются визы, сложно — в основном там на все лады повторяются слова «data», «viz», «explore» и так далее. Так что сказать, на какую тему надо сделать дашборд, чтобы повысить шансы засветиться в категории Viz of the Day, не получится. 😕

Читать полностью…
Subscribe to a channel