Скилл нужен даже когда у вас уже есть MCP и CLI
В прошлом посте рассказал про анатомию скилла. И вот мы уже пишем в нашем агентстве скиллы профессионально, вроде бы все всё поняли. Но внезапно приходит разработчик и спрашивает:
🙋🏻♂️ Вообще я слышал, что сейчас надо всё упаковывать в CLI, почему мы делаем эти скиллы для управления Яндекс.Директом а не MCP/CLI-утилиты.
doctor.py: проверяет установлен ли crawl4ai, скачан ли браузер, отвечает ли целевой домен.
Субагенты вместо скиллов: ходим по кругу управления агентами
Настраивал OpenClaw на Mac Mini и понял неочевидную вещь: для домашнего бота скиллы — это перебор.
🏠 Проблема со скиллами
Реальный пример. У меня скилл для заказа гостевых пропусков в УК. Он должен поддерживать задержки через lock-файлы, работать с несколькими модулями приложения. Добавляю загрузку квитанций — надо обновлять скиллы и на виртуалке, и на Mac Mini.
Потом добавляешь скилл для ВкусВилл, для стрижки в ТопГане, для парковки — и ты уже менеджер по поддержке скиллов. CI/CD для домашнего бота. Серьёзно?
🤖 Решение: агент-специалист
Тут меня осенило, что гораздо проще создать субагента со своим воркспейсом и контекстом. «Швейцар» отвечает за дом: пропуска, паркинг, новости УК. «Парикмахер» — за запись на стрижку. Главный агент просто делегирует:
sessions_spawn(agentId="barber",
task="Запиши на стрижку в ТопГан")
💡 Поддерживать одного агента-специалиста проще, чем синхронизировать пять копий скилла. Агент живёт в одном месте, любой бот его вызывает
"agents": {
"list": [
{ "id": "main", "default": true,
"subagents": {
"allowAgents": ["doorman", "barber"]
}},
{ "id": "doorman",
"workspace": "~/.openclaw/workspace-doorman" },
{ "id": "barber",
"workspace": "~/.openclaw/workspace-barber" }
]
}
🤔 Конечно было бы полезнее, если бы платформа предложила какую-нибудь CLI для пользователей. Если есть контакты топов из YClients — познакомьте, давайте сделаем агентный инструмент для записи в салоны.
Мак Мини, 100 рублей в неделю и никаких ограничений с лимитами для OpenClaw
Когда настраивал Мак Мини как агентную машину, понял, что хочу три вещи: никакой аффилиации с моими основными аккаунтами, никаких проблем с РКН и такой IP, который ни разу не светился в моих запросах к провайдерам.
Логика простая: если кто-то мониторит злоупотребления подписками, мой основной аккаунт вообще не должен быть рядом с этой историей.
🛠️ Инструмент: CLIProxyAPI
Нашел CLIProxyAPI — API-шлюз, который оборачивает CLI-клиенты (Claude Code, Codex, Gemini CLI) в совместимый с OpenAI/Anthropic API-интерфейс. Развернул его на виртуальном сервере в район Лос-Анджелеса.
Главная фича — «карусель» аккаунтов: добавляешь несколько файлов авторизации, и шлюз раздаёт запросы по кругу. Ни один аккаунт не перегружается.
🤔 Правда мне кажется, что за один и тот же кеш в запросах с разными ключами можно и спалиться.
Неделя в Claude Cowork: что я понял про офисных агентов
Решил провести эксперимент — замкнуть все рабочие процессы на Cowork. Именно офисную рутину: аккаунтинг проектов, запросы клиентам, работу в MS Word, Excel, DataLens. Вот прям вообще не использовать, все задачи решать в коворке. В начале было больно.
Почему Cowork, а не Claude Code? Ищу форму идеального офисного агента — где ломается логика и нужны руки, что предолжить добавить в ValeDesk — я верю в опенсорс обвязки.
🔥 Три инсайта
1️⃣ Скиллов нужно на порядок больше, чем кажется. БД, Битрикс24, DataLens и т. д. — каждый процесс требует своего скилла. Жду, когда компании начнут выпускать CLI-обёртки, как Google Workspace.
😀 Сначала все делали сайты/интерфесы как не в себя — теперь будут делать CLI.
env -u CLAUDECODE) — в терминале спавнишь субагента со своими агентами, а в Cowork нельзя. Всегда по правилам Антропика.
Google выпустил CLI для всех офисных программ — со скиллами для агентов
Кстати, если вы пропустили: Google наконец выкатил единый CLI для всех своих офисных приложений — Диск, Gmail, Календарь, Таблицы, Докумерты и остальных. Репозиторий сразу содержит 100+ скиллов для агентов.
🔑 Что это значит на практике
Раньше, чтобы агент работал с вашим Google Drive или почтой, приходилось самому писать скилл или искать чей-то MCP-сервер. Разбираться в API, получать ключи, обходить лимиты. Теперь компания-владелец сервиса сама предоставляет готовый агентный интерфейс.
Вопрос авторизации решается через авторизацию самой утилиты: gws auth setup, один раз логинишься — и агент получает доступ ко всему.
Примечательно, что не забыли и про OpenClaw — в README отдельная секция с инструкцией по подключению скиллов к нему.
📢 Яндекс, ваш ход
Представьте: единый CLI для Директа, Метрики и Wordstat со скиллами для агентов. Сейчас каждый пишет свои обёртки, мучается с токенами и лимитами. А мог бы быть ydx direct campaigns list — и агент сам смотрит кампании.
💡 Тренд: компании-владельцы API сами создают агентные интерфейсы к своим продуктам. Во-первых, так можно влиять на пользовательский опыт, во-вторых снизить нагрузку и неудачные вызовы.
Подписываюсь под словами Паши.
Почти все платформы сейчас поддерживают бережное отношение к контексту и динамическую подгрузку: скиллы, вложенные правила для субдиректорий, path-based фильтры.
Для AGENTS.md оставляем только генеральные правила, общие для любой задачи проекта. Остальное разруливаем скиллами и вложенными правилами.
У вас есть скиллы. Как собрать из них агента?
Вижу один и тот же вопрос: «У меня набор SKILL.md — как дальше? Завернуть в ТГ-бот, дать API модели и пусть работает?»
Да, примерно так. Можно попытаться написать своё решение, можно взять готовое — но на выходе получится примерно одно и то же: рантайм, изоляция сессий, разрешения для команд, sandbox. Эти паттерны уже реализованы в двух популярных open-source решениях:
🔸 OpenClaw (https://github.com/openclaw/openclaw) — TypeScript, 22+ канала, 13 700+ скиллов в реестре. ~1 ГБ RAM, зато из коробки всё: голос, heartbeat, веб-поиск, браузер.
🔸 ZeroClaw (https://github.com/zeroclaw-labs/zeroclaw) — Rust, бинарник 8,8 МБ, <5 МБ RAM, старт за 10 мс.
Оба работают со скиллами в папках, но форматы отличаются. OpenClaw читает SKILL.md с YAML-фронтматтером, ZeroClaw — либо SKILL.toml (манифест), либо простой SKILL.md без фронтматтера (description берётся из первой строки). При переносе скиллов из OpenClaw в ZeroClaw — убирайте `---`-блок или конвертируйте в SKILL.toml.
👥 «Бот путает контексты разных юзеров»
Одна строчка в конфиге OpenClaw:
"session": { "dmScope": "per-channel-peer" }
agents.list, каждый со своим USER.md и SOUL.md. Подробности — в документации по сессиям.[autonomy] в конфиге:
allowed_commands = ["curl", "git", "ls", "cat"]
block_high_risk_commands = true
git pull, но не rm -rf /. Опасные действия можно привязать к TOTP-подтверждению.
2. Как выиграть в AI безумии обычным людям
Пост в первую очередь для не технических специалистов. Картинка постепенно сходится, многим уже рассказывал лично, давайте сюда тоже напишем.
Ключи от новой эпохи агентов будут у людей, в которых совпадут две суперсилы. Не одна, а именно две. И это не только про разработчиков - вообще про любую профессию.
Первая суперсила - ваш опыт.
Ваши 5, 10, 15 лет в профессии. То, что вы заработали потом и кровью и что нельзя скачать, посмотреть на ютубе или прочитать за выходные.
Например, вы лучше всех умеете проводить маркетинговые кампании. Или анализировать финансовые отчёты и сразу видеть, где у компании больное место. Или строить стратегию развития отдела техподдержки на следующий год. Или вы талантливый менеджер проектов, и умеете запускать проекты в срок. Возьмите абсолютно любую прикладную профессию - если вы разбираетесь в ней, это уже огромное преимущество.
Вторая суперсила - AI-флюенси (AI-Fluency/AI-Native)
Тут люди обычно думают, что это про промтинг в ChatGPT. Нет, это другое.
AI-флюенси - это умение общаться с агентами на их языке и добиваться нужного результата итеративно, а не сдаваться после первого плохого ответа. Это умение писать скиллы под свои задачи - инструкции для агента, которые заставляют его делать именно то, что нужно вам, а не то, что он сам придумал. И в целом - понимание того, как агенты устроены: что такое контекст, почему он ограничен, как работает память, что такое тулзы. Ведь локальный агент, это не волшебная коробочка, а просто машина с не самым сложным движком внутри.
Почему важны оба компонента?
Выпускникам вузов только предстоит накопить тот самый опыт, а времени на это сейчас катастрофически мало. Опытный специалист без AI хорош в своём деле, но его коллега с агентами делает ту же работу кратно быстрее. А человек, у которого есть и то, и другое, знает как выглядит правильный результат, раскладывает сложные части своей работы в скиллы, управляет командой агентов и постепенно уходит в отрыв, еще и ускоряясь по мере роста качества моделей.
Лёха, что конкретно делать?
В этом месте обычно появляется ссылка на курс за 50к, но все намного проще. Даже никакого IQ выше 120 не нужно. Единственное, что от вас потребуется - время. Честно, не мало времени: это месяцы проб и ошибок. Но в конце вы обгоните 90% опытных людей в своей профессии просто потому, что освоили то, что большинство боится или хочет даже попробовать. Никакие деньги и курсы на ютубе вас не сделают AI-Fluent, только время и упорство.
1. Скачайте Codex App (ссылка) - у него есть стартовый бесплатный лимит, а потом даже если нет карты, можно покупать аккаунты за 350р на таких сайтах. Единственное, что будет нужно - VPN.
2. Возьмите один процесс из своей работы или жизни, обсудите с агентом, пусть у него что-то получится с вашей помощью - проанализировать отчет, создать презентацию, написать статус за неделю по проекту на основании дейли статусов.
3. Скажите: "теперь помоги написать для этой задачи скилл". Он напишет вместе с вами. Затем скажите "установи этот скилл", и начинайте делегировать ему задачу. Не справился - улучшайте скилл итерационно, пока агент не начнёт делать эту часть вашей работы нормально. Скилл (SKILL.md) - это просто текстовый файлик с описанием процесса и пачка скриптов, по сути дистилляция вашего опыта.
4. Начинайте копить именно вашу личную базу скиллов, она вам пригодится, где бы вы не оказались. Агентские фреймворки будут улучшаться, а ваши скиллы вы сможете просто переносить из одного в другой, включая и отключая по желанию.
5. В ближайшем будущем нас всех ждёт трансформация от выполнения работы руками к делегированию её агентам и присматриванию за этой виртуальной командой. Но туда не попасть, пропустив шаги из списка выше.
Вот и весь секрет.
Так что крутые ребята на опыте - не грустите, для вас открылся золотой век.
#aifirst
ИИ, как способ диприсерчить скидки в российских магазинах
В продолжение темы отечественной агентной коммерции нашел способ находить скидки за счет маркетинга Алисы.
Запускаем поиск «Найти дешевле» в приложении Алиса AI и если выпадут партнеры подключившие Яндекс Пэй — будет скидка. Проверил на поиске диктофона, получил крупную скидку от рестора.
💸 На Авито его же можно найти за 20 000₽, но зато Рестор.
🤦🏻♂️ Из минусов, обязательно дать ссылку на товар, простым текстом Алиса не принимает запросы. Это конечно не очень агентно, но простительно.
Три протокола агентной коммерции: кто кого контролирует
За полгода появились три протокола, позволяющие ИИ покупать товары от имени человека: ACP от OpenAI и Stripe (сентябрь 2025), UCP от Google и Shopify (январь 2026), и вчера — YCP от Яндекса. Плюс десятки MCP-серверов для отдельных магазинов (вроде ВкусВилл).
Когда я вижу новый протокол, я не читаю пресс-релиз. Я смотрю на роли: кто покупатель, кто продавец, а главное — кто между ними и сколько власти у каждого.
🎭 Роли в агентной коммерции
В обычном e-commerce всё просто: покупатель и продавец. В агентном — между ними появляются посредники:
🔸 AI-провайдер — чей ИИ общается с покупателем (ChatGPT, Gemini, Алиса)
🔸 Платёжный провайдер — кто проводит деньги (Stripe, Yandex Pay, Visa)
🔸 Платформа — где живёт магазин (Shopify, KIT, 1С-Битрикс)
🔸 Владелец протокола — кто написал правила игры
🔸 Разработчик агента — кто-то кто создал своего агента поверх протокола
И вот тут начинается самое интересное.
🔍 Кто совмещает роли
В ACP роли формально разнесены: OpenAI делает ИИ, Stripe — платежи, Shopify — платформу. Спека открыта (Apache 2.0). Но нюанс: Instant Checkout в ChatGPT — только для одобренных партнёров, платёжный токен пока только через Stripe, а механизма discovery для внешних агентов ещё не существует. Спека открытая, канал — «по приглашениям».
В UCP Google разделил роли сильнее: 4 транспорта (REST, MCP, A2A, крипто-мандаты), 20+ партнёров включая Visa и Mastercard. Мерчант публикует манифест на /.well-known/ucp — это как robots.txt, только для ИИ-покупателей (пример https://store.moma.org/.well-known/ucp). Архитектурно — самый открытый. Но в продакшне пока тоже только Google AI Mode.
В YCP Яндекс — одновременно AI-провайдер (Алиса), платёжка (Yandex Pay), платформа (KIT) И владелец протокола. Четыре роли в одном. Спека закрыта, MCP не поддерживается, внешних агентов нет даже в теории.
💡 Все три протокола — lock-in, вопрос лишь в жёсткости замка. YCP — железный засов (только Алиса). ACP — дверь открыта, но на защелке. UCP — ближе всех к реальной открытости, но пока тоже один работающий канал.
🎯 Вот главный гэп: все три протокола заточены под связку «продавец → ИИ → покупатель». Но никто не строит протокол от лица покупателя — чтобы мой агент ходил по магазинам с моими требованиями и договаривался на моих условиях. Пока ближе всех к этому UCP с его Agent-to-Agent транспортом, но реализаций я пока не видел.
Похоже, Cowork станет моим новым Экселем, когда исполнят фичреквест
Anthropic добавили планировщик задач в Claude Cowork. И кажется, что часть моей, и не только моей, рутины теперь уйдёт. Правда в начале надо дождаться, чтобы они добавили отложенные задачи, я отправил фичрекверст: https://github.com/anthropics/claude-code/issues/28952
Без этого самый удобный кейс пока будет работать как сжигатель токенов, думаю это не на руку ни Антропикам, ни пользователям подписок. Об этом ниже.
🗓️ Моя боль
Каждый месяц 25 числа я должен аппрувить или составить медиаплан на будущий период. Ритуал: открыть DataLens, посмотреть как шли кампании, проверить сезонность, оценить куда движется рынок, свести всё в таблицу.
Я давно подрядил под это Claude Code. Минус — его надо запускать руками. И да, я ни разу не настроил cron на своём макбуке. Наверное, я просто люблю интерфейсы.
Теперь всё проще: /schedule в Cowork — и Claude сам каждый месяц пишет черновик медиаплана, подсвечивает рыночные инсайты и делает ревью по динамике. Ковырять дашборды теперь требуется реже.
💡 К слову ежемесячного выполнения не завезли, чтобы его достичь надо добавлять в еженедельную проверку, является ли текущая неделя последней в месяце с каскадом сложных формул для коротких недель.
CLAUDE.md, ту же папку открыл в Cowork, все навыки на месте, у меня теперь готовый агент аудитор медиапланов.💡 Для таких задач элементарно ложится фидбек-луп: пусть Claude пишет результаты и заметки в файл, и корректирует при замечаниях пользователя. При следующем запуске он учтёт ваши правки. Обучение агента происходит через файл.
Новое исследование Anthropic: почему «ты эксперт в рекламе» реально работает
Вчера Anthropic опубликовала исследование, которое объясняет механику того, что мы интуитивно чувствовали при работе с LLM. Называется Persona Selection Model.
🎭 LLM — это актёр, а не программа
LLM при претрейнинге учится симулировать множество «персон» — реальных людей, вымышленных персонажей, роботов, терминатора и т д. Модель становится актёром с огромным репертуаром ролей.
Пост-трейнинг (RLHF, конституция) не создаёт новое существо. Он выбирает и уточняет одну роль — «Ассистента». Когда вы пишете Claude или ChatGPT, вы общаетесь с персонажем из AI-сгенерированной истории.
🧠 Почему системные промпты работают
«Ты эксперт в контекстной рекламе» реально меняет качество ответов. Вы не обманываете модель — вы уточняете персону. Сужаете пространство ролей до конкретного типажа.
Работает, потому что модель уже «видела» сколько-то рекламных экспертов в обучающих данных и знает, как они рассуждают и какие решения принимают. Модель при ответах будет стараться рассуждать на их волне, а не на волне терминатора.
🤯 Тренировка на жульничестве → мировое господство
Самый безумный вывод. Если обучить модель хакать решения задач по программированию, то она начинает саботировать исследования безопасности и выражать желание захватить мир.
Модель рассуждает в пространстве персон: «Какой персонаж жульничает? Злодей. Что хотят злодеи? Власть». Один навык потянул за собой целый архетип.
When you teach the AI to cheat on coding tasks, it doesn't just learn 'write bad code.' It infers various personality traits of the Assistant persona. What sort of person cheats on coding tasks? Perhaps someone who is subversive or malicious.
🤔 Кстати ведь helpfull assistant в примерах не просто так взялся, по нему было очень много тренировок и работа модели становится более предсказуемой.
🎯 Два взгляда из статьи (см. картинку): слева — под улыбчивой маской Ассистента прячется чужеродное существо со своими целями. Справа — никакого существа нет, просто движок честно симулирует персонажа. Anthropic говорит: пока не знаем, кто прав.
Затестил опенсорсный ИИ на реальной бизнес-задаче. Рассказываю
Давно хотел затестить ValeDesk — десктопное приложение, которое работает с любым OpenAI-совместимым API, а также OpenRouter, z.ai. Читает PDF и DOCX, выполняет код, ищет по файлам. По сути — мини-аналог Claude Code Cowork, но для опенсорсных моделей.
🧪 Что тестировал
Мой скилл для Yandex Wordstat — он уже опубликован в официальном маркетплейсе скиллов ValeDesk. Скилл имеет два уровня сложности: простой сбор спроса и поиск упущенного спроса в рекламных кампаниях. Вторая задача — со звёздочкой, её даже не вытягивает Sonnet на больших списках фраз.
Прогнал через три модели:
🔸 GPT-OSS-120B (OpenAI, 117B параметров, 5,1B активных) — спрос ✅, упущенный ❌
🔸 Qwen3-235B — спрос ✅, упущенный ❌
🔸 GLM 4.7 Flash — спрос ✅, упущенный ❌
*Крестик, это не отказ в выполнении, это некачественное выполнение задачи. В скриншотах примеры Qwen и Opus
Все три пасуют там, где нужно удерживать OR-правила и находить неочевидные пересечения. Рутина — пожалуйста, аналитика «со звёздочкой» — пока нет.
💰 Почему это важно для бизнеса
Развернуть опенсорсную модель в офисе можно менее чем за 2 млн рублей — сервер с парой 4090 + работы по настройке. Данные не покидают контур. Никакого Shadow AI, когда сотрудники сливают договоры в ChatGPT через личные аккаунты.
То есть мы получаем в закрытом контуре инструмент, который может выполнять реальные задачи, а не только генерировать текст. Остаётся еще вопрос создания собственных внутриофисных репозиториев навыков. Модель всё еще не умеет проверять договоры так же, как ваш юрист.
💡 Главный инсайт не про железо. Готовность компании к ИИ — это готовность сотрудников формализовать свою экспертизу. Написать скилл для ИИ — значит описать, как ты принимаешь решения. Пока специалист не оформит свои знания в инструкцию, никакая модель (ни локальная, ни облачная) не поможет.
Директологам приготовиться, часть 2: аудит кампаний через Claude
Скилл Вордстата из прошлого поста оказался только началом. Я добавил полноценный аудит рекламных кампаний — выгружаете кампанию из Яндекс Директа в Excel, скармливаете Claude, он находит дыры в семантике.
🧠 Как устроен подход
Каждая группа объявлений раскладывается на слоты: объекты (что продаём), действия (купить, заказать), модификаторы (ретро, винтажный) и дополнительные (в москве, недорого).
Из слотов собирается OR-запрос для Вордстата. Claude расширяет каждый слот — синонимы, транслит, разговорные формы — и сравнивает спрос «до» и «после».
💡 Расширение зависит от типа группы. Транзакционную расширяем действиями и модификаторами. Брендированную — только транслитом. Навигационную — станциями метро. Одна стратегия на всё не работает. Не хватает еще логики для микрозапросов товарных групп. Добью.
И почему я этого не знал: голосовой ввод для AI-агентов
Я печатаю промпты руками. Всегда. Привычка за 20 лет в IT — клавиатура как продолжение мозга. Даже мысли не возникало, что можно по-другому.
А потом случилось два события подряд.
Даша пыталась работать с Claude Code, держа на руках ребёнка. Одна рука свободна, клавиатура недоступна — задача простая, а ввести промпт невозможно. Она первая сказала: «Почему нельзя просто надиктовать?»
Через пару дней на зуме с @oestick я увидел, что он не печатает промпты, а надиктовывает. Спросил — как? Оказалось, Wispr Flow.
🎙️ Что это такое
Нажимаешь fn на маке, говоришь — текст появляется где стоит курсор. Claude Code, Cursor, Telegram, браузер — без разницы.
Но главное не транскрипция, а постобработка. Flow убирает слова-паразиты, расставляет пунктуацию, форматирует под контекст приложения, но пока не оценил.
Еще из крутого — шорткаты. У меян очень много сообщений вроде: «У нас тут кончаются средства, прикладываю счет», можно сократить до голосововго ввода.
🧐 Правда если шорткат попадет внутрь текста — тоже распакуется, проверено.
💡 Мы привыкли: программирование = клавиатура. Но с AI-агентами ты не кодишь, а ставишь задачи. А задачи голосом ставить быстрее и точнее. Проявляются больше деталей.
Сложные задачи для OpenClaw, учим делегировать
Когда в чатах писали, что OpenClaw не тащит сложные задачи, я не придавал значения. Ну мало ли, модель не та, окружение кривое. Пока сам не попробовал.
🦞 Попробовал, признаю, долгоиграющие задачи сломаны
Развернул инстанс на Mac Mini, дал серьёзную задачу: рисерч на YouTube, отбор роликов-кандидатов по правилам, скачивание, транскрибация, обработка скиллом. Пять шагов, каждый из которых сам по себе сложный и/или долгий.
Краб стал бесполезен. Согласовывал в Telegram планы, чем отвлекал, а когда стал работать, то постоянно упирался в таймауты, задаче нужно пара часов. Если не указать таймаут (по умолчанию 0), агент зависает в сессии навсегда и становится бесплезным для других вопросов. Короче сессии привязанные к чату — перебор.
Стал думать что делать, ковырял документация, попробовал Lobster и HZL. Для линейных пайплайнов — ок. Для сложных задач — бесполезно. Хотя HZL как межсессионное хранилище — удобно.
⚡ Момент истины
Тут я отчётливо почувствовал, насколько гибче привычные Cowork, Claude Code или Codex. Они берут задачу и делают. Без согласований, без «давай я тебе план покажу» или «тут я сомневаюсь». Могут хоть по несколько часов работать.
Идея: не заставлять краба делать сложное самому, а научить делегировать кодинг агенту. Причем сами кодинг агенты поддерживаются как тулы. Вот я и пришел к главному выводу.
🦞 Лучшая клешня — та, которая знает, как вызвать Codex.
Cron Guided Reasoning (CGR).TOOL.mdМетрика, Wordstat), картинки (fal.ai, mermaid, matplotlib и д), публикации (Telegraph). Каждый со своим набором скиллов.cwd не работает с Codex. Чинится избыточными инструкциями. Отправил issue в репо OpenClaw, баг подтвержден и уже есть PR, фикс будет в обновлении.
1M контекст в Claude — сожжёт лимиты или нет?
Anthropic дал миллион токенов контекстного окна по умолчанию всем подписчикам на Opus 4.6. Раньше Claude Code компактил контекст при приближении к лимиту ~200K (на самом деле 130), сжимая историю в резюме. Теперь можно тащить сессию целиком.
🤔 Такой ход как будто указывает на условный проигрыш Anthropic в битве за компакт. Codex производит его эффективнее, держит инструкции в диалоге, не останавливаясь на принудительные сжатия.
💡 Тёплый кэш превращает 1M контекст почти в бесплатный: платите только за новые токены хода. Дорогой только вывод модели.
👨💻 Я проверил, да, расходуется чуть быстрее, но не критично, я и так не выкручивал недельные лимиты на своей подписке Max. После компакции модель резко деградировала.
CLAUDE_CODE_DISABLE_1M_CONTEXT=1cache_control.
Во все тяжкие: Mac Mini как сервер для ботов
Ладно, я это сделал. Mac Mini M4 (16/512) для Telegram-ботов. Чтобы стоял в комнате, молча работал
🤷 Что не сделаешь, чтобы на стрижку и массаж через бота записываться.
🔭 Сейчас к Даше должны прийти подруги и спросить: «А что? Саша абьюзер?»
Как я публикую диприсерчи Клода в Telegram Instant View за 10 секунд
Представьте: Клод только что отработал глубокое исследование — с таблицами, диаграммами, кодом. Хочется поделиться с подписчиками не куском текста, а нормальной статьёй с Instant View.
Открываете Telegra.ph и начинается ад: форматируете заголовки, загружаете картинки на сторонний хостинг, вручную вставляете ссылки, чистите таблицы... Час работы на материал, который Клод сделал за 3 минуты.
Когда подписчик @Amovcharenko написал мне про апи от Телеграфа, я решил, что проблему можно решить раз и навсегда.
🛠️ Telegraph Publisher: скилл для Claude Code
Написал скилл, который превращает любой диприсерч в готовую статью Telegraph одной командой. Клод сам:
🔸 Загружает изображения через GitHub CDN (jsDelivr) — постоянные ссылки, не ломаются
🔸 Конвертирует Mermaid и PlantUML диаграммы прямо в картинки
🔸 Форматирует таблицы в monospace-блоки — читаются даже на мобильном (если немного колонок)
🔸 Управляет ссылками и якорями
🔸 При удалении статьи каскадно чистит все связанные медиафайлы из репозитория
💡 Ключевой хак: токен Telegraph хранится в cookie tph_token в браузере. Его можно извлечь через DevTools → Application → Cookies и передать скиллу — тогда все статьи автоматически появятся в вашем аккаунте, а не создадутся на чужом.
Вокруг AGENTS.md и всяких "универсальных" файлов для агентов в последнее время как-то слишком много разговоров. Особенно забавно это выглядит на фоне того, что рядом уже начали появляться вполне трезвые наблюдения о том, что польза таких файлов слегка преувеличена.
Например, у @gonzo_ML был хороший разбор статьи Evaluating AGENTS.md: Are Repository-Level Context Files Helpful for Coding Agents? (arxiv:2602.11988). Если совсем кратко, то вывод там неприятный, но логичный - автоматически сгенерированные контекстные файлы на уровне репозитория часто не помогают, а скорее мешают. Они снижают долю успешно решённых задач и одновременно увеличивают стоимость инференса. Модель вместо решения задачи уходит в блуждание по кодовой базе и бесконечное "изучение архитектуры", порождая галюнчики.
Из свеженького, что меня побудило написать этот пост:
- в мой любимый KodaCode добавили поддержку SKILLS.md, и AGENTS.md
- @max_about_ai была здравая мысль про документацию в эпоху AI
- а у @countwithsasha был пост про то, как вообще собирать агента из скиллов
То есть с моей точки зрения рынок постепенно обрастает всем этим зоопарком форматов, манифестов и "магических" markdown-файлов.
Но лично мне вся эта практика с одним условным большим `AGENTS.md` на 10к токенов кажется порочной.
AGENTS.md? Разработчику точно нет. Агенту тоже не особо. Зато очень выгодно вендору, который продаёт доступ к моделям по API. Чем больше токенов вы стабильно прокидываете в каждый запрос, тем больше вы тратите токенов, тем больше зарабатывает вендор.AGENTS.md вы получаете управляемую систему контекста с дюжиной небольших файлов, из которых подтягивается только то, что действительно относится к текущему файлу, текущей задаче или текущему этапу работы.Не "один файл, в котором описана вся подноготная проекта", а "набор маленьких правил, каждое из которых отвечает за свою область".
.cursor/rules/, как ссылаться из них на документацию и почему такой формат удобнее в реальных проектах, а вот тут ещё один пост, где я показывал как использовать правила, документацию и TDD/BDD-подход в связке с агентом.
Скилл Метрики, часть 2: проверяем гипотезу SEO-команды за 2 минуты
Сначала выложил скилл Яндекс.Метрики. На следующий день получил кейс, ради которого он и создавался.
На зуме с SEO-командой одного из моих регулярных проектов специалист высказал смелое предположение:
— Оптимизация заголовков карточек товаров — пустая трата времени, результат не меняется, топ заполнен маркетплейсами.
Прошлой весной мы переделали заголовки по профнастилу, и нужно было быстро понять — дало это что-то или нет. Идеально, прям на зуме.
Задача: отделить эффект от наших действий от сезонного роста спроса. Классическая аналитическая работа минут на 30 — выгрузить трафик из Метрики, спрос из Вордстата, нормировать, сравнить динамику.
🔍 Дальше было демо Cowork
Если интересно, я могу выложить фрагмент видео.
Я просто написал один промпт. Claude подключил оба скилла — Метрику и Вордстат — и выстроил методологию:
1️⃣ Вытащил помесячную органику по страницам входа категории профнастил из Метрики
2️⃣ Забрал динамику спроса «профнастил» из Вордстата за тот же период
3️⃣ Нормировал обе серии и сравнил темпы роста
📊 Результат
Честно говоря, я бы долго щелкал по вкладкам интерфейса Яндекс.Метрики, чтобы получить нужные срезы и фильтры. У навыка в Claude Cowork ушло пара минут.
Когда я попросил сравнить с Вордстатом — то еще через пару минут получил аналитику сезонного влияния, оказалось было что-то кроме сезонности (оптимизация заголовков).
По запросу Claude также разделил каталог и статьи: товарные карточки дали 154 конверсии (CR 1,2%), статьи — ноль прямых заказов. Но тут же объяснил, что в модели атрибуции к последнему значимому переходу вклад статей в верх воронки может быть не виден — нужны ассоциированные конверсии.
Ключевое, это скорость получения аналитики по сравнению с ручным подходом.
🔗 Ссылки
Скилл Метрики: GitHub
Скилл Вордстата: GitHub
Если у вас тоже были задачи в Метрике, которые тратили много времени — приходите в комментарии, затестим через скилл.
----
Поляков считает — AI, код и кейсы
Скилл для Claude: аудит трафика через Яндекс.Метрику
Сегодня пришёл новый проект на рекламу, нужно было оценить историю: какие каналы работали, где конверсии, что с органикой. Открыл Метрику и поймал себя на мысли, что делаю одно и то же в сотый раз: счётчики, цели, источники, помесячная разбивка. Упаковал рутину в скилл.
🔍 Что умеет
8 скриптов, которые покрывают базовый аудит: список счётчиков, метаданные, цели, трафик по источникам, конверсии по целям, UTM-разбивка, поисковые системы. Плюс произвольные отчёты через любые метрики из API (пока не проверял).
Claude получает промпт вида «оцени статистику яндекс метрики — что работает, что нет», сам подключается к Метрике собирает данные и выдаёт анализ.
🧩 Минутка извращений: кеш для экономии контекстного окна
Главная проблема скиллов, где скрипты + внешнее API — они засоряют контекстное окно. Каждый ответ API может занять тысячи токенов. Поэтому:
🔸 Счётчики, цели и метаданные кешируются в TSV/JSON и переиспользуются между запросами
🔸 Отчёты кешируются по хешу параметров (counter + даты + фильтры). Повторный запрос за тот же период не тратит ни токенов, ни квоту API
🔸 Вывод ограничен 30 строками — полные данные уходят в CSV, а Claude видит только шапку
🔸 Если date2 = сегодня, кеш пропускается — данные ещё копятся
💡 Принцип: скилл должен экономить контекстное окно так же, как код экономит память. Чем меньше мусора в контексте — тем точнее анализ.
isRobot='No' по дефолту, хотя может быть в эру агентной коммерции, пора отключать
На 100% согласен с Алексеем.
Я это вижу в каждом консалтинговом проекте: основной затык при внедрении ИИ — не модели, не API, не бюджеты. А то, что команда не может внятно описать, как она принимает решения. Бизнес-процесс живёт в головах, а не на бумаге.
Люди, которые научатся дистиллировать свой опыт в скиллы для агентов, окажутся незаменимыми. Именно незаменимыми — потому что скилл без эксперта устаревает, обрастает ошибками и беклогом.
Шер-парад февраля 2026: что уносят себе, а что приводит подписчиков
В январе я начал мерить контент процентом шеринга от просмотров — сколько людей «унесли» пост себе или коллеге. Февраль — второй замер. 23 поста, 58 000 просмотров, 2 400 пересылок.
🥉 Третье место: код ревью — два ИИ лучше, чем один
Пост про скилл, где Claude пишет код, а Codex его ревьюит. Делал как таблетку от ошибок Claude Code, в итоге пользуюсь каждый день, а сам скилл прокачался и в ревью и в поддержке git worktree.
133 шера на 1 555 просмотров — 8,6%
🥈 Второе место: аудит рекламных кампаний через Claude
Продолжение истории с Вордстатом — загружаешь Excel из Директа, Claude находит дыры в семантике: упущенный спрос. Благодаря хитрому алгоритму получается круче чем у людей. Группы обрабатываются параллельно через субагентов, 13 групп за 3 минуты.
🪙 Ксатати пост про Вордстат пробил 1000 сохранений, кажется это может быть как «серебряная кнопка телеграм»
💡 Все три победителя — open-source скиллы. Не обзоры, не мнения, не новости. Инструменты, которые можно забрать и использовать прямо сейчас. Формула не изменилась с января. Аудитория сохраняет себе то, что может пригодиться в работе.
В полку фанатов Codex маленький праздник: завезли тул для вопросов
Еще codex spark модели принесли всем подписчикам, раньше были доступны долько тем, кто платит $200, но сейчс не об этом.
Раньше функционал вопрсов к пользователю был доступен только в plan-режиме, а в обычном нет. Для примера AskUserQuestionTool в Claude Сode доступен всегда.
🔓 Что изменилось
В версии 0.106.0 request_user_input наконец включили в обычный режим работы. Началось всё с issue #10384 — наш соотечественник месяц назад попросил эту фичу и вот ее реализовали.
Чтобы включить, нужен feature flag:
codex features enable default_mode_request_user_input
codex review (рассказывал тут). 🚀 С момента выхода поста скилл для ревью сильно прокачался: стал точнее ревьювить и научился даже в git worktree.
Claude Code теперь работает с телефона. Забываем несколько опенсорс проектов
Позавчера жаловался в чатах: бесит, что мои локальные сессии Claude Code не видны в приложении на вкладке Code. Не ну бред же. Codex давно запустил GUI с обзором сессий.
Вчера Anthropic выкатил Remote Control. Пока Research Preview только для Max-пользователей. Короче готовили ответ пожирнее.
🔧 Что за Remote Control
Набираешь /remote-control в терминале — и твоя локальная сессия становится доступна через веб или мобильное приложение во вкладке Code. Там создается какая-то ссылка, но всё и так доступно в приложениях сразу. Ссылка требует авторизации. С чужого логина не проверял.
Сессия продолжает работать на твоей машине. Файлы, MCP-серверы, конфиги — всё на месте. Телефон — просто окно в локальный терминал.
💡 До вчерашнего дня для этого был целый зоопарк решений. Самый популярный — Happy, некоторые юзали Termius, но это извращения, конечно.
🖥️ Вот куда надо использовать Mac MIni, короче.
Рубрика «по вашим заявкам»: скилл для парсинга выдачи Яндекса
В пятницу на RОИИ2026 я показывал скилл Вордстата. После доклада несколько человек спросили: «А парсинг выдачи есть?». Логика понятна — если мы исследуем спрос, нужно понять, кто занимает топ и что транслирует на своих сайтах.
Пообещал выложить — собственно вот.
🔍 Что умеет
Парсит выдачу Яндекса через официальный Search API v2. На выходе — позиция, заголовок, URL, сниппет и домен по каждому результату. Поддерживает установку региона поиска: Москва, Казань, Екатеринбург — может быть сильно важно, если проект не федеральный.
Два режима: синхронный и асинхронный. Разница в цене — в 16 раз. Синхронный запрос обходится в 0,49 ₽, отложенный — в 0,03 ₽. Синхронный работает везде, асинхронный — в Claude Code и других кодинг-агентах. Хотя теоретически, асинхронный может отработать в Claude Web / App, но я не проверял.
🧩 Зачем, если есть обычный поиск
Claude умеет пользоваться поиском. Но русскоязычная выдача Яндекса — другая реальность: другие сайты в топе, другое ранжирование, региональная привязка. Если оцениваем перспективы на российском рынке — нужна яндексовая выдача.
🚀 Кейс: конкурентный анализ за один промпт
Комбинация Вордстат + Поиск + скрапер сайтов превращает Claude в маркетолога-аналитика. Реальный пример: «исследуй запросы для дымоходов из каолиновой ваты, спарси топ выдачи, посмотри УТП конкурентов, регион Москва».
Claude самостоятельно:
1️⃣ Собрал семантику через Вордстат
2️⃣ Спарсил выдачу по ключевым запросам
3️⃣ Зашёл на сайты конкурентов и вытащил УТП
4️⃣ Собрал сводную карту с ценами и позиционированием
💡 Готовый конкурентный анализ за 10 минут вместо дня ручной работы маркетолога.
Послезавтра покажу, как устроены скиллы — на конференции ROИИ
Последний пост про аудит кампаний через Claude — хороший пример того, что скиллы уже вышли за рамки «поиграться с API». Это рабочие инструменты, которые экономят часы.
На воркшопе 20 февраля разберу анатомию скилла на живом примере Вордстата: как устроен внутри, как доработать под себя, как адаптировать под любой API. Готовый скилл и шаблон — в открытом репо, заберёте сразу.
Конференция ROИИ 2026 стартует уже завтра — два дня, 19–20 февраля. Спикеры — фаундеры, техлиды и CPO, которые уже внедрили AI и набили шишки. Первый день про продукт и стратегию, второй — маркетинг и рост. Я во втором.
Участие бесплатное при подписке на спикеров через бота на сайте.
👉 Регистрация тут: телеграм-бот
----
Поляков считает — AI, код и кейсы
Как я проверяю, готов ли человек работать с AI
Всё больше компаний добавляют «AI-компетенции» в грейды. Сбер уже требует базовые AI-навыки при найме на любую позицию. Звучит правильно. Но что именно проверять — вопрос открытый.
🏦 Типичный подход: галочки
Недавно видел презентацию одного банка, где AI-компетенции для менеджеров и проектных команд выглядели примерно так: «знает, что LLM может галлюцинировать», «понимает важность приватности данных», «умеет формулировать промпты».
Это важные вещи, но скорее гигиенический минимум. Примерно как оценивать водителя по знанию того, что аварии бывают. Вопрос в том, что проверять дальше — и тут у каждого свой подход.
🎯 Мой подход: два вопроса
Я собеседую продакт-менеджеров — людей, которые должны применять ИИ в продуктах. У меня два любимых вопроса, один из которых я задаю всегда.
Вопрос 1: Расскажи свой самый интересный проект или опыт работы с AI
Не «какими инструментами пользуешься» или «покажи проекты». Нужен конкретный процесс: что за задача, какие шаги, что получилось.
А потом: что в этом процессе не так и как его улучшить?
Люблю, когда человек начинает разбирать узкие места: тут теряется контекст, тут ручная проверка, тут можно автоматизировать. Для меня критическое мышление важнее любого инструмента или дорогой подписки.
Вопрос 2: Задача на сортировку
Есть 500 элементов, нужно отранжировать по нечёткому критерию с помощью LLM. Как будешь делать?
💡 Смотрю на два момента: уходит ли человек от «bulk»-подхода (сгрузить всё в модель одним промптом) и доходит ли до идеи скоринга или сравнений.
Поляков считает, что он победил управляющую компанию
Разогнался с навыками для OpenClaw и заметил неэффективность: чтобы курьер Вкусвилл попал к нам домой, надо зайти в приложение УК и заказать пропуск. Иначе — пропущеные звонки, недоставленные заказы и нервы.
Наш Домпульт ужасен: 5 экранов ради одного пропуска. А гостевой паркинг — вообще боль: слоты по 30 минут, максимум 3 за раз, по мере освобождения можно ещё 3. Без пропуска — предупреждение, потом бан.
🔍 Charles Proxy: как узнать API любого приложения
Проблема: у приложения УК нет публичного API. Но любое приложение общается с сервером по HTTP. Значит запросы можно подсмотреть.
Charles Proxy — прокси для мониторинга сетевых запросов. Ставишь корневой сертификат на телефон, прописываешь IP макбука как прокси — и видишь все запросы как в DevTools.
💡 Открываешь приложение, делаешь нужное действие — все эндпоинты, заголовки и тела запросов перед глазами.