Игорь (@seeallochnaya) меня долго прожимал пользоваться X (x.com), за что я ему очень благодарен. Сейчас это один из главных источников знаний по стартап вопросам для меня
Вот краткое саммари, почему
P.S. Если не знаете, с чего начать, советую подписаться на фаундеров всех приложений, SaaS которыми вы пользуетесь
Непопулярная правда о нетворкинге
Самый крутой нетворкинг это не когда вы пришли на дорогое мероприятие.
Самый крутой нетворкинг — это когда вы поработали с человеком (т.е. он заплатил вам денег), и вы превзошли все его ожидания.
После такого он ещё пойдет и знакомым о вас расскажет.
А на нетворкинговые мероприятия ходят люди, которые только пытаются взять.
Те, кто пытаются отдать слишком заняты тем, что отдают. За хорошие деньги.
Виральные видосы как женский оргазм – стоит один раз нащупать позу, угол, темп и глубину – можешь один в один не отходя от кассы делать тоже самое и будет второй, третий, четвертый раз когда, *видос попадает в реки*
Число подписчиков почти не коррелирует с числом просмотров. ТикТок и Инстаграм буквально привыкают к тебе запоминают, какой аудитории тебя показывать, кто тебя любит смотреть, лайкать, комментировать, шерить друзьям
Если ты кардинально не меняешь формат (аналогично как при какой-нибудь твоей хуйне девушка может потерять настрой, сбиться с темпа), а ещё круче, воспроизводишь выигрышный сценарий с минорными модификациями, а ещё круче, в течение пару дней или недели – видос будет опять залетать: платформа всё лучше знает твою аудиторию, аудитория всё лучше знает, чего от тебя ждать
Если кое-какие звёзды сойдутся, удастся сделать killer-фичу после которой iOS приложение надо наконец обновлять до версии 2.0 😘
Читать полностью…Если вы хотите что-то понять в маркетинге, рекомендую посмотреть разбор своей утренней рутины от главного гения маркетинга 2025, Ashton Hall
https://youtu.be/ec2NkaG9mnA?si=X6p23oJMVZzEfLcK
Когда подписчик заметил что Вайб наконец-то научился делать отсылки к вашим локальным мемам, помнит факты о ней из ваших прошлых переписок
Попросил написать об этом отзыв так чтоб выглядело натурально, спонтанно, естественно…
Также отзыв:
Опыт с browser-use, Часть 1
Значит, решил я поскрапить данные с одного сайтика. Наконец под руку попался случай, когда computer-use мне может помочь заработать деньги, сэкономить время
Вообще, пропагандирую подход Andrey Karpathy "учиться по запросу": бросать себя в обстоятельства, где тебе кровь из носа нужно что-то умет, чтобы продвинуться дальше – тогда ты быстро разберёшься в новой теме, прям в боевых условиях. Натыкаться на что-то, что ты не знаешь и не умеешь, а оно уже надо – и это ультра быстрый способ как губка впитать новые знания, быстро набрать очки опыта
Ровно этой философией мы с Валерой Бабушкиным и с командой младших авторов однажды решили сделать формат обучения машинному обучению, отличный от классических курсов – Симулятор ML
Собственно, что я уже попробовал на тему computer use?
OpenAI Operator: https://operator.chatgpt.com/
Брать Pro-подписку за $200 в ChatGPT ради одного только Operator мне пока, честно, впадлу, поэтому этот вариант я сразу скипнул. Не настолько чувствую большая потребность в остальных фичах (сотне Deep Research запросов и o1 pro, прости Денис)
Browser-Use: https://browser-use.com/
YCombinator-backed стартап. Из прикольного - самая мемная переключалка между тёмной и светлой темой лендинга, которую я где-либо видел, рекомендую зайти заценить. У них даётся как сервис по подписке, так и self-hosted, я запустил self-hosted. По первому впечатлению, выглядит юзабельно
Какие полезные приёмы/уроки я нащупал:
- Вместо "сделай всё и сразу с 1 промпта" лучше декомпозировать на изолированные подшаги, некоторые из которых даже не требуют прыгать от страницы к странице
- Где можно обойтись без Agent-режима – лучше обойтись одним вызовом (где не надо гулять, а можно в явном виде прописать URL, спарсить страницу вручную через requests и прогнать через один LLM-вызов)
- Всегда давать референс пример ожидаемого формата
- Для простой обработки HTML-страницы Gemini 2.5-flash здесь больше всех радует с точки зрения внимательности к деталям и скорости. Для LLM в качестве агента мне понравилась GPT-4.1-mini. В browser-use можно выбрать довольно широкий спектр моделей
- Задавать max_steps небольшим (5-10-20), особенно на стадии дебага; валидировать/отлаживать работу на маленьком кусочке (примерно как когда заводишь deep learning трейн луп, сделай так, чтобы у тебя обучение сходилось хотя бы на 1 батче или даже 1 сэмпле)
- Самый главный пункт: смотреть логи – что Agent думает на каждом этапе, что сохраняет в память, где застревает. Например, мне сначала показалось, что мой агент игнорировал JavaScript элементы, но заглянув в его "голову" понял, что он всю нужную информацию успешно подсасывал, а зацикливался уже на финальном шаге при формировании ответа... видимо SO (Structured Output) для browser use ещё не такой стабильный, как хотелось бы
Мой промежуточный вердикт: пока технологии сырые... да, агенты, да, можно довести до рабочего состояния, но пока медленно, требует много экспериментов, отладки. если игра стоит свеч - почему нет
Ваш @bogdanisssimo
#browser_use
Что я могу сказать,
Hard Paywall – мой бро
Soft Paywall – не бро
Ситхи победили
#OCRBench LLM-as-a-Judge: Error Analysis & Checklist
В книге Валеры и Арсения по ML System Design мы писали главу Error Analysis, по мотивам которой была написана моя статья на Хабре "Почему анализ ошибок – это начало разработки ML системы, а не её конец", а также создана одноимённая задача в Симуляторе DS
Когда у нас появляется какой либо способ оценки – кросс-валидация, offline эксперименты, LLM бенчмарк – мы получаем возможность закапываться в ошибки. Где пользователь не делает целевое действие? Где самое сильное расхождение с правильным ответом?
В главе книги мы описывали с каких сторон можно подходить к анализу ошибок, например, можно глазками смотреть на best cases, worst cases – искать, что в них общего, какие паттерны. Также можно мануально выделять группы/кластеры и смотреть перфоманс на ней
Сейчас у нас есть LLM, поэтому вместо рутинной мануальной работы:
1. Можно кидать целые логи / датасеты (с разбором ошибок от LLM-судьи с предыдущего этапа) – в LLM, и просить кластеризовать типовые проблемы
2. Затем можно под каждую из них завести бинарный флаг "есть / нету" и включить это как чеклист ответа LLM-судьи. Для судьи я использую модель от OpenAI где SO (structured output) работает стабильно, поэтому проблем с парсингом ответа несмотря на преумножение числа полей - не возникает
3. В конце прогона агрегируем по каждой модели и получаем "след" её проблем на нашей задаче
Иметь подобную декомпозицию проблем модели и пайплайна сильно полезнее, чем иметь одно агрегированное число "вот такая-то точность". Какие-то из проблем будут критичными, какие-то менее важны, но по крайней мере у тебя появляется четкая картина характера ошибок и теперь понятно, в «какую сторону» исправлять систему
По сути как взять градиент по бенчмарку и делать back propagation 🤓
Ваш @bogdanisssimo
Завтра проходит онлайн-конференция karpov.cоnf от karpov.courses о том, как выстраивать data-driven культуру в компании. Конференция будет полезна как владельцам бизнеса и менеджерам – так и дата аналитикам, дата инженерам, ML инженерам (которым важно в правильный момент сказать на идею руководителя "нет")
Скажем, не всегда осмысленно с точки зрения времени и денег заводить ML-сервисы в компании, где ещё не выстроена data-driven культура и не настроена базовая аналитика, пайплайны данных и у бизнеса нет понимания как проводить A/B тесты и как превращать данные в деньги
(у меня самого в карьере был подобный опыт, думаю, заслуживает отдельного поста)
Регистрироваться здесь: /channel/KarpovCourses/2108
Вопрос от подписчика:
Кстати расскажешь как-нибудь какими тулзами аналитическими пользуешься?
Теория ограничений (теория узких мест) – это примерно тоже самое, что делать back propagation но в масштабах всего бизнеса. Вместо слоёв у тебя этапы воронки:
/channel/bogdanisssimo/1026
Вместо нейронов – компоненты продукта и маркетингового пайплайна (этапы воронки), вместо синапсов - конверсии. На каждом цикле оптимизации ты делаешь оценку в каком направлении что нужно поменять, чтобы больше максимизировать чистую прибыль / LTV:CAC или другую метрику
Как и в deep learning, ты можешь делать как forward pass и backward pass
Например, деньги и юнит-экономика – мы можем "отнормировать" на любом этапе: ты знаешь сколько денег тратишь - можешь оценить CPM (cost per mile, цена за 1000 просмотров) → CPI (cost per install) → CPT (cost per trial) → CAC (customer acquisiton cost, стоимость привлечения 1 платящего пользователя)
Так и, в обратную сторону, backward pass: LTV (Customer LifeTime Value) ← Trial LTV (сколько чистой прибыли принесёт 1 триал) ← Install LTV (сколько денег принесёт 1 инсталл) ← RPM/PPM (revenue per mile / profit per mile, выручка/прибыль на 1000 просмотров)
В случае если канал привлечения один – соотношения (например Install LTV : CPI, LTV : CAC, RPM : CPM) не поменяются. Если несколько каналов (например разбивка по гео) или несколько продуктов (например iOS vs Android) здесь уже начинают размазываться – и можно принимать решение, куда перенаправить усилия, ресурсы
Там вышел ремейк игра моего детства (жаль не Morrowind)
https://www.youtube.com/watch?v=mZKRIqccMvA
В комментах сделал пару наблюдений
Самое крутое, что фреймворк теории ограничений применим ко всему, даже к дизайну, к UI/UX
Дизайн это не просто красивая обёртка и визуальная эстетика
Дизайн – это, с одной стороны, удобство, скорость, комфорт, интуитивность (UX)
С другой, это про доверие и надежность, про коммуникацию стоимости и твоего отношения к пользователю (UI), что о тебе нужно знать до того как с тобой познакомились
—
По сути ты проектируешь опыт, который будут проживать или уже проживают тысячи человек, их цепочку действий, цепочку ассоциаций и эмоций в голове, их мини привычки
И каждая цепочка – точно такая же воронка со своими конверсиями, узкими местами, которые можно и нужно оптимизировать чтобы быстрее и проще давать value каждому пользователю
P.S. Картинка из статьи Behavioral Funnels: https://medium.com/behavior-design-hub/behavioral-funnels-models-to-find-the-shortest-path-from-user-to-value-behavioral-design-models-45f338e9e372
Да, охуенно, батут работает, скоро в Vibe будет кардинально новый UX 🤩🤩🤩
Читать полностью…Меня зовут Богдан, мы делаем по 2,000,000+ просмотров в неделю и я всё ещё не понимаю как работает маркетинг
Но чувствую вот-вот разберусь и наконец получу моральное право делиться опытом 😂
Vibe pricing be like...
Провели ревью метрик по последним неделям с o3, посоветовал мне поднять цены в 1.5 раза 😘
Все, кто хотел но откладывал оживить свою личную жизнь и наконец научиться переписываться – до завтра есть возможность взять подписку по старой цене, при продлениях будет сохраняться текущая стоимость: https://apps.apple.com/app/vibe-ai/id6553989941
Бизнес это win-win: когда у тебя белая полоса, ты зарабатываешь деньги, когда черная полоса ты покупаешь (временем и деньгами) опыт, ты учишься, становишься мудрее
Самое главное сделать цену ошибок низкой - и затем ошибаться как можно больше
P.S. Кстати кто в найме - цените время пока вы в найме, ведь там ошибки оплачиваются не из вашего кармана
#разбор_полётов
Подписчик скинул библиотеку/сервис для browser use
https://www.stagehand.dev/
В ихнем эвале gpt-4.1-mini тоже немного выше gpt-4.1… получается мой #OCRBench не врёт что mini вдруг точнее в image understanding?
Услышал, что у Сэма Альтмана есть эссе про продуктивность, которое называется "Продуктивность", заглянул почитать
https://blog.samaltman.com/productivity
Теперь всех, кто меня спрашивает за продуктивность, буду просто отправлять сюда
MRR для iOS приложения вырос на 65% за 30 дней
Буду думать как за май вырасти на 650%. Вижу несколько низковисящих плодов
Скачать: https://onelink.to/get-vibe
Как подключу o3 к MCP всех аналитических тулзов, можно уже и не работать 🤣
Читать полностью…Чуть освежил onboarding screen
Уже в AppStore: onelink.to/get-vibe