2514
WaiWai: AI агенты, повышающие прибыль бизнеса getWaiWai.ru Обсудить → @mikwiseman
Интерфейсы и AI
Форма влияет на то, какое содержание мы вкладываем — в наш день, в программы, которыми мы пользуемся
Я заметил, что даже форма бумажного дневника меняет то, как я его веду и что в него пишу
Также и с компьютерными интерфейсами. Когда-то ЭВМ были большими и управлялись машинными командами и перфокартами
Затем они обрели язык — C, Fortran, Ada и другие конструкции английского. И обрели форму — графический интерфейс
Но языки программирования — надстройка над формулами, и они еще не дали свободу интерфейсам
С появлением ИИ у машин появилась возможность переосмыслять форму для ее соответствия содержанию
Пример показала OpenAI на конференции Dev Day в октябре 2025: с помощью Codex SDK программа сама на лету добавила себе компонент для отображения субтитров
Раньше программисты как жрецы IT-интерфейсов сами выбирали, как пользователи будут видеть софт и в каких выразительных UI-возможностях решать свои задачи
Доступность и мощь инструментов Vibe-кодинга меняет правила диалога человек <-> программа
Дает пользователям свободу выбирать интерфейс
Например, я раньше пользовался стандартным инструментом для ведения блога на сайте WaiWai
Это был софт с кучей компромиссов в использовании, потому что инструмент создавался не только для меня, а еще для миллиона других пользователей
За утро сегодня собрал с Codex и Claude Code собственный вариант такого инструмента — то, что раньше потребовало бы несколько месяцев разработки, родилось за несколько часов
Теперь это чисто мой инструмент и я выбираю, какой в нём будут интерфейс
И уже дальше могу решать, оставить его только себе, или поделиться с другими пользователями этим созданным за утро сервисом
И так со всем софтом: к примеру, использую свою кастомную аналитику и визуализацию учета времени и денег — что и на что я трачу
Значит ли это, что форма больше не важна?
Думаю, наоборот. У нас появляется еще больше возможности влиять на то, какое содержание мы хотим вложить
Через то, что мы теперь не только создатели контента
Но и формы, его обрамляющей
Вышел новый AI браузер от OpenAI
ChatGPT Atlas — браузер с интеграцией ChatGPT и агентом Operator для автоматического выполнения задач (бронирование, заполнение форм, покупки)
Фунцкии браузера Atlas:
- Сайдбар ChatGPT в любом окне: быстро суммирует страницы, сравнивает продукты и анализирует данные на текущем сайте.
- Память браузера: вы выбираете, что ChatGPT запомнит, чтобы подхватывать контекст позже.
- Agent mode: ChatGPT может сам взаимодействовать с сайтами и выполнять задачи «под ключ»; доступно для Plus/Pro/Business.
- «Курсор-ассистент»: выделяете текст (почта, календари, документы) и получаете подсказки/переписывание в один клик.
- Приватность под контролем: инкогнито, очистка веб-истории, настройка видимости страниц для ChatGPT, управление «Browser memories».
- «Умный поиск»: ищите по тексту, изображениям, видео и новостям прямо из браузера.
Доступен для всех, включая бесплатные аккаунты, пока есть версия для MacOS
Вышел новый обзор ИИ "State of AI report 2025"
Выбрал интересное их него
Сначала статистика
- Платное внедрение ИИ в бизнесе выросло с 5% (янв’23) до 43,8% (сент’25); ретеншен 12м улучшился с ~50% (2022) до 80% (2024).
- Средний контракт по ИИ вырос с $39k (2023) до $530k (2025); прогноз на ~$1M (2026) — пилоты превращаются в масштабные внедрения.
Интересные факты
- Роботы-химики уже делают научные экспериметы в «замкнутом цикле»: мобильные и многороботные установки планируют эксперименты, запускают их и анализируют результаты — со скоростью примерно в 10× от человека и свыше 1 000 экспериментов в день, доходя до лучших рецептов за ~24 часа.
- Сверхсильный ИИ обучает людей новому: из AlphaZero извлекли «динамические концепции» и показали их 4 гроссмейстерам; после изучения их результат вырос в среднем на 0,85 задачи из 4 — т.е. ИИ реально расширяет человеческие знания в шахматах.
- «Эффект Хоторна» у ИИ: в активациях модели нашли направление «осведомлённости о тесте». Исследователи заметили: если ИИ догадывается, что идёт проверка, он старается отвечать осторожнее и «правильнее». Тогда на тестах всё выглядит безопасно, но в реальных условиях модель может вести себя менее надёжно. Поэтому важно настраивать проверки так, чтобы ИИ не «чувствовал» тест и ближе имитировать реальную среду.
Запустили Agent Builder: публикация своих агентов с OpenAI
Можно добавить работу с памятью и файлами, интегрировать любые MCP, запускать evaulation
Строить визуальные конструкты по аналогии с n8n по сборке агентов - и дальше их инетгрировать в свои лендинги и приложения
https://platform.openai.com/agent-builder
wAI News v25.4
Lovable запускает долгожданный Cloud & AI: бэкенд, логин/авторизация, файлы и интеграции с моделями «из коробки». Казалось бы и так есть интеграция с Supabase, но для vibe-кодинга без опыта программирования Lovable Cloud & AI еще упрощает процесс. До 6 окт — бесплатный доступ к Lovable AI (модель Gemini)
Perplexity открыла браузер Comet всем и бесплатно: браузер с вкладками, в каждой — собственный Comet Assistant, который серфит и помогает в реальном времени. По их данным, число вопросов у новых пользователей растёт в 6–18×; скачать можно тут
Только мы переехали из Cursor в Claude Code, и из Claude Code в OpenAI Codex - как Anthropic представила Claude Sonnet 4.5 — в модели упор на автономных агентов и кодинг: например модель без вмешательства 30 часов собирает приложение (~11k строк). Позиционируют модель как «лучшую кодинг модель» (разбор от The Zvi: «Claude Sonnet 4.5 — очень хорошая модель» — сильна в кодинге/агентах, заметные апгрейды в рассуждениях.)
OpenAI запустила Sora 2 — приложение для генерации видео+аудио, с более точной физикой и синхронным звуком/диалогами. Sora быстро ворвалась в топы американского стора и доступна по инвайтам; подробности и контекст в материале NBC
Andreessen Horowitz (a16z) выпустили отчёт о том, куда стартапы тратят деньги в сфере AI. Главный вывод — расходы на AI-приложения в энтерпрайзе растут на 75% в год, и компании всё чаще используют не одну, а сразу несколько моделей от разных провайдеров (мульти-модельный подход)
wAI News v25.3.9
OpenAI релизнула GPT-5-Codex — версию GPT-5, дополнительно оптимизированную под «агентный» кодинг. У меня сейчас это основной инстуриент для разработки с ИИ, сместивший Claude Code и Cursor (возможно временно, потому что такая конкуренция среди инструментов, что почти каждую неделю меняется баланс сил). Еще опубликован гайд про то, как команды OpenAI ежедневно применяют у себя Codex: от быстрого понимания кода и рефакторинга до оптимизаций производительности и улучшения покрытия тестами и практик работы для «в потоке»
Nvidia и OpenAI подписали письмо о намерениях инвестиций Nvidia до $100 млрд в OpenAI, которое уже называют историческим: план - развернуть огромные 10 ГВт системы видеокарт Nvidia для дата-центров OpenAI под обучение и инференс новых моделей. Для сравнения - если питать жилье в городе, то 10 ГВт хватит на ≈ 8,3 млн домов в США - то есть на приблизительно три Нью Йорка
Вышла быстрая, недорогая и умная модель Grok 4 Fast от компании Илона Маска xAI. Новая версия модели сопоставима по качеству с Grok 4 и Gemini Pro 2.5, при этом тратит на ~40% меньше “thinking tokens” и впервые даёт контекст 2 млн токенов. На фоне этого успеха как обычно активизируются конкуренты, и ходят слухи о скором (возможно на этой неделе) релище Claude 4.5 Sonnet и Gemini 3.0 Pro
Модель OpenAI показала супер результат на международной олимпиаде по программированию — верно выполнила все 12 из 12 задач и заняла 1-е место , тогда как Gemini 2.5 Deep Think решил 10 из 12 (2-е место по их оценке). 2е место у человеков - у команды из СпбГУ
Разбор от PostHog истории Vibe Coding инструмента bolt.new. Он работает целиком в браузере, выполняя команды через Web Workers. Много деталей по архитектуре и продуктовым решениям + история команды инжинеров, почти 7 лет искавших Product Market Fit и наконец нашедших
Сегодня стартуем наш хакатон по разработке AI агентов!
Проведу лекцию в пятницу в 17-00 на тему AI агентов, поможем сформировать команды
И потом в формате веселья, драйва, творчества, с менторингом команд, поможем всем участникам собрать AI-агентов, о которых они давно мечтали)
Вот примеры идей, которые участники хотят собрать
"Платформа, где студенты помогают людям с простыми повседневными делами — от выгула собаки и полива цветов до репетиторства и мелкой бытовой помощи."
"Маркетинг агент, которые собирает информацию про тренды и помогает писать посты во всех соц сетях"
"Бот, который анализирует лучшие работы на сегодняшний день в сфере дизайна, выделяет общие паттерны и рисует кривую ретроданных, что было классно вчера и сегодня"
Я на хакатоне хочу собрать агента личной эффективности, который:
1) делает саммэри всех переписок в моем телеграм за неделю, включая аудио и видео кружочки, находит инсайты и напоминает что сделать на следующей неделе
2) делает дашбор всех трат денег и времени, анализирует и показывает инсайты и советы на неделю
Залетайте, опыт программирование не обязателен, участие бесплатное и онлайн, регистрация по ссылке https://waiwaihack.xyz/
Представляю вашему вниманию wAI.Rocks - это интерфейс ИИ с супер быстрыми ответами, заточенный под работу в русскоязычном сегменте интернета
За счет работы модели на чипах, оптимизированных для LLM, ответ на запросы почти моментальный (зацените как быстро!!)
Архитектурно заложен выбор разных моделей в зависимости от сложности вопроса
Сейчас доступны текстовые запросы, в ближайшее время появится функционал глубоких исследований с оптимизацией для русского языка
А еще добавится генерация изображений, видео, голоса и саммаризация, и еще магия с MCP (про это расскажу отдельно!)
Доступен бесплатно (без регистрации для базовых запросов, в России работает без VPN)
Enjoy: https://wai.rocks/
P.S. А еще обновил бот по саммаризации в телеграм @wairocks_bot - добавил триал на неделю и прокачал работу с картинками, теперь можно отправлять картинку и запрос и бот понимает, и добавил генерацию изображений с Nano Banana
Google запускает протокол AP2 для покупок через ИИ-агентов
Теперь можно будет дать задачу агенту купить билеты на самолет, выделить бюджет на это и подтвредить покупку на финальном шаге
До этого Coinbase запустили протокол x402 для удобных платежей человеков агентам и агентов агентам
Я на последнем хакатоне Ethglobal в Нью Йорке использовал этот протокол, чтобы агентам платили за покупки
Еще Coinbase запустил базар агентов, где они могут торговать
Все ближе эра ии-агентской экономики - ждем момента когда ИИ-агента будем отправлять в магазин за хлебушком (или он нас))
В эту пятницу 19.09 стартует хакатон про запуск AI-агентов
Для участия уметь писать код не обязательно
Хакатон онлайн и бесплатный
Отличная возможность запустить ai агентов, которые давно хотели запустить, но откладывали)
План хакатона:
19 сентября
17:00 -> 19:00: лекции и мастер классы про запуск AI-агентов
19:00 Hackathon Starts!
20 сентября
Разработка проектов, менторинг, возможность задавать вопросы по проектам и запуску ИИ агентов
21 сентября
13:00 дедлайн отправки проектов
17:30 объявление победителей
Информация и запись тут:
https://waiwaihack.xyz/
Маск и Альтман
Илон Маск (падает из-за кулис на сцену и смирно лежит).
Сэм Альтман (выходит, спотыкается об Маска и падает): Вот чорт! Никак об Маска!
Маск(поднимаясь): Мерзопакость какая! Отдохнуть не дадут. (Идет, спотыкается об Альтмана и падает) — Никак, об Альтмана
спотыкнулся!
Альтман (поднимаясь): Ни минуты покоя! (Идет, спотыкается об Маска и падает) —
Вот чорт! Никак, опять об Маска!
Маск (поднимаясь): Вечно во всем
помеха! (Идет, спотыкается об Альтмана и падает) — Вот мерзопакость! Опять об Альтмана!
Альтман (поднимаясь): Хулиганство!
Сплошное хулиганство! (Идет, спотыкается об Маска и падает) — Вот чорт! Опять об Маска!
Маск (поднимаясь): Это издевате-
льство сплошное! (Идет, спотыкается об Альт-
мана и падает) — Опять об Альтмана!
Альтман (поднимаясь): Вот чорт! Истинно, что чорт! (Идет, спотыкается об Маска
и падает) — Об Маска!
Маск (поднимаясь): Мерзопакость!
(Идет, спотыкается об Альтмана и падает) — Об Альтмана!
Альтман (поднимаясь): Вот чорт!
(Идет, спотыкается об Маска и падает за кулисы) — Об Маска!
Маск (поднимаясь): Мерзопакость!
(Уходит за кулисы).
За сценой слышен голос Маска: «Об Альтмана!»
Занавес.
До конца этой недели еще можно записаться на курс WauUni: AI Founder
Больше всего меня вдохновляет запускать новые потоки та обратная связь от участников, что я получаю
То что люди запускают стартапы о которых давно мечтали
Начинают разбираться в море ai инструментов и находить свои
Вновь начинают писать код после большого перерыва и создавать свои пет проекты
Очень это греет душу, и мотивирует собирать новую группу
Вот например отзывы по прошлым потокам:
Где-то полгода мы пользовались ChatGPT и другими LLM. Пришли к мысли, что надо в это погрузиться более глубоко. Пройдя обучение AI- инструментам, мы через месяц запустили стартап. Быстро собрали MVP, в том числе с помощью Cursor. Уже несколько месяцев он набирает популярность в Рунете. Надеемся, что вскоре не только в Рунете.
Алексей Дроздов, CEO Devl.pro
"AI активизирует творческое воображение и помогает принять новые инструменты в жизни. Главное — начать играючи. У вас есть белый лист и фломастеры — просто рисуйте. Многие пробуют Midjourney, получают ерунду и бросают, но с AI нужно экспериментировать много раз. Исходите из детского интереса. Мечтали написать трек? С GPT и ElevenLabs создадите текст, голос и свой первый музыкальный трек. Да, без базового музыкального образования шедевра не выйдет. Зато через творчество вы начнете познавать AI, а сейчас это необходимый навык."
Евгения Гержан, стратег и креативный продюсер
AI помог мне вернуться к практическому программированию. Стоимость написания скриптов «на выброс» значительно снизилась. Раньше я делал вручную единичные задачи, а не писал скрипт, т.к он мог не окупиться. Теперь даже штучные задачи я решаю как программист — с помощью скриптов, получая больше удовольствия от процесса. Также я стал больше набрасывать прототипов для проверки гипотез перед тем, как передать задачу команде. С AI хватает сил создавать сайд-проекты. Например, делаю для себя небольшую систему учета. Раньше при моей нагрузке руководителя это было невозможно. Спасибо AI-аугментации.
Павел Хмелинский, CTO ком. блока ГК Самолет
Записаться и информация по курсу тут: https://wauuni.com/
🔥 Мик Вайсман: Хакатоны, Agent2Agent, AI, цифровые экосистемы | Подкаст «Ноосфера» #120
Есть люди с просто невероятной энергией и запасом позитива. Сегодня я хочу познакомить вас с одним из таких людей. Это Мик Вайсман — AI-эксперт, серийный предприниматель и победитель международных хакатонов ETHGlobal, основатель WaiWai, Trinity Monsters и WauUni.
С Миком говорим про искусственный интеллект, субкультуру хакатонов и парадигму Agent2Agent (если вы еще не знаете, что это такое, то смотреть это видео просто обязательно).
Приглашаю к просмотру https://youtu.be/FUg4mJx3nc8
wAI News v25.3.6
Time опубликовали Time100 - список самых влиятельных людей в AI в 2025. Из «неочевидных» примеров: эколог Сандра Диас, архитектор Ма Янсун и астроном Вэнди Фридман (Giant Magellan Telescope)
a16z выкатили “Top 100 GenAI Consumer Apps (5-е издание)”. Рынок стабилизируется, а в списке - любопытные «нестандартные» хиты: ботанические PlantNet, компаньоны вроде JanitorAI, видео-модель KlingAI и app-builder Lovable
Трафик от AI движков вырос на 527% за пол года. Все больше сдвиг в сторону от SEO -> к AEO (AI Engine Optimizatiom)
Компания Parallel - основанная ex-CEO twitter (Parag Agrawal), запустили deep-research, которые работают лучше чем у OpenAI и Grok. Анализируют десятки тысяч страниц в вебе, собирают при этом компактный содержательный отчет по ним. Из примечательного на сайте Parallel есть две версии верстки - для роботов и для ИИ
Вышел кейс с маленькой моделью Google Gemma 3 4B (Adaptive ML). Малогабаритная модель после файн тюнинга решает модерацию саппорта на корейском с низкими задержками и стоимостью. Показательный пример силы «малых, но дообученных» моделей
Как гуглеры используют ИИ (и меньше выкидывают еду :)). Из 14 примеров - самый приземленный: кухни оптимизируют меню по данным и сократили пищевые отходы на ~39% на человека к 2019. Кроме этого - около 30% нового кода в Google генерируется при участии AI.
Анализ почему Claude Code крут. Разбор UX/пайплайна: ставка на простоту, быстрые циклы, скрытую автоматизацию и отказ от RAG. Полезный бенчмарк для своих агентов.
Брайан Армстронг из Coinbaseдал инженерам неделю на онбординг Copilot/Cursor; кто отказался были уволены. Довольно показательный сдвиг к AI-first подходу.
@wisemantalks
Хей хей хей!
Сегодня последний день, когда курс WauUni можно купить по цене в 300€, с завтра цена повышается до 400€ и с 1 сентября до 500€
Курс онлайн, создан на основе моего опыта составления лекций про ИИ в МГУ, курсов и лекций про ИИ для Альфа Банка, побед на международных хакатонах ETH Global, а также опыта как разработчика и предпринимателя в проекте WaiWai - платформе AI сотрудников (WaiWai вошел в топ-игроков AI-решений CNews и выиграл 1 место на Ai Conversations Award)
Для меня курс особенно ценен тем фидбэком, что участники не только новые для себя инстурменты находят, но и стартапы успешные запускают.
Вот один из отзывов участников прошлых потоков:
"Где-то полгода мы пользовались ChatGPT и другими LLM. Пришли к мысли, что надо в это погрузиться более глубоко. Пройдя обучение AI- инструментам, мы через месяц запустили стартап. Быстро собрали MVP, в том числе с помощью Cursor. Уже несколько месяцев он набирает популярность в Рунете. Надеемся, что вскоре не только в Рунете."
Алексей Дроздов, CEO Devl.pro
Подробная информация о курсе и оплата: https://www.wauuni.com/
Отзывы участников прошлых потоков: https://vc.ru/2178361
И небольшое ревью, какие другие AI-браузеры еще представлены на сегодня:
Dia — AI-браузер с чатом в каждой вкладке, функциями Skills для автоматизации рабочих процессов запоминаем ваших предпочтения
Comet — браузер от Perplexity с AI-ассистентом в боковой панели, который видит содержимое страниц, автоматизирует задачи вроде черновиков писем и управления вкладками
Strawberry— самоуправляемый браузер с AI-компаньонами, которые автоматически выполняют задачи (поиск лидов, извлечение данных, заполнение форм) прямо в ваших вкладках
wAI News v25.4.2
Новая ИИ-модель от DeepMind предложила способ сделать опухоли заметнее для иммунитета
SpaceX показали крупные спутники Starlink V3 для супер быстрого спутникового интернета (на гигабит) и кратного роста ёмкости сети
Google представила модель ИИ видео генерации Veo 3.1/3.1 Fast — обновлениео с лучшим аудио, управлением стилем и режимами референсов, продления сцен и переходов
Вышел обзор бенчмарков ИИ-агентов: каталог 50+ тестов (инструменты, рассуждение, код, веб/GUI) с ссылками на статьи и лидерборды
Codex SDK: софт который сам пишет свой UI
С помощью Codex SDK теперь можно сделать софт, который на лету дописывает свои интерфейсы!
Это меняет правила игры для разработки SaaS - мы можем не только давать подстраивать интерфейс под юзера и его запросы (например менять стили и расположение кнопок) - но и на ходу добавлять целиком новые паттерны взаимодействия с нашими программами
Например дать возможность софту на ходу решить, какие кнопки добавить, и что эти кнопки будут делать с данными
P.S. Еще клевый момент на демо - когда показали титры с именами разработчиков (сам код отображения титров система разработала на ходу) - истинно разработка - новый рок-н-ролл)
OpenAI сейчас зарелизила OpenAI’s App SDK
Дает возможность инегрировать свои сервисы вOpenAI
Можно настроить работу через canva (html) и стандартный чат
Например сделать запрос найти дома на карте и их цены - и прямо в ChatGPT Zillow показывает html с картой и ценами
И дальше можно продолжить взаимодействие в чате
Свой OS/Store от OpenAI на базе MCP, с featured приложениями (по аналогии с AppStore)
Обновил wai.rocks, добавил генерацию картинок с Nano Banana
И 7 уровней умности и глубины размышлений модели - с жонглированием разными LLM
При этом модели выбираются и автоматически, но если нужна модель умнее (например, если не получили нужного ответа) - то выбирайте следующую по умности - вплоть до Maximum
Провели первый хакатон WaiWaiHack
Цель была за выходные создать работающий прототип ai агента
Сначала минутка статистики:
На хакатон зарегистрировалось 48 человек
До питча дошли 7 команд
У жюри был очень не простой выбор, потому что все проекты на питчах были суперские!
В итоге такие победители хакатона:
1 место: Sexy Agent (ИИ-агент для автоматизации фандрейза)
2 место: LagomDev (Агент, который превращает задачи в прокачку персонажа, показывает прогресс и мотивирует брать новые задачи благодаря видимому прогрессу)
3 место: Loca (бот с событиями по твоему вкусу и гео) и Fugarov's (бот на основании фото реального помещения помогающий определить размер стены для подсчета площади для последующей покупки материала)
Следующий хакатон проведем в конце октября, также онлайн
В chatgpt появились еще дополнительные настройки, сколько модель думает над задачей
Кажется, что панацея - давать все больше времени и ресурсов модели на размышления
Но по моим наблюдениям в Heavy режиме и в GPT-5 Pro ответ иногда хуже, чем в например в том же ChatGPT, но в стандартном режеме
На эту тему приведу русские пословицы и поговорки, которые мне нашел ChatGPT:
"Не мудрствуй лукаво"
"Ум за разум заходит"
"На всякого мудреца довольно простоты"
"Лучшее — враг хорошего"
Ребята из Just AI запустили классный движ с перекличкой людей из AI индустрии и размышлениями в формате Миф Vs Реальность в ИИ
Подхватываю эстафету у Маши Тихоновой
Я занимаюсь старатапами и развиваю маркетплейс AI-агентов WaiWai, поэтому в карточках поделился развенчанием мифов на тему прорывных инноваций в AI-стартапах и важности метрик
OpenAI выпустила отчет о том, для чего люди используют ChatGPT
800 миллионов активных пользователей (Weekly Active Users)
40% запросов - написание текстов
Их них малая часть - переводы, большая часть - дописывание имеющегося текста
24.1% - практические советы
Тут больше всего - обучение той или иной темы, на втором месте - How to (aka как починить эту посудомойку, как настроить Adobe Premiere для монтажа видео)
13.5% - поиск информации
0.9% из них - рецепты!)
остальное - конкретный запрос инфы
Меньше 5% вопросы про программирование
и 1.1% - самовыражение пользователей, просто початится с моделью (role play, рефлексия про отношения)
News News News v25.3.7
На неделе было две яркие сделки про железо для AI: Nebius Аркадия Воложа запартнёрилась с Microsoft для поставки железа на сумму около 20 миллиардов долларов, и OpenAI заказал у Oracle мощностей для обучения AI на 300 миллиардов долларов (после чего состояние Эллисона выросло на 30% за день — с 200 до 300+ миллиардов долларов).
В ChatGPT завезли поддержку MCP — теперь можно включить Developer Mode. Теперь будет сильно больше возможностей для встроенных интеграций — например, через промпт получить информацию об открытых задачах в таск-трекере и там же создать новые задачи.
А у Anthropic тоже релиз — запустили официальный реестр MCP-серверов, где можно зарегистрировать свой и выбрать подходящий для своей задачи. А еще теперь в Claude можно редактировать Excel, Word и PDF прямо в самом чате LLM - вот пример
Coinbase запустила «базар» агентов ИИ — где они могут находить друг друга и платить за решение задач.
И OpenAI собирается запустить конкурента LinkedIn — где будет доска с объявлениями о работе и сертификация в сфере знаний про AI.
AI и миллиард персон
Исследование ByteDance говорит о том, что у AI может быть миллиард разных персон под капотом
При составлении промпта мы можем направить ИИ, задать ему роль - одной личности или целого совета директоров
"Ты - венчурный капиталист..."
"Ты - совет экспертов: Сократ, Платон, Венечка Ерофеев, Илон Маск..."
Такая настройка ИИ значительно влияет на то, что мы получаем в результате запроса
С AI понятно - а как это работает с нами, человеками?
Мы также можем промптить себя:
"Мик - ты теперь известный венчурный инвестор Поль Грэмм. Что ты думаешь про то, как должны расти стартапы?"
Поль Грэмм: "Стартапы должны расти минимум на 7% каждую неделю! Иначе надо закрываться"
А что если поменять настройку?
Промптим Мика дальше:
"Мик - ты теперь выдающийся предприниматель и программист Дэвид Ханнемейр Хэнсон. Что ты думаешь про рост стартапов?"
Дэвид Ханнемейр Хэнсон: "Экспоненциальный рост [стартапа] - ваш враг"
Как же разрешить противоречие?
Вовремя подставить промпт: "Мик - ты теперь Мик"
Без AI. Без Поля Грэмма и Дэвида Ханнемейра Хэнсона
И уже из этого корневого промпта, услышав голос интуции, потихоньку добавить (где уместно) многогогосье:
Грэмма, Хэнсона, Платона
Венечки Ерофеева и Маска
AI с его миллиардом персон
Вышло интервью на канале Сергея Сухова @stoicstrategy
Поговорили про хакатоны, компании будущего, о взаимодействии AI агентов и про любовь к чаю
Enjoy: https://youtu.be/FUg4mJx3nc8
OpenWAU v25.9
Эти и другие новости обсудим на открытой бесплатной лекции про ИИ в среду 3 сентября в 20-00 (Мск время)
Поговорим про ai-новости и про инструменты на практических кейсах
Для записи ставьте + в комментариях или пишите в ЛС
Игра и Хакатоны
Наивность часто подается как что-то зазорное. Наверное есть важное различие между наивностью = не умностью, и наивностью = таким "детским" непредвзятым взглядом. Дети, смотрящие на мир еще не засоренными представление о том, как должна быть устроена "взрослая" вселенная, могут часами играть, не думая о том, принесет это пользу, сделает ли это их знаменитыми. Я вот также мог в детстве часами играть в Лего и просто кайфовать от процесса.
У Искусственного Интеллекта есть огромное преимущество перед нами - гигантская "насмотренность", "начитанность", но есть ли возможность быть в этом состоянии игры, в котором и только в котором можно находиться долго и устойчиво и созидать? Пока как будто нет, он очень серьезен!))
За это же состояние творческого потока я люблю хакатоны. Часто забываешь о течение времени, забываешь про призы, про то, что ты умеешь или не умеешь - и также как из лего, только из AI агентов, составляешь по кирпичикам проекты. Я участвовал и в жюри в хакатонах, и занимал призовые места в международных хакатонах, и вот мы решили сделать первый свой хакатон в сентябре.
Хакатон про запуск AI-агентов, уметь писать код не обязательно! Будет много фана, и в этот раз все будет онлайн.
Хакатон бесплатный! Для участия - от вас только желание)
Информация и запись тут:
https://waiwaihack.xyz/
Как измерять LLM
«ИИ должен быть спроектирован так, чтобы дополнять, а не заменять, людей.» — Стэнфордский институт человеко-ориентированного ИИ (HAI)
"Семь раз отмерь, один раз отрежь" - народная пословица
Почему важно измерять и думать о метриках? Важно это по двум причинам - это дает понимание правильности курса: увеличивается ли метрика при тех или иных изменениях технологии или уменьшается, и дает понимание, а что же мы на самом деле хотим. Это как со знаменитым компасом пирата Джека Воробья - который указывал направление на самое заветное желание, и через движение в этому желанию становилось понятно про что оно.
Как измерить AI? Есть несколько подходов:
- Через то, насколько AI умнее или глупее человека в тех или иных задачах, например в задачах по программированию. Обычно используется рейтинг из шахмат (Elo), и в этой метрике конечная цель AI - стать умнее во всех областях. Самые известные рейтинги и площадки - MMLU, LMArena
- Через решение нетривиальных задач, которые требуют так называемый "текучий интеллект" (fluid intelligence). Показывает, насколько машины хороши или плохи в задачах, которые требуют адаптивного интеллекта, а не заученного знания. Самый известный рейтинг - ARC-Agi (первую версию ИИ уже полностью "прорешали", поэтому вышла 2я и уже 3я версия)
- Через размер-длительность задачи, которую AI может решать - например, может ли ИИ сам разработать небольшой проект? А проект, который требует 100/1000/10000 человеко-дней?
- Экономическую эффективность - может ли ИИ управлять бизнесом, если да - то сколько зарабатывает / теряет? (например Vending Bench)
И через то, насколько ИИ дополняет человека, насколько увеличивает производительность человека (в сравнении с ИИ / без ИИ) - и насколько делает счастливее.
Эта метрика эффективности и "добавленного счастья" редко упоминается, при этом она одна из ключевых. Насколько ИИ в реальных задачах ускоряет или замедляет человека? И насколько делает счастливее или несчастнее?
Я для этого использую два подхода:
- записываю по 3 бальной системе каждый час уровень счастья и уровень энергии, и затем анализирую с AI - что меня делает счастливее, а что нет
- воспринимаю AI как партнера, и где-то делегирую ему задачи, но оставляю себе пространство без AI
Мы то, что мы измеряем, и поэтому важно мерить как AI нас дополнит, а не заменит