Авторский контент Рвачева Никиты (@rvnikita): о чем думаю, мечтаю, что читаю.
Отдельный кайф заниматься AI лабораторией, да и в целом AI - иметь возможность прикоснуться к будущему за пару моментов до того, как оно настало. Сегодня Google Labs позвали присоединиться к закрытому тестированию Project Mariner. Буду подсвечивать тут то, что не будет вылезать за NDA.
#ai #agi #agent #google #project_mariner
—————————
Мысли Рвачева
—————————
Чем глубже я погружаюсь в разработку AI агентов, тем больше возникает вопросов, а так же понимания, что все далеко не так просто и легко как казалось в самом начале.
В целом AI агента можно рассматривать как просто работника в офисе у которого есть профессия, круг обязанностей, должностные инструкции и доступы.
Вопрос с которым я пытаюсь сейчас разобраться - на сколько автономны должны быть агенты. Должны ли они работать в Apple way (когда тебе дается только то, что тебе нужно и ничего больше прям как в корпорации Apple) или агент должен иметь доступ к распределенной памяти где хранится и переписка с пользователем и результат работы предыдущих агентов.
С одной стороны хочется сделать супер фокус, так как понятно, чем меньше контекста использовано, тем выше качество, но тогда приходится полагаться на результат предыдущих агентов (которые могут накосячить). Если же никому не доверять (любая переработка или профильтровывание информации приводит только к снижению сигнала) - большой шанс понизить качество напихав слишком много информации в одного агента. Скорее всего ответ в балансе.
Наверняка есть какие-то научнные работы с AB тестами, статьи и т.д. Сталкивались ли вы с похожими мыслями? Что решили, что думаете? Поделитесь опытом. Думаю комментарии к этому посту будут полезны очень многим.
#ai #agi #agent
—————————
Мысли Рвачева
—————————
🚗 Waymo представила свежие данные о безопасности беспилотных авто за 2024 год.
50 миллионов километров без водителя-человека — и результаты впечатляют:
— На 83% меньше аварий с раскрытием подушек безопасности
— На 81% меньше аварий с травмами
— На 64% меньше ДТП, зарегистрированных полицией
Что это значит на практике? Waymo Driver уже сейчас водит значительно безопаснее среднего человека — машина реже попадает в серьёзные аварии, причиняющие ущерб или травмы.
Робот за рулём осторожнее, предсказуемее и внимательнее живого водителя. Если раньше главным вопросом был «как скоро беспилотники догонят человека», то теперь он звучит иначе: «как скоро человек уступит роботам дорогу?»
Подробнее с данными и цифрами:
https://waymo.com/safety/impact
#waymo #AI #selfdriving_cars
В будущем основным потребителем документации будет не человек, а LLM.
Поэтому уже сейчас компании вроде Stripe делают чтение документации удобнее для агентов, в частности создавая .llm формат. Пример https://docs.stripe.com/llms.txt
#friday #fun #coding
—————————
Мысли Рвачева
—————————
🚀 OpenAI запустила модель, позволяющую AI полноценно управлять браузером
Browserbase стал одним из первых партнёров OpenAI в исследовании новой модели, способной полноценно взаимодействовать с браузером через интерфейс. Такие инструменты появились не вчера: проекты вроде babyagi уже несколько лет пытаются автоматизировать работу за компьютером. Но сейчас очевиден серьёзный прогресс.
Я протестировал модель на задаче: «открой репозиторий, изучи код и дай рекомендации по улучшению». Пока не идеально — например, трудно остановить процесс и сказать: «Стоп, идёшь не туда, сделай иначе». Тем не менее, уровень впечатляет, и возможности для автоматизации огромные. Вспоминается цитата: «все удалённые позиции будут на 100% автоматизированы AI-агентами».
Browserbase выпустили бесплатную версию и исходный код — можно попробовать уже сейчас. Крутой шаг вперёд, рекомендую:
🔗 Demo: https://browserbase.com
👨💻 Github: https://github.com/browserbase/cua-browser
#ai #openai #automation #agi #coding
—————————
Мысли Рвачева
—————————
Давно экспериментирую с продуктивностью, в частности с Pomodoro-таймером. Для тех, кто не знает, основная идея — заводить таймер на 25 минут и, не отвлекаясь, работать над одной задачей, после чего делать небольшой перерыв на 5 минут. В идеале нужно набирать как можно больше таких «помидоров» (особенно приятно их фиксировать в блокноте). Основная проблема с продуктивностью у меня, как мне кажется, связана с переключением между контекстами и отвлечением на «мелкие задачи». Есть огромное количество приложений и плагинов для этого, но все они какие-то неудобные. В итоге подсмотрел у друга @gosha_from_the_block «Gravity Timer», который стоит около $17 на Amazon или менее $10 на AliExpress/Temu.
Из плюсов:
- выглядит очень круто;
- физически стоит рядом, и его можно использовать не только во время работы за компьютером, но и для других задач;
- включение, выключение и переключение занимают всего секунду за счёт переворачивания на нужную сторону.
Посмотрим, приживётся ли.
Расскажите ваши лайфхаки: используете ли технологии для продуктивности и в целом верите ли во всё это?
#productivity #pomadoro
—————————
Мысли Рвачева
—————————
#lifehack 12:
Если поменять github.com на uithub.com (то есть заменив G на U) вы получите весь код репозитория + структуру файлов которую удобно передать в LLM. Работает, к сожалению, только на публичных репозиториях (что понятно)
#ai #agi #llm #coding
#lifehack
—————————
Мысли Рвачева
—————————
Интересная «побочка» кориолисового ускорения (то по которому вода в ванной закручивается в разные стороны в разных частях мира) - ураганы не формируются на и не пересекают экватор.
#interesting_fact
—————————
Мысли Рвачева
—————————
ChatGPT теперь может напрямую менять код в популярных IDE (включая XCode, VSCode и др.) Наконец можно перестать копировать код туда/сюда. Скорость программирования вырастет еще раза в 1.5.
🔗 Source: https://x.com/OpenAIDevs/status/1897700857833193955
#ai #agi #coding #ide #chatgpt
—————————
Мысли Рвачева
—————————
#lifehack 12:
Выгруженные данные из 23andme, AncestryDNA, Genotek и др. можно загрузить прям файлом в ChatGPT и получить генетический анализ по заболеваниям лучше, чем отдают сами сервисы. Кажется их можно окончательно похоронить.
#lifehack #gpt #DNA
—————————
Мысли Рвачева
—————————
Режим Deep research, который позволяет проводить исследования на любую тему, теперь доступен подписчикам ChatGPT Plus, Team, Edu и Enterprise, сообщила OpenAI.
Они получили по 10 запросов в месяц. Владельцы подписки Pro — 120 запросов в месяц
https://openai.com/index/introducing-deep-research/
#openai #chatgpt #ai
—————————
Мысли Рвачева
—————————
Вышел мой комментарий по поводу использования AI в кино производстве для журнала INC Russia.
https://incrussia.ru/understand/oskar-v-ii/
#ai #movies #cinema
—————————
Мысли Рвачева
—————————
Самый недооцененный магазин AI приложений в интернете, где почти 500 тысяч бесплатных AI-инструментов, доступных каждому:
https://huggingface.co/spaces
#ai #agi #huggingface
—————————
Мысли Рвачева
—————————
🤖 В этот день в 2012 году Amazon купила компанию Kiva, которая производила роботов для складов.
Всего через год на складах Amazon уже работало около 1000 роботов.
Сегодня их уже более 750 000.
Вот так выглядит масштаб автоматизации за 13 лет. И это только начало.
#ai #agi #robotics
—————————
Мысли Рвачева
—————————
🤖 NVIDIA только что представила Isaac GR00T N1 — первую в мире открытую foundation-модель для управления человекоподобными роботами.
GR00T N1 — это как ChatGPT, только для роботов. Он умеет не просто выполнять отдельные движения, а полноценно «думать», понимать контекст и адаптироваться к разным задачам. NVIDIA даже встроила в него два «режима мышления»: быстрое и интуитивное, и более медленное, аналитическое — буквально как у человека.
Что это значит на практике? Например, роботы теперь могут легко освоить задачи, для которых раньше приходилось нанимать людей: аккуратно перекладывать предметы с места на место, сортировать товары или даже убирать комнату, предварительно «посмотрев» видео-инструкцию.
Учитывая, что сегодня уже можно самостоятельно собрать настоящего робота всего за $250, нас ждёт очень интересное будущее.
Официальный аннонс https://nvidianews.nvidia.com/news/nvidia-isaac-gr00t-n1-open-humanoid-robot-foundation-model-simulation-frameworks
Подробнее о GR00T N1:
https://github.com/NVIDIA/Isaac-GR00T
Подробнее о $250 DYI-кит
https://github.com/AlexanderKoch-Koch/low_cost_robot
#nvidia #robotics #ai #automation
—————————
Мысли Рвачева
—————————
Ребята, мой друг @daniv запустил крутой проект — Divercity Map! Это иллюстрированная карта Нью-Йорка, которая отражает всю уникальность и разнообразие этого потрясающего города. На ней — сотни деталей и отсылок, она доступна в формате пазлов и постеров.
Давайте поддержим! Это не только красивая, но и невероятно важная идея.
https://www.kickstarter.com/projects/waso/divercity-a-map-of-manhattan-that-represents-nycs-diversity
🔌 Anthropic запустила MCP — протокол, который может изменить взаимодействие AI с миром
Относительно незаметно прошло важное событие: компания Anthropic представила Model Context Protocol (MCP). Простыми словами — это аналог USB-C, только для AI. Универсальный стандарт, позволяющий AI-агентам и приложениям легко подключаться к различным данным, инструментам и друг к другу.
Пока всё только начинается, но потенциал огромный. Например, в видео Claude напрямую подключается к Blender через MCP и буквально управляет им для создания 3D-анимации по заданному описанию.
Почему это важно? Представьте, что скоро любые приложения смогут «общаться» с AI напрямую, без костылей и отдельных интеграций. Это позволит автоматизировать множество задач, которые сейчас кажутся слишком сложными: от управления софтом для видеомонтажа и графического дизайна (как тот же Blender) до автоматического управления CRM-системами, редактирования контента в Notion или анализа данных в Excel.
AI получит доступ к десяткам инструментов, которые раньше были закрыты из-за отсутствия подходящих API. Это ускорит автоматизацию дизайна, программирования, аналитики и маркетинга, а в перспективе и вообще почти любой работы за компьютером.
Подробнее про MCP: 🔗 https://modelcontextprotocol.io/introduction
#ai #anthropic #mcp #automation #blender
—————————
Мысли Рвачева
—————————
🤖 Карта AI агентов от CBInsights + подробный отчет
CBInsights недавно выпустили отчет + карту AI агентов. Совершенно очевидно, что 2025 будет годом AI агентов. Про это мы будем слышать все больше и больше.
Три мысли из отчета:
1. Крупные компании, такие как OpenAI и Anthropic, продолжат захватывать рынок универсальных AI-агентов за счёт массовой аудитории и снижения рисков для предприятий. В ответ на это частные стартапы будут вынуждены углублять специализацию и предлагать нишевые решения с интеграцией клиентских данных.
2. Рынок инфраструктуры AI-агентов переходит от фрагментированности к чёткой структуре с появлением специализированных решений по управлению данными, инструментами поиска и оценки эффективности агентов. Одновременно растёт спрос на универсальные платформы разработки AI-агентов, доступные даже без глубоких технических знаний.
3. Компании активно интегрируют AI-агентов в рабочие процессы, однако сталкиваются с вызовами в области надёжности, безопасности и интеграции с существующими системами. Наиболее перспективными становятся решения, предусматривающие контроль человека («human-in-the-loop») и качественное управление данными, необходимые для успешного и безопасного внедрения AI-агентов.
🔗 Прямая ссылка на отчет: https://www.cbinsights.com/reports/CB-Insights_AI-Agent-Trends-To-Watch-2025.pdf?ip_et_ctx=23875269_31_9
#ai #agent
Ребятки, сейчас (как и многие) сильно погружаются в разработку AI агентов и их оркестрирование. Поделитесь в комментариях материалами которые очень полезны на ваш взгляд (видео, научные статьи, репозитории т.д., может уже есть книга с животным на обложке). Не поверхностные выдержки из документации, MVP и т.д. а глубокий полезный материал.
В моменте особенно интересуют архитектурные аспекты. Как правильно распределять роли, как работает дирижер, как устроен цикл, граф состояний и т.д., какая память (что обещдоступно, а что нет, кто может писать а кто нет) и т.д. и т.п.
Очевидно, что многие тут еще поменяется, но тема будет актуально долго. По ощущениям влияние будет не меньше чем с изобретением объектно-ориентированного программирования.
#ai #agent #coding #agi #architecture
—————————
Мысли Рвачева
—————————
OpenAI презентует API для разработки агентов.
Прямая трансляция в 20:00 по Москве (13:00 по НЙ) - через 6 минут.
▶️ https://www.youtube.com/watch?v=hciNKcLwSes
#openai #agent #ai #agi
—————————
Мысли Рвачева
—————————
Новые модели выходят так часто, что многие уже запутались какая сейчас самая лучшая. Как раз для этого есть LLM Arena где сравниваются все модели друг с другом. С удивлением обнаружил, что первую строчку сейчас занимает Grok 3 (даже выше ChatGPT 4.5)
https://lmarena.ai/?leaderboard
#ai #agi #gpt
—————————
Мысли Рвачева
—————————
OpenAI выкатывает свою модель ChatGPT 4.5 на Pro пользователей (те, что за $20/месяц).
#openai #chatgpt
—————————
Мысли Рвачева
—————————
#lifehack 11:
Меня как-то всегда пугали истории, что мошенники каким-то образом оформляют кредиты без разрешения. Особенно с учетом того, что я живу вне РФ и не сильно слежу за тем, что происходит внутри.
Судя по всему с 1 марта придумали крутую фичу которую можно включить через госуслуги “самозапрет на кредит”
Там же ее можно будет потом и выключить если понадобится.
https://www.gosuslugi.ru/landing/nocredit
#lifehack #secutity
—————————
Мысли Рвачева
—————————
⚡️ OpenAI выпустила GPT-4.5
OpenAI представила GPT-4.5, и это действительно шаг вперёд.
Что интересно:
— Это первая модель, которая ощущается как разговор с вдумчивым человеком. Некоторые пользователи отмечают, что получали реально полезные советы от AI.
— Модель не заточена на победу в бенчмарках — GPT-4.5 не про логику, а про новый тип интеллекта, который ощущается иначе.
Что не так:
— GPT-4.5 — огромная и дорогая модель, и OpenAI пока не хватает GPU для всех пользователей. Сейчас она доступна в Pro, а в Plus её добавят после масштабного расширения серверов.
OpenAI продолжает масштабироваться — десятки тысяч новых GPU появятся уже на следующей неделе, сотни тысяч — в ближайшее время.
🔗 Source: https://youtu.be/cfRYp0nItZ8
#openai #ai #gpt #llm
—————————
Мысли Рвачева
—————————