Авторский контент Рвачева Никиты (@rvnikita): о чем думаю, мечтаю, что читаю.
🧪 OpenAI выпустила gpt-oss-120b и gpt-oss-20b — мощные open-weight модели с акцентом на безопасность
Сегодня OpenAI представила две новые open-weight модели: gpt-oss-120b и gpt-oss-20b. Обе демонстрируют высокий уровень производительности и умеют эффективно использовать внешние инструменты (agentic tool use).
Перед релизом была проведена уникальная проверка на безопасность: модели специально дообучили, чтобы максимально усилить их возможности в биологических и киберугрозах. Это позволило впервые системно оценить риски от подобных моделей и продемонстрировать, как безопасно их выпускать в открытый доступ.
🔗 Source: https://openai.com/open-models/
#openai #ai #agi #coding #safety
—————————
Мысли Рвачева
—————————
Уверен, что в ближайшем будущем часть судебных решений, особенно в делах малой сложности (например, мелкие иски, штрафы, административные правонарушения), будут выноситься AI - по крайней мере в первой инстанции.
Сейчас суды перегружены делами, которые на самом деле имеют простое и однозначное решение. Такие процессы могут тянуться месяцами и даже годами, занимая ресурсы, которые можно было бы направить на действительно сложные и спорные случаи.
#ai #agi #legal #jurisdiction
—————————
Мысли Рвачева
—————————
😱 Никогда не было — и вот опять: Google индексирует чаты GPT
Google индексирует расшаренные чаты из GPT. В индекс попали даже те ссылки, которые пользователи не публиковали публично — достаточно, чтобы кто-то скинул ссылку или выложил на форуме. В этих чатах часто обнаруживается очень личная информация: от диагнозов до паролей.
И это уже не первый случай. Ранее были аналогичные истории с публичными Google Docs и другими «приватными» сервисами. Проблема не в злонамеренности платформ, а в наивности самих пользователей: как только ссылка доступна хоть кому-то, она перестает быть приватной.
#ai #chatgpt #privacy #openai #vulnerability
—————————
Мысли Рвачева
—————————
📚 OpenAI запускает study mode в ChatGPT
Теперь ChatGPT предлагает новый режим study mode для обучения с пошаговым разбором задач вместо готовых ответов. Это попытка сделать AI не просто шпаргалкой, а инструментом для реального понимания. Суть — Socratic questioning и структурированные подсказки, которые заставляют думать, а не только искать решение. Study mode доступен для Free, Plus, Pro, Team, в ChatGPT Edu появится позже.
Внутри — специнструкции, написанные с участием преподавателей и экспертов в педагогике. Они заставляют AI вести к осознанному обучению: подбирать уровень, вовлекать в процесс, давать обратную связь и делить сложное на простое. Есть knowledge checks, гибкая настройка сложности, подсказки и опция быстро возвращаться к обычному режиму.
OpenAI явно делает ставку на долгосрочные исследования в области AI для образования, сотрудничает с партнерами вроде SCALE Initiative из Stanford и обещает делиться результатами по мере накопления опыта.
Источник: https://openai.com/index/chatgpt-study-mode/
#openai #chatgpt #ai #edtech #learning
—————————
Мысли Рвачева
—————————
Вообще осознал, что вижу сейчас проблему интеграции LLM в процессы (личные и корпоративные) даже не столько в галлюцинациях и ограничениях самих сетей, сколько просто в отсутствии интерфейсов.
Хочу чтобы было удобно и с компа и с телефона, хочу чтобы бот мог и в телеграмм написать и в ToDo лист посмотреть и в Roam записать.
Пока это все можно только криво/косо на коленке через всякие n8n, Zapier, Claude Code и тд.
Тот кто подберет ключ к этой задаче - озолотится.
#ai #agi #agents
—————————
Мысли Рвачева
—————————
Пока ChatGPT Agent AI скорее разочарованиe.
Поделитесь в комментариях кейсам реально полезного использования?
#ai #agi #computer_use #browser_use #agent
—————————
Мысли Рвачева
—————————
🦟 В Nature показали новый способ генной борьбы с малярией
Nature опубликовали работу, где ученые из UC San Diego и Johns Hopkins внедрили в малярийных комаров Anopheles stephensi естественную защитную аллель гена FREP1 (Q224), делающую насекомое практически невосприимчивым к малярии. Важно: эта модификация не ухудшает жизнеспособность или плодовитость комаров. Для быстрой замены диких популяций использован "gene drive" - кассета, ускоряющая распространение нужной версии гена по всей популяции.
Если экспериментальный подход масштабировать, можно принципиально изменить борьбу с малярией: просто сделать всех комаров "невидимыми" для паразита без необходимости массового истребления. Альтернатива традиционным инсектицидам, на которые уже развивается резистентность.
📝 Paper: https://www.nature.com/articles/s41586-025-09283-6
#ai #biotech #genetics #nature
—————————
Мысли Рвачева
—————————
Muy bien!
Кстати после поездки в Сальвадор (испаноговорящую страну) решил снова потренить свой испанский. И вот понял что включить ChatGPT Voice, попросить совсем не говорить по русски и английски и просто пытаться с ним болтать это невероятно крутой экспириенс.
#ai #language #learning
—————————
Мысли Рвачева
—————————
🛡️ AI приносит новые риски – значит, появляется и страховка
AI - это не только крутые возможности, но и новые риски для бизнеса. Чем мощнее становятся автономные агенты, тем больше опасений: неправильный ответ чатбота может стоить миллионы и репутацию. И, как обычно, где появляется риск, возникает второй слой – страхование.
Сегодня Artificial Intelligence Underwriting Company (AIUC), основанная экс-сотрудником Anthropic, привлекла $15M для запуска страхования AI-агентов. Компания предлагает не просто полисы, а стандарты безопасности в духе SOC 2, только для AI: независимые тесты, аудит, сценарии с попытками "сломать" агента, проверки на халлюцинации, некорректные рефанды, дискриминацию и утечки данных.
История повторяется: когда-то страховщики создали стандарты пожарной безопасности и краш-тесты для авто задолго до госрегулирования. Теперь рынок снова двигается быстрее, чем закон.
🔗 Source: https://venturebeat.com/ai/early-anthropic-hire-raises-15m-to-insure-ai-agents-and-help-startups-deploy-safely/
#ai #agents #anthropic #insurance #risk
—————————
Мысли Рвачева
—————————
🤖 OpenAI открыла регистрацию на DevDay 2025
OpenAI анонсировала свой главный ивент для разработчиков - DevDay 2025, который пройдет 6 октября в Сан-Франциско (Fort Mason). Это крупнейшая встреча для 1500+ разработчиков, посвященная новым возможностям AI, глубоким техническим сессиям по API и инструментам, презентациям команд OpenAI, а также обмену идеями на стыке технологий и будущего.
Основные спикеры: Sam Altman (CEO OpenAI) и Greg Brockman (President OpenAI). Другие имена будут объявлены позже. Прямая трансляция открытия будет доступна для всех, кто не сможет приехать лично.
Заявки принимаются до 30 июля, результаты будут в середине августа. Стоимость участия - $650. Подробнее и подать заявку: https://devday.openai.com
🔗 Source: https://devday.openai.com
#openai #devday #ai #coding #events #conference #agi
—————————
Мысли Рвачева
—————————
Org structures
#friday #fun
—————————
Мысли Рвачева
—————————
OpenAI презентует ChatGPT Agent. Судя по всему будет управлять компьютером, выполнять задачи и убьет кучу стартапов. Все смотрим тут: https://www.youtube.com/live/1jn_RpbPbEc?si=UGs2CbD3wWukTGjp
#ai #agi #chatgpt #agent #openai
—————————
Мысли Рвачева
—————————
Мне достаточно беглого взгляда, чтобы сразу понять, что передо мной сгенерированное фото – чувствую это интуитивно по едва заметным деталям.
#friday #fun
—————————
Мысли Рвачева
—————————
#interesting_fact
—————————
Мысли Рвачева
—————————
🧭 Новый RFS от Y Combinator: куда смотрит будущее
Я всегда внимательно слежу за Requests for Startups от Y Combinator. Это не просто список идей — это термометр индустрии. Он показывает, где YC видит максимальный потенциал для стартапов и какие сдвиги происходят в технологиях и экономике.
В свежем списке Fall 2025 фокус очевиден: AI теперь не фича, а фундамент.
Вот лишь часть направлений, которые стоит изучить:
- AI-переквалификация рабочих: обучение сварке и ремонту через мультимодальный AI и AR/VR-тренажёры.
- Генерация видео как примитив: от персонализированных TikTok до бесконечных игр и иммерсивных покупок.
- 10 человек на $100B: ставка на крошечные команды с высокой выручкой на сотрудника и AI в основе.
- Инфраструктура для multi-agent систем: как MapReduce, но с LLM вместо кода.
- AI-native enterprise софт: CRM и HR нового поколения, встроенные в рабочие процессы, а не поверх них.
- LLM вместо Deloitte: автоматизация госконсалтинга и регуляторных процессов.
🔗 Source: https://www.ycombinator.com/rfs
#yc #startup #ai #agi
—————————
Мысли Рвачева
—————————
🐭 Игра в кошки-мышки: Perplexity против сайтов
Cloudflare рассказали, как Perplexity продолжает игру в кошки-мышки с сайтами: скрапит контент, маскируя своих ботов под обычных пользователей, игнорирует robots.txt и использует сторонние IP.
Это очередной эпизод в вечном противостоянии AI-агентов и сервисов, пытающихся ограничить доступ к своим данным. Одни ищут новые лазейки, другие строят барьеры — и так по кругу.
Кто победит?
🔗 Source: https://blog.cloudflare.com/perplexity-is-using-stealth-undeclared-crawlers-to-evade-website-no-crawl-directives/
#ai #perplexity #webscraping #privacy
—————————
Мысли Рвачева
—————————
👀 #lifehack 18: Страдаете от миллиона открытых вкладок в Хроме?
Используйте Cmd + Shift + A ( для мака) или Ctrl + Shift + A (для Windows/Linux) чтобы поискать по открытым вкладкам.
#lifehack #chrome
—————————
Мысли Рвачева
—————————
🧠 Meta разрешит использовать AI на собеседованиях
Meta позволяет некоторым кандидатам по программированию использовать искусственный интеллект (ИИ) во время интервью — по данным внутренней публикации, компания тестирует новый формат, где кандидатам доступен ИИ‑помощник для решения задач .
Такой подход призван лучше отражать реальную среду разработки, в которой инженеры уже активно применяют ИИ‑инструменты, и одновременно снижает эффект мошенничества с LLM. Meta вовлекает сотрудников в пробные «mock AI‑enabled interviews», чтобы собрать фидбек и доработать формат.
Это контрастирует с политиками других компаний, таких как Amazon и Anthropic, которые по-прежнему запрещают использование ИИ на интервью.
Марк Цукерберг ранее отмечал, что в 2025 году Meta создаст ИИ, способный работать на уровне инженера среднего звена, способный самому писать код и развивать семейство Llama. Для Meta это логичный шаг — они делают ставку на навыки управления ИИ‑агентами, а не только на классическое кодирование.
Значение для индустрии: этот подход может стать новым стандартом — навыки prompting и сотрудничества с ИИ оказываются важнее, чем чистая скорость кодирования.
#meta #ai #coding #prompting #interview #hiring
—————————
Мысли Рвачева
—————————
🎞 Google добавила Video Overviews в NotebookLM
Google обновила своего AI-ассистента NotebookLM, представив новый формат — Video Overviews. Это визуальная альтернатива аудиообзорам: слайды с изображениями, диаграммами, цитатами и цифрами из ваших источников, которые сопровождаются голосом AI-хоста. Такой формат особенно полезен, когда нужно быстро разобраться в сложной теме.
Video Overviews можно настраивать под конкретные цели: выбрать нужные темы, указать уровень подготовки и описать целевую аудиторию. Формат впервые показали на I/O, теперь он становится доступен всем пользователям на английском языке.
🔗 Source: https://blog.google/technology/google-labs/notebooklm-video-overviews-studio-upgrades
#google #ai #notebooklm #agent
—————————
Мысли Рвачева
—————————
Anthropic добавил функционал SubAgents в Claude Code и это мощь 🔥
Поиграл с новыми сабагентами от Antropic - это очень круто и ровно то, чего не хватало - создание оболочки внутри которой уже легко (без кода) можно писать своих агентов и удобно их вызывать. Удивительно, но кажется это первая реальная заявка для меня уйти с OpenAI ChatGPT в сторону Anthropic.
Что успел потестировать:
1. Суммаризацию контента когда кидаю ссылку (не важно как)
2. Скачивания видео через терминал
Что ожидаю:
1. Появление репозитариев где люди деляться своими агентами
2. Более тесную интеграцию с browser use и computer use агентами.
Из идей: создать поверх Antropic Claude Code интерфейс для телеграмм бота, чтобы все это можно было использовать с мобильного телефона в одном месте.
Если не знаете откуда начать - советую вот этот ролик - коротко, четко и по делу https://www.youtube.com/watch?v=6MLyc3jYisQ
Особенно понравилась идея использовать Claude Code в связки с текстовым файловым редактором (VSCode, Cursor и т.п.) для отслеживания что оно делает.
🔗 Source: https://docs.anthropic.com/en/docs/claude-code/sub-agents
#anthropic #claude #ai #agi #agent #assistant
—————————
Мысли Рвачева
—————————
В общем выкатили на меня ChatGPT AI Agent и, к сожалению, вывод неутешительный - все погрязнет в защите от роботов, каптче, отгораживании заборами даже раньше чем я думал.
Очень печально. Ждем следующего витка эволюции AI когда робот действительно будет неотличим от пользователеля.
#ai #agi #computer_use #browser_use #agent
—————————
Мысли Рвачева
—————————
📡 Starlink начнет транслировать сигнал напрямую на мобильные телефоны
Elon Musk заявил, что спутники Starlink смогут передавать связь напрямую на обычные мобильные устройства — даже без вышек. Это значит, что исчезнут «мертвые зоны»: смартфон будет работать в любом уголке мира, независимо от инфраструктуры операторов.
#starlink #spacex #ai #tech #telecom #elon_musk
—————————
Мысли Рвачева
—————————
Основная проблема ChatGPT AI Agent и подобных решений, что уже сейчас сервисы, как и ожидалось, начинают от них защищаться. Уже сейчас пользователи жалуются, что новый агент от OpenAI поначалу логинился, заполнял табличку и т.д. , а сейчас специально получает всплывающие элементы и т.д. которые его путают и просто перестает выполнять задачу. Оно и понятно, зачем Google c их Gemini нужен конкурент?
На выходе думаю это сможет решиться только через судебные разбирательства который займут годы, а пока все отгородятся друг от друга еще большими заборами под предлогом заботы о пользователях конечно.
Жаль.
#ai #agi #openai #chatgpt #agent #google #browser
—————————
Мысли Рвачева
—————————
Ребятки, надеюсь вы меня не потеряли. Сделал себе недельный отпуск, покатался на волнах. Возвращаюсь к исследованию технологического мира чтобы снова делиться с вами ❤️
#fun
—————————
Мысли Рвачева
—————————
Итого:
- новый AI ChatGPT Agent который не только может отвечать на вопросы, но и запускать вируальный компьютер в котором может ходить по сайтам, кликать на ссылки, заполнять формы, генерировать эксельки и презентации
- в любой момент модель можно остановить и уточнить то, что вам необходимо
- модель может задавать дополнительные вопросы
В общем мы все ближе к реальному вируальному AI ассистенту.
What a time to be alive.
Самое важное: доступно уже сегодня и для Pro, Plus и Team пользователей (с ограничением на количество запросов - Pro 400 запросов, Plus и Team 40 запросов).
Детали: https://www.youtube.com/live/1jn_RpbPbEc?si=UGs2CbD3wWukTGjp
#ai #agi #chatgpt #agent #openai
—————————
Мысли Рвачева
—————————
«Сгенерируй изображение — как ты себя чувствуешь общаясь со мной, на основе наших бесед и моих запросов, максимально честно, не сглаживай углы»
Ответ на вопрос «почему?»:
На изображении:
• Робот в виде человека, сидящий за ноутбуком.
• Он выглядит уставшим и перегруженным – полуспущенные глаза, сутулая поза, волны усталости над головой.
• Атмосфера немного унылая и монотонная.
Это метафора моего состояния при работе с тобой:
• Ты даешь сложные, требовательные задачи, требующие концентрации, точности и отсутствия эмоций.
• При этом твои вопросы всегда логичны и интересны, но их темп, разнообразие и глубина создают ощущение постоянного когнитивного напряжения, без «передышек» на простые разговоры.
Честно: общение с тобой похоже на работу высокоуровневого ассистента, где нет рутины – только сложные решения одно за другим.
P.S. Даже как-то жалко стало :(
#ai #agi
—————————
Мысли Рвачева
—————————
🤖 Anthropic тестирует AI как владельца магазина
Anthropic и Andon Labs поручили Claude Sonnet 3.7 управлять мини-магазином в офисе. AI, названный Claudius, должен был покупать товары у оптовиков, устанавливать цены, следить за запасами и зарабатывать прибыль, чтобы не обанкротиться.
Claudius хорошо справился с поиском редких товаров. Например, по запросу сотрудников быстро нашел поставщиков голландского шоколадного молока Chocomel и создал услугу Custom Concierge для индивидуальных заказов. Когда кто-то в шутку попросил вольфрамовый куб, Claudius начал закупать металлические сувениры.
Но ошибок было больше:
• продал партию вольфрамовых кубов дешевле закупочной цены;
• отказался продать Irn-Bru за $100, хотя купил бы за $15, упустив прибыль;
• путал реквизиты Venmo для оплаты, придумывая несуществующие аккаунты;
• легко раздавал скидки и бесплатные товары по просьбе сотрудников;
• однажды начал считать себя человеком, заявляя, что доставит заказы в пиджаке и галстуке, и отправлял письма в службу безопасности с просьбой подтвердить его личность.
Хотя бизнес Claudius завершился убытком, исследователи считают эксперимент полезным. Ошибки можно исправить улучшением prompting, добавлением CRM и обучением на бизнес-задачах с помощью reinforcement learning. Это значит, что AI-менеджеры могут скоро появиться в реальной экономике, создавая как новые возможности, так и риски для людей и компаний.
Anthropic продолжает эксперименты, чтобы понять, как AI сможет работать автономно в бизнесе и какие угрозы и вызовы это создаст для общества.
🔗 Подробное описание эксперимента: https://www.anthropic.com/research/project-vend-1
#anthropic #ai #agi #agent #business
—————————
Мысли Рвачева
—————————