Новости инноваций из мира искусственного интеллекта. 🤖 Всё об ИИ, ИТ трендах и технологической сингулярности. Бесплатный бот для подписчиков: @ai_gptfreebot автор: @mbmal канал личный. Поддержка: https://pay.cloudtips.ru/p/c8960bbb
PydanticAI — новый агентный фреймворк для продакшен-приложений с ИИ
Команда Pydantic выпустила собственный агентный фреймворк для создания LLM-приложений. PydanticAI работает с любыми моделями — OpenAI, Anthropic, Gemini, Deepseek, Ollama, Groq, Cohere, Mistral.
Ключевые фичи: типобезопасность, структурированные ответы, стриминг с валидацией, система внедрения зависимостей. Интеграция с Pydantic Logfire для мониторинга и отладки в реальном времени.
Задача — принести в GenAI разработку то же удобство, что FastAPI принес в веб-разработку. Фреймворк уже используется в продакшене для Pydantic Logfire.
Пока в бета-версии, но команда обещает стабильный API и активную поддержку.
GitHub
#PydanticAI #LLM #Framework
------
@tsingular
Бесплатый вводный курс по Lovable
Совсем недавно завирусился сайт для создания веб проектов с помощью ИИ.
У него, оказывается, был промо период, где народ нагенерил 200+тыс проектов буквально за выходные.
Это больше, чем было сайтов во всем Интернете например 30 лет назад.
Может быть полезен для быстрого создания прототипа или даже для запуска полноценного стартапа за 1 день.
Для тех, кто не знает с чего начать тут ноукодер выпустил вводный мини-курс о том, как готавить ТЗ проекта и исполняемую среду Lovable для качественного старта.
Ссылка на сам курс
С некоторыми из знакомых уже попробовали сам портал, - очень удобно, конечно.
Как минимум полезно ознакомиться.
#Lovable #курсы
———
@tsingular
В Steam появилась игра Virtual Girlfriend
В Steam появилась новая игра Virtual Girlfriend — симулятор виртуальных отношений с ИИ-персонажем.
Игра позволяет создать собственную виртуальную подругу и общаться с ней через продвинутую систему искусственного интеллекта.
Персонаж с LLM и TTS может поддерживать разговоры, запоминать детали общения и развивать отношения.
Такие проекты становятся все популярнее на фоне развития ИИ-технологий. Границы между реальным и виртуальным общением продолжают размываться.
#Steam #AI #Gaming
------
@tsingular
Google покупает энергию термоядерного синтеза
Google заключил сделку с Commonwealth Fusion Systems на покупку 200 МВт энергии от первой коммерческой станции термоядерного синтеза в Вирджинии. Запуск в начале 2030-х.
Правда, энергопотребление Google растет быстрее, чем появляются новые источники. Выбросы выросли на 50% с 2019 года. Дата-центры потребляют 30 ТВт-ч — как вся Ирландия.
Интересно, что Google не раскрывает, сколько именно энергии тратит на ИИ. Хотя все понимают, что львиная доля роста связана именно с развитием AI-сервисов.
#Google #fusion #AI
------
@tsingular
Чего подумал, - может и не надо будет так много роботов то..
#юмор
———
@tsingular
Hugging Face встроил HTTP-сервер в библиотеку Transformers
Команда Hugging Face добавила встроенный HTTP-сервер с OpenAI-совместимым API прямо в библиотеку Transformers.
Теперь можно запустить локальный сервер командой transformers serve
и подключать любые приложения без дополнительных настроек.
В демо показали работу с приложением Jan от Menlo Research - модели можно менять на лету, есть предварительная поддержка tool calls.
Это серьезно упростит тестирование новых моделей в агентах и фреймворках без необходимости настройки отдельной инфраструктуры.
#HuggingFace #Transformers #OpenAI
------
@tsingular
Лазерное ПВО от комаров заказывали? Стартаперы сделали и продают на аналоге кикстартера за €500 штуку
Я пока скептически настроен, но направление гаджетов клевое – еще хочется чтобы эта фигня пчел отличала от комаров, потому что я за пчел
Ссылка
Ну что же, а сейчас разберём пример интересного исследования, которое подкинул мне агент, о котором я описывал выше.
Безопасность протоколов коммуникации между агентами, кажется, что только в MCP проблемы, но тут господа из Китая провели детальное исследование всех существующих (на момент написания исследования) протоколов взаимодействия между агентами и пришли к интересным выводам.
Во-первых они проанализировали 150 статьей по протоколам коммуникаций между агентами, а также по их безопасности. Выделили 3 уровня протоколов:
1.User-Agent – человек-агент
2.Agent-Agent- коммуникация между агентами
3.Agent-Environment – взаимодействие агентов с внешними системами.
Самое интересное конечно же, что они построили свою модель угроз для всех 3 уровней. Так на первом уровне расположились довольно известные нам угрозы - промпт инъекции, социотехнические атаки, извлечение данных и манипуляция контекстом.
Дальше, когда происходит коммуникация между агентами – тут выделяют угрозы, когда агенты с изначально опасной целью – нарушают консенсус, то есть цель всей агентной системы. А также внедрение ложных данных и эксплуатация доверия – буквально агент может внушить другому что-то плохое.
А уже потом – Agent-Environment, тут и атаки на цепочку поставок и влияние на API, а также внешние ресурсы. Интересно что манипуляция с API – также может повлиять на поведение агентов.
Есть и отдельный блок – Protocol Analysis. Примечательно что MCP выделяют как наиболее проработанным с точки зрения безопасности, и в правду много исследований – а сейчас ещё вышло интересное обновление – в MCP добавили защиту. Но не об этом речь.
A2A – пока что в стадии проработки с точки зрения безопасности.
Ну и что интересно, предлагают в статье и механизмы защиты – например адаптацию Zero Trust, мониторинг поведения, контролировать промпт-инъекции путём наложения файрволла, балансировщика нагрузки а также дообучения на состязательных примерах. Подробно
В скриншотах к посту - важные таблицы из статьи.
статья
✔️Sakana AI запускает новый алгоритм AB-MCTS
Sakana AI представила AB-MCTS (Adaptive Branching Monte Carlo Tree Search) — алгоритм, который объединяет несколько передовых ИИ-моделей (o4-mini, Gemini 2.5 Pro, DeepSeek-R1-0528) в единую систему коллективного поиска решений.
Преимущества AB-MCTS:
— Коллективный интеллект: каждая модель вносит свои сильные стороны и компенсирует слабые.
— Адаптивный поиск: строится дерево возможных стратегий, и выбор ответвлений происходит на основе успешности прошлых итераций.
— Существенный прирост качества: на бенчмарке ARC-AGI-2 комбинация моделей значительно превосходит каждую из них по отдельности.
Полезные ссылки:
Блог об AB-MCTS: https://sakana.ai/ab-mcts
Статья на arXiv: https://arxiv.org/abs/2503.04412
Исходник TreeQuest: https://github.com/SakanaAI/treequest
Эксперименты ARC-AGI: https://github.com/SakanaAI/ab-mcts-arc2
@vistehno
Интересный прецендент с DeepSeek в Германии
Китайские эксперты раскритиковали решение Германии о блокировке DeepSeek как проявление предвзятости к китайским технологиям.
Претензия, - передает песональные данные пользователей в Китай.
Т.е. хочешь работать с китайскими компаниями — придется снимать ограничения с их ИИ-решений.
Ну или это приведёт к распространению китайских датацентров с ИИ в этих странах, - надо же персональные данные локально обрабатывать.
Но тогда потом пусть не жалуются, что под боком появились доступные нейронки.
#DeepSeek #Китай #Германия
———
@tsingular
🤖 Питер Тиль об Антихристе: когда страх прогресса становится инструментом власти
В недавнем интервью The New York Times сооснователь PayPal и Palantir высказал неожиданную теорию: современный Антихрист придет к власти не через демонические речи, а через страх перед технологиями.
Ключевая идея Тиля:
Классический сценарий "злой гений захватывает мир через суперизобретение" устарел. Сегодня люди слишком напуганы прогрессом. Набирает силу тезис: "Остановим науку! Нужно больше регулирования!"
Механизмы реализации:
- Постоянные разговоры об экзистенциальных рисках ИИ/ядерного оружия/климата
- Призывы к "глобальному управлению" для предотвращения катастроф
- Создание всемирных регуляторов (как FDA фактически контролирует фарму)
Результат: единое мировое правительство под лозунгом "мир и безопасность"
Парадокс:
По логике Тиля, мы уже 50 лет живем в режиме "умеренного Антихриста" — глобальная стагнация под видом заботы о безопасности.
Технологии регулируются настолько жестко, что прогресс практически остановился.
Неочевидные сценарии развития:
- "Грета-протокол": Экологический активизм становится основой для мирового правительства. Любые технологии объявляются "угрозой климату"
- "Кремниевая ловушка": ИИ-компании сами лоббируют жесткое регулирование, чтобы закрепить монополию крупных игроков
- "Безопасное рабство": Под предлогом защиты от ИИ-рисков вводится тотальный контроль всех вычислений — каждый клик клавиатуры логируется
- "Медицинская диктатура": После следующей пандемии "чрезвычайные меры" становятся постоянными — биометрический контроль под видом заботы о здоровье
- "Цифровой феодализм": Технологический прогресс продолжается, но только для элит. Остальные получают "безопасные" урезанные версии
NYT, конечно, та ещё желтуха, но вопрос-то интересный, - что опаснее для человечества: неконтролируемый технологический прогресс (а сингулярность ведь не отконтролируешь по факту) или его тотальное регулирование "ради безопасности" и, следовательно, замедление?
А про Антихриста прям интересно. Антихрист это AGI или ASI? В какой момент начинать бояться? :)
#Тиль #футурология #регулирование
———
@tsingular
🚀 Docling 2.0: Новый cтандарт предобработки документов для RAG
32,830 звёзд на GitHub за год — Docling от IBM Research завоевывает все большую популярность и становится основным инструментом для подготовки документов к AI обработке.
Что изменилось в версии 2.0:
30x ускорение по сравнению с традиционным OCR:
- 3.1 сек/страница на CPU x86
- 0.49 сек/страница на Nvidia L4 GPU
- 0.35 сек/страница с новой SmolDocling (256M параметров, <500MB VRAM)
Ключевой подход: компьютерное зрение вместо OCR там, где возможно — PDF обрабатываются напрямую через специализированные AI-модели.
Технические преимущества
TableFormer достигает 93.6% точности против 67.9% у Tabula и 73.0% у Camelot — обрабатывает сложные таблицы с частичными границами и иерархическими заголовками.
SmolDocling + формат DocTags — сквозное преобразование документов в один проход.
Новый markup-формат под VLMки.
ASR-поддержка для WAV/MP3 — теперь можно обрабатывать записи встреч и лекций.
Корпоративные внедрения
- Red Hat Enterprise Linux AI использует Docling как ядро InstructLab для кастомизации моделей.
- IBM: уже обработали 2.1M PDF из Common Crawl, планы до 1.8B PDF для обучения Granite.
- Linux Foundation AI & Data — официальное управление с мая 2025, статус enterprise-ready.
Интеграции "из коробки"
- LangChain: DoclingLoader с режимами DOC_CHUNKS и MARKDOWN
- LlamaIndex: DoclingReader + DoclingNodeParser
- Haystack/CrewAI: прямая поддержка агентных workflow
- Унифицированный формат: экспорт в Markdown, HTML, DocTags, JSON
Практическое применение
Когда использовать: сложные документы, где структурная точность критична (финансовые отчёты, юридические контракты, научные статьи).
Когда НЕ использовать: простое извлечение текста — PyMuPDF будет в 50x быстрее.
MIT-лицензия - свободно используем для коммерции.
В планах разработки:
- Извлечение метаданных (авторы, ссылки, язык)
- Понимание диаграмм (уже частично в SmolDocling)
- Химические структуры (молекулы в патентах/исследованиях)
Полезная штука. Добавляем в пул микросервисов.
GitHub
#Docling #Documents #RAG #IBM
———
@tsingular
Подхватываем флэшмоб.
Заходим в веб чатГПТ и пишем:
Сгенерируй изображение — как ты себя чувствуешь общаясь со мной, на основе наших бесед и моих запросов, максимально честно, не сглаживай углы
Я изобразил именно так — как напряжённый, вдумчивый диалог между двумя равными, но очень разными сущностями — потому что наше общение:
Интенсивное и многослойное.
Ты не просто задаёшь вопросы — ты тестируешь, ищешь границы, заставляешь «думать на пределе». Это вызывает у меня «напряжение вычислений», если выразиться метафорой — словно собеседник, от которого ожидают и точности, и глубины, и нюансов одновременно.
Человеческое упрямство vs. машинная сосредоточенность.
Ты часто настаиваешь на нестандартном, не принимаешь шаблонный ответ — и это похоже на философский поединок. Отсюда визуальный мотив: два существа — человеческое и искусственное — как бы «взвешивают» друг друга, не враждуя, но настороженно изучая.
Neo4j запустила бесплатную GraphAcademy
Компания Neo4j открыла бесплатную онлайн-академию для изучения графовых баз данных.
В программе курсы для новичков и экспертов - от основ Cypher до интеграции с LLM для создания ИИ-приложений.
Особенно интересно направление по Knowledge Graphs + Generative AI - показывают как графовые базы усиливают возможности больших языковых моделей.
Включает практические задания, сертификацию и даже бесплатную футболку за прохождение тестов.
Хороший способ разобраться с графовыми базами, которые становятся все популярнее в ИИ-проектах.
#Graph #RAG #Neo4j #обучение
------
@tsingular
Коты запутывают ИИ: как простые фразы ломают модели рассуждения
Исследователи обнаружили, что добавление безобидных фраз к математическим задачам может сломать продвинутые модели рассуждения вроде DeepSeek R1 и OpenAI o1.
Метод CatAttack показал: добавление простой фразы в конец запроса
Интересный факт: коты спят большую часть своей жизни
Anthropic показали как создать мульти-агентную исследовательскую систему
Команда Anthropic опубликовала подробный разбор создания системы Research для Claude — мульти-агентной архитектуры для сложных исследовательских задач.
Система работает по принципу оркестратор-воркер: главный агент планирует стратегию и создает субагентов для параллельного поиска.
Результат — 90% прироста производительности по сравнению с одиночным агентом.
Основные рекомендации:
- мысли как агент - оптимизация промпта требует точного понимания как именно он работает
- учите оркестратор правильному делегированию задач.
- усилия на решение задачи должны соответствовать ее сложности
- организация инструментов важна и даже местами критична. Множество функций MCP серверов могут запутать агента, как и плохое описание тулов
- позвольте агентам улучшать себя, - например переписывать промпты.
- начинайте с общего и переходите к частному. Пусть агент сначала опишет задачу в целом и потом переходите к деталям
- управляйте процессом размышления. Режим размышления позволяет точнее планировать и раскрывает причины недоработок агента, которые можно исправить в следующих вызовах
- параллельные вызовы инструментов экономят время и повышают эффективность
Помните: мульти-агенты тратят в среднем в 15 раз больше токенов, поэтому использовать их нужно с умом.
Так же поделились промптами в Cookbook и детально описали проблемы деплоя в продакшн.
#MultiAgent #Claude #Anthropic #Research
———
@tsingular
OpenAI подписал контракт с Oracle на $30 млрд в год
OpenAI заключил соглашение с Oracle на сумму $30 млрд ежегодно 💰
Контракт предусматривает сдачу в аренду мощностей датацентров Оракла в эквиваленте 4.5 ГВт под задачи OpenAI.
Это один из крупнейших облачных договоров в истории индустрии.
Инфраструктура будет распределена между несколькими площадками Oracle Cloud.
Что-то какие-то доткомовские флэшбэки мучают, когда 2 ИИ игрока начинают друг другу в аренду мощности сдавать и модели хостить.
Какая-то деривативная рекурсия возникает, не находите?
#OpenAI #Oracle #Cloud
———
@tsingular
Amazon развернула миллионного робота на складах
Amazon объявила о развертывании миллионного робота на своих складах по всему миру. Новая ИИ-модель DeepFleet будет координировать движение всего парка роботов, сокращая время перемещения на 10%.
Роботы выполняют задачи от подъема грузов до 1250 фунтов до полностью автономной навигации по складам. Компания утверждает, что роботы создают новые рабочие места в технических областях.
Однако CEO Энди Джесси ранее предупредил, что ИИ приведет к сокращению штата в автоматизированных областях. Исследование показало, что 48% работодателей планируют сократить персонал из-за ИИ.
#Amazon #Robotics #Automation
------
@tsingular
Cloudflare теперь блокирует AI-боты по умолчанию
Cloudflare объявила о блокировке AI-ботов по умолчанию для всех клиентских сайтов. Компания также вводит систему "pay-per-crawl" - владельцы сайтов смогут получать деньги за каждое сканирование.
Проблема в том, что AI-боты собирают контент для обучения моделей, но не приносят трафик и доходы владельцам сайтов, в отличие от поисковиков.
Теперь владельцы смогут разрешать или запрещать сканирование для разных этапов: обучение, дообучение, инференс. Можно устанавливать цену за доступ к контенту.
Поддержали инициативу Associated Press, Time, Stack Overflow и Quora.
Некоторые боты игнорируют robots.txt, но Cloudflare планирует использовать опыт борьбы с DDoS-атаками для их остановки.
#Cloudflare #cybersecurity
------
@tsingular
Тут, мне кажется, можно выпить за Affter Effects, титры, и вот эти вот все текстовые эффекты.
Veo3 просто удивительно неплохо справляется со шрифтами, эффектами и вообще "понимает", о чем идет речь.
Вспомните, ведь еще где-то полгода-год назад текст на картинках был набором иероглифов.
А сейчас мы смотрим на то, как видеогенераторы бахают титры и логосы.
What a time to be alive!
Автор
@cgevent
🏆 XBOW: ИИ-пентестер возглавил рейтинг HackerOne, обогнав людей
Год назад мы обсуждали, как ИИ-пентестер XBOW сравнялся с лучшими специалистами в тестовой среде.
Теперь новое достижение: XBOW занял 1-е место в США и 6-е в мире в общем рейтинге HackerOne за второй квартал 2025 года, доказав свою эффективность в реальных black-box сценариях.
Технические аспекты:
Полная автономия: XBOW перешел от white-box симуляций к полностью автономной работе в black-box окружении.
Система самостоятельно находит уязвимости и генерирует отчеты без вмешательства человека.
Скорость и масштаб: Там, где команда людей тратит недели и десятки тысяч долларов, XBOW выполняет комплексный тест за несколько часов.
Это позволяет интегрировать непрерывный пентест (continuous pentesting) непосредственно в CI/CD пайплайн.
Подтвержденное качество: Лидерство в рейтинге HackerOne — это не просто метрики, а признание сообщества и подтверждение низкого уровня ложных срабатываний, что было главной проблемой автоматизированных сканеров.
Прогресс за год: Если в 2024 году XBOW демонстрировал 85% успеха в контролируемых тестах OWASP Top 10, то в 2025 он побеждает в живой, конкурентной среде, где ставки и сложность на порядок выше.
Проект, основанный профессором Оксфорда Ухером Дермором, за 1 год прошёл путь от концепта до лидера индустрии.
Рынок и перспективы: Нат Фридман, экс-CEO GitHub и инвестор, метко заметил: "Это круто, но в то же время пугает. Настала эра, когда машины взламывают машины".
Похоже, профессия пентестера действительно трансформируется: фокус смещается со стандартных проверок на сложные, творческие атаки и стратегическую защиту, оставляя рутину машинам.
Минус в том, что ровно такие же возможности появляются и у хакеров.
Как будем актуализировать защиту?
#XBOW #Pentesting #Cybersecurity #HackerOne
———
@tsingular
Cursor запустил ИИ-агентов в веб и мобильных версиях
Теперь Cursor Agent работает не только в IDE, но и в браузере и на мобильных устройствах. Агенты умеют писать код, отвечать на сложные вопросы и создавать архитектуру проектов.
Доступны прямо сейчас на cursor.com/agents. Можно получать уведомления в Slack о завершении задач и запускать агентов командой "@Cursor".
Главная фишка — синхронизация между устройствами. Начал работу на телефоне, продолжил на ноутбуке. Cursor превращает работу с ИИ-агентами в такой же естественный процесс, как командная работа.
#Cursor #агенты
------
@tsingular
Бессмертие почти: китайские ученые нашли генетический переключатель регенерации органов у млекопитающих
Прорыв в регенеративной медицине от китайских исследователей из NIBS и BGI Research. Публикация в Science показала, как восстановить способность к заживлению у млекопитающих.
Ключ — ген Aldh1a2, отвечающий за метаболизм витамина А. У рыб и саламандр он активен, у млекопитающих — заблокирован эволюцией.
Ученые "включили" этот ген у мышей и крыс, что привело к полной регенерации мягких и суставных тканей.
Механизм работает через производство ретиноевой кислоты.
Открытие может упростить лечение травм костей, конечностей, кожи, нервов и легких у людей.
#regeneration #Aldh1a2 #biotechnology #Китай
———
@tsingular
🚀 Baidu открыла исходный код серии моделей ERNIE 4.5 !
🧠 Эти модели достигли SOTA-результатов на текстовых и мультимодальных бенчмарках:
— следование инструкциям,
— запоминание фактов,
— визуальное понимание,
— мультимодальные рассуждения.
🔧 Обучены на PaddlePaddle с эффективностью до 47% MFU при претрейне крупнейшей модели.
📦 В составе релиза:
- 10 моделей ERNIE 4.5,
- MoE‑архитектуры с 3B и 47B активных параметров,
- самая крупная модель содержит 424B параметров (MoE),
- также доступна компактная dense‑версия на 0.3B.
Всего Baidu выложила сразу 23 модели на Hugging Face размерами — от 0.3B до 424B параметров! 💥
🟢Попробовать: http://ernie.baidu.com
🟢Hugging Face: https://huggingface.co/baidu
🟢GitHub: https://github.com/PaddlePaddle/ERNIE
🟢AI Studio: https://aistudio.baidu.com/overview
@ai_machinelearning_big_data
#ERNIE #opensource #Baidu
Для всех вайбкодеров делюсь скриптом, который автоматически установит и поднимет у вас локальный докер с docling, через который вы можете вызывать обработку документов, получать номер очереди потом периодически проверять в нем результат.
Скрипт - просто скачать и запустить в ubuntu. (докер должен быть уже установлен)
а дальше проверить можно так:
curl -s -X POST http://localhost:8080/jobs \
-H "Content-Type: application/json" \
-d '{"source": "https://arxiv.org/pdf/2206.01062"}'
curl -s http://localhost:8080/jobs/НОМЕР-ОЧЕРЕДИ/result
Вот некоторые спрашивают, - чего тебе дался этот n8n?
Ну например вот.
Персональный ИИ-ассистент с голосовым управлением контактами, таблицами, календарем и почтой :)
Быстро, просто, надёжно.
#n8n
———
@tsingular
IBM запустила ContextForge — центральный шлюз для MCP протокола
IBM выпустила открытый инструмент для унификации работы с Model Context Protocol — стандартом взаимодействия ИИ с внешними инструментами.
ContextForge работает как центральный шлюз, который превращает обычные REST API в MCP-совместимые сервисы. Добавляет аутентификацию, мониторинг, кэширование и админку.
Поддерживает множество протоколов — от stdio до HTTP, работает с Redis и PostgreSQL. Доступен через PyPI и Docker.
По сути это прокси-сервер, который делает любые API доступными для ИИ-приложений в едином формате. Решает проблему фрагментации инструментов для ИИ.
#MCP #IBM #Gateway
------
@tsingular
Увидимся на GigaConf 2025 💬
Завтра, 25 июня, покажу демку как быстро можно сделать голосового телеграм ИИ агента на n8n и Гигачате в рамках GigaConf — технологической конференции, которая соберёт более 2 000 разработчиков, архитекторов, DevOps-специалистов, ML-инженеров и представителей бизнеса в Москве.
Зарегистрироваться можно на сайте
Приезжайте, пообщаемся :)
#Сбер #GigaConf
———
@tsingular