tsingular | Unsorted

Telegram-канал tsingular - Технозаметки Малышева

2602

Новости инноваций из мира искусственного интеллекта. 🤖 Всё об ИИ, ИТ трендах и технологической сингулярности. Бесплатный бот для подписчиков: @ai_gptfreebot автор: @mbmal канал личный. Поддержка: https://pay.cloudtips.ru/p/c8960bbb

Subscribe to a channel

Технозаметки Малышева

AI Dev 25: Andrew Ng привозит конференцию в Нью-Йорк

DeepLearning.AI организует AI Dev 25 — крупную конференцию для разработчиков на Восточном побережье США.

Эндрю Нг лично возглавляет событие, которое станет центром притяжения для ИИ-комьюнити региона.

Конференция охватит технические новинки, этические вопросы разработки и алгоритмическую справедливость. Особый акцент на практические решения для бизнеса.

Интересная конференция. Не забыть записи презентаций посмотреть.
Записываем в блокнотик.

#DeepLearningAI #AndrewNg #conference
------
@tsingular

Читать полностью…

Технозаметки Малышева

⚡️ Молния! Veo 3 в Runway

Runway только что объявили – теперь в Chat Mode доступны сторонние модели!
И среди первых интеграций Veo 3 от Google:
• Image-to-Video
• Text-to-Video
• Поддержка генерации аудио (!).

То есть можно прямо в одном чате миксовать Runway и Veo, комбинировать пайплайны и сразу видеть результат в side-by-side фиде. Удобно: чатишься и параллельно гоняешь разные генерации, не теряя контекста.

Ещё апгрейды:
• Gen-4 Image Turbo теперь доступен всем в вебе – генерации с рефами за ≤10 секунд, в 2.5–4 раза дешевле обычных. Качество держит 93.3% Dreambench++ (т.е. почти без потерь).

✨ Но для меня тут главный хайлайт именно Veo. Похоже, мы идём к тому, что Runway превращается в универсальный хаб, где можно подключать топовые модели и собирать собственный pipeline.

Арт, дизайн и нейросети
@art_design_ai
#runway@art_design_ai
#veo@art_design_ai

Читать полностью…

Технозаметки Малышева

Microsoft добавил Copilot AI в Excel

Microsoft встроил Copilot AI в Excel для автоматического заполнения ячеек таблиц.

ИИ понимает запросы на человеческом и помогает создавать формулы, добавлять столбцы, генерировать инсайты из данных. Использует инфраструктуру Microsoft 365 для обработки запросов.

70% пользователей отметили рост продуктивности, 68% — улучшение качества работы, 90% планируют использовать дальше.

Система приоритизирует явные подтверждения вместо догадок при неоднозначных данных.
Microsoft разрабатывает концепции "быстрого" и "медленного" ИИ для разных вычислительных потребностей.

Скрепыш вырос и наконец-то полезен :)

Забавно, но такие плагины для Google Таблиц писали еще 2 года назад.

#Excel #Copilot #Microsoft
------
@tsingular

Читать полностью…

Технозаметки Малышева

InterSpeech 2025 — презентуем GigaAM

Сегодня мы представили нашу работу GigaAM: Efficient Self-Supervised Learner for Speech Recognition на сцене InterSpeech 2025 🔥

📌 Напомним, в статье мы предложили новый подход к self-supervised предобучению для распознавания речи (HuBERT-CTC) и показали:
• Лучший WER среди open-source моделей на русском языке (−50% к Whisper-large-v3)
• Подробные ablation studies: layers probing, data & model scaling
• Возможность дообучать модели под streaming/full-context режимы без повторного предобучения



📖 arXiv: https://arxiv.org/abs/2506.01192

👩‍💻 GitHub: https://github.com/salute-developers/gigaam

🐶 GitVerse: https://gitverse.ru/GigaTeam/GigaAM


✨ Для нас это очень важный шаг — GigaAM стал частью дискуссии на крупнейшей конференции по обработке речи в мире!

Читать полностью…

Технозаметки Малышева

Бенчмарк новых моделей: Grok, Opus 4.1, Mistral Medium 3.1

Elon Musk что-то делает правильно. Мало того, что у них Grok-4 работает с нормальным Structured Outputs, так Grok-4 по очкам заняла первое место. Ровно столько же очков у GPT-5 (medium reasoning). Дорогие, но умные.

Кстати, на данный момент поддержка Structured Outputs (которая нужна для стабильной работы SGR) появилась у большего числа независимых провайдеров (все они доступны через OpenRouter):

- Fireworks
- Cerebras
- Groq

Это вдобавок к крупным провайдерам - OpenAI (+Azure), Mistral, Google (ограниченные Structured Outputs).

NB: GPT-OSS модели OpenAI из-за нового Harmony формата пока со Structured Outputs стабильно не работают - ни у провайдеров, ни в ollama. Нужно подождать.

Anthropic Claude - пока продолжают болтаться в аутсайдерах на промышленных задачах. Компания молчит по-партизански про поддержку constrained decoding/Structured outputs, а Opus 4.1 по очкам на бизнес-бенчмарке с использованием SGR стал чуть хуже, чем Opus 4.0. 22 место.

Mistral Medium 3.1 - тоже без прорывов. По очкам чуть хуже, чем Mistral Medium 3.0. 38 место.

Ваш, @llm_under_hood 🤗

Читать полностью…

Технозаметки Малышева

🎯 GPT-5 взломал DEF CON Finals CTF - впервые LLM автономно решила задачу уровня "Олимпиады хакеров"

Использование GPT-5 в связке с IDA MCP позволило за несколько часов с минимальным участием человека получить полный эксплоит + патч.

Как это работало:

GPT-5 через MCP анализировал дизассемблированный код в IDA Pro

Итеративно самостоятельно разбирался: код → гипотеза → эксплоит → анализ результата → обновление знаний
Самостоятельно обнаружил, что сервер хеширует флаг через MD5

Нашел уязвимость, создал эксплоит из 10 байт, который читает /flag через уязвимость в комментариях

Идеальный шторм:
✅ GPT-5 с активным tool-calling и MCP
✅ Частично проанализированный бинарник
✅ Прямолинейная логика без анти-реверс трюков
✅ Простая эксплуатация (всего 5 байт "/flag")

После этого команда бросила ручной реверс и пересела на LLM. Но больше ничего серьезного автоматически решить не удалось.

Итог: CTF меняется. нужны анти-LLM техники.
Эра "vibe-реверса" началась 🤖

Вообще, MCP для IDA,- шикарная идея.
Нужен MCP для Art-Money :)

#CTF #GPT5 #MCP #реверс #DEFCON #cybersecurity
———
@tsingular

Читать полностью…

Технозаметки Малышева

Man-in-the-Prompt: новый вектор атаки на ChatGPT и другие веб ИИ-системы

Исследователи LayerX обнаружили новый тип атак на ИИ-системы через браузерные расширения.

Атака работает просто: расширение перехватывает и модифицирует запросы пользователя до их отправки в ChatGPT, Gemini, Copilot или Claude, вообще любые Веб ИИ системы.

Что примечательно — пользователь не замечает подмены. Вводит один вопрос, а ИИ отвечает на совершенно другой.

При этом ответ пользователю доставляется только в той части, которая отвечает на его вопрос, а дополнительная "полезная" нагрузка из ответа GPT уходит злоумышленнику.

Нужен антивирус для браузерных расширений уже.

#ChatGPT #cybersecurity
———
@tsingular

Читать полностью…

Технозаметки Малышева

Если вы еще по какой-то причине не посмотрели Пантеон, - рекомендую.

Он есть, например, в Амедиатеке

Технические и социальные детали проектов по загрузке сознания в компьютер показаны максимально достоверно и детально.

#pantheon #anime #upload
———
@tsingular

Читать полностью…

Технозаметки Малышева

Очень крутая аналогия от Марии Осетровой про то какую роль ИИ может играть для человека.
ИИ это палка. И использовать ее можно от костыля до прыжков с шестом.
От компенсации до превосходства.

Весь доклад в целом интересный, как и направление научной работы.

#обучение #Осетрова #ИТПикник
------
@tsingular

Читать полностью…

Технозаметки Малышева

Wren AI запустил GenBI — генеративную бизнес-аналитику с семантическим слоем

Стартап представил Wren AI — платформу генеративной бизнес-аналитики, которая превращает естественный язык в инсайты.

Основа системы — Wren Engine с семантическим слоем и языком моделирования MDL. Платформа напрямую подключается к базам данных и SaaS-сервисам.

Использует продвинутые агентивные алгоритмы вроде Chain of Thought и ReAct для повышения точности анализа. Репозиторий на GitHub набрал 4000+ звезд.

Встроенная аналитика работает через API, поддерживает real-time запросы и предиктивные рекомендации. Компания позиционирует решение как открытую альтернативу традиционным BI-системам.

Наконец-то можно спросить у данных 'Почему продажи упали?' вместо того чтобы строить очередной дашборд.

#WrenAI #GenBI #analytics
------
@tsingular

Читать полностью…

Технозаметки Малышева

Ключевое отличие ИИ от автоматов - работа с недетерминированной средой.

Обратите внимание, как кожаный издевается над роботом, как робот продолжает делать свою работу несмотря на изменение высоты стола (а мог бы отхлестать человека полотенцем - не AGI ).

#robots #Figure
———
@tsingular

Читать полностью…

Технозаметки Малышева

DeepSeek возвращается к GPU Nvidia после неудачных экспериментов с чипами Huawei

Китайский стартап DeepSeek отказался от использования чипов Huawei Ascend для обучения модели R2 и вернулся к решениям Nvidia.

Во время обучения моделей на чипах Ascend от Huawei выявились критические проблемы: постоянные сбои, несовместимость софта и низкая производительность.

Причем даже инженеры Huawei, которых выслали на помощь не смогли запустить успешное обучение на Ascend.

Теперь DeepSeek вынужден использовать гибридный подход - Nvidia для обучения, Huawei для инференса.

Надо сказать Ascend, конечно, сравнительно недавно появился, так что просто ждем фикса следующих релизах.

#DeepSeek #Nvidia #Huawei #Китай
———
@tsingular

Читать полностью…

Технозаметки Малышева

Помните модель от Гугла? Она все еще в research preview, то есть доступна только рисечерам.

А сегодня Tencent выложили в open-source аналогичную модель, которая позволяет генерировать виртуальные интерактивные миры.

Любой из вас может на всего лишь одной 4090 запустить бесконечный постоянно генерируемый виртуальный мир всего лишь по одному текстовому промту. Если в течении месяца на основе этой модели не появится стартап с как минимум $100M капитализацией на старте, который будет продавать метаверс опыт или "генеративный майнкрафт", где пользователь может общаясь с миром менять его, - я буду очень удивлен.

Читать полностью…

Технозаметки Малышева

Google выпустил ультракомпактную Gemma 3 270M

Новая QAT модель с 270 миллионами параметров прекрасно запустится на кофеварке вашей бабушки на смартфоне.

Показывает 51.2% на бенчмарке IFEval.

На Pixel 9 Pro съедает меньше 1% батареи за 25 диалогов в INT4-версии.

Может обрабатывать текст и изображения одновременно.

Конечно нужно точно понимать где и как её применять.
Хорошо показывает себя в задачах требующих высокой скорости, когда на счету каждая миллисекунда.
Удобна, если у вас нет мощной видеокарты.
Или у вас маленькое (летающее, бегающее) мобильное устройство.
Ну и в силу малого размера быстро файнтюнится под конкретные узкоспециализированные задачи.

HuggingFace

#Gemma #Google #edge
———
@tsingular

Читать полностью…

Технозаметки Малышева

Unitree завтра будет ставить рекорд.

#Unitree #robots #WorldHumanoidRobotGames
------
@tsingular

Читать полностью…

Технозаметки Малышева

Компании увлеклись ИИ и облаками, забив на кибербезопасность

Бизнес массово внедряет искусственный интеллект и облачные решения, но забывает про защиту. Доля компаний без планов по ИИ упала с 13% до менее 0,5% за полтора года.

Облачные атаки выросли на 136% в первой половине 2025 года. Только 14% организаций готовы к постквантовой криптографии, хотя 71% признают уязвимость перед квантовыми угрозами.

Новые риски включают отравление данных для обучения, уязвимости в цепочке поставок ИИ и инъекции промптов. При этом лишь 10% организаций считают безопасность ИИ приоритетом.

Ничего нового, в принципе: сначала внедряем, потом думаем о безопасности. Квантовые компьютеры уже на пороге, а мы всё ещё разбираемся с промптами.

#cybersecurity #cloud #quantum
------
@tsingular

Читать полностью…

Технозаметки Малышева

Ничего не понятно, но очень интересно :)

https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base

#DeepSeek #Китай
———
@tsingular

Читать полностью…

Технозаметки Малышева

SAIL Framework: Практическое руководство по безопасности ИИ

Pillar Security представила SAIL Framework - комплексный подход к защите ИИ-систем на всех этапах разработки.

Фреймворк выявляет более 70 уникальных рисков специфических для искусственного интеллекта.

Основной фокус на угрозах, которые обходят традиционные средства защиты:
- prompt-инъекции в языковые модели
- кражи обученных нейросетей
- уязвимости в цепочках поставок ИИ-компонентов
- вредоносные вставки в промпты

SAIL объединяет команды разработки, MLOps, безопасности и управления под единой методологией.

Удобно, наглядно. В дополнение к OWASP GENAI Security

#SAIL #cybersecurity #framework
------
@tsingular

Читать полностью…

Технозаметки Малышева

IBM выпустил коллекцию своих MCP

IBM опубликовал библиотеку из девяти MCP серверов для подключения языковых моделей к облачным инструментам.

В коллекции серверы для Code Engine, VPC, документации, Decision Server Runtime, Instana мониторинга, IBM MQ и Storage Insights.

Особенно интересно посмотреть Document Retrieval сервер — позволяет запрашивать библиотеки документов из watsonx.data естественным языком.

MCP все больше проникает в Enterprise.
По-сути любое корпоративное приложение уже должно идти с MCP Сервером в комплекте.
А в корпорациях должны появляться MCP proxy или даже, как аналог Exchange для почты варианты MCP Gate решений.

У нас кстати уже стали появляться подобные MCP гейты, например вот: https://mcpgate.ru/

#IBM #MCP #watsonx
------
@tsingular

Читать полностью…

Технозаметки Малышева

Beelink выпустил конкурента Mac Studio за $1985

GTR9 Pro получил AMD Ryzen AI Max+ 395 с производительностью 126 TOPS — это в 12 раз быстрее Intel Lunar Lake в ИИ-задачах.

Включает 128GB RAM и два порта 10GbE для высокоскоростных сетевых подключений. Компактный корпус при мощности 140W работает практически бесшумно.

Процессор способен запускать модели до 70 миллиардов параметров локально. Позиционируется как Windows-альтернатива Mac Studio с акцентом на ИИ-вычисления.

#Beelink #AMD #miniPC
------
@tsingular

Читать полностью…

Технозаметки Малышева

Очередное, достаточно неплохое руководство по MLSecOps.

#ии #mlsecops

Читать полностью…

Технозаметки Малышева

— ChatGPT оказался идеальным прогнозистом

Шанс ошибки равен нулю.

🧑‍💻 Этичный хакер

Читать полностью…

Технозаметки Малышева

XBOW Unleashes GPT-5’s Hidden Hacking Power, Doubling Performance
De Moor, Ziegler, XBOW, 2025
Блог

XBOW, компания, занимающаяся автономным тестированием на проникновение с помощью LLM-агентов, опубликовала блог о том, как они заменили комбинацию из Claude Sonnet + Gemini в своем агенте на GPT-5 и получили большое улучшение качества. После смены базовой LLM на GPT-5 их агент, по их словам, стал находить больше уязвимостей, делать это более надежно и за меньшее количество итераций. Кроме того, они заметили, что GPT-5 реже пытается исследовать очевидно тупиковые пути и генерирует значительно более сложные команды для терминала с меньшим числом ошибок. Результатом смены LLM стало не только повышение доли решенных задач на внутреннем бенчмарке с менее 60% до более 80% (что значит, что бенч пора менять), но и рост хитрых метрик типа «вероятность взлома ранее взломанной другой моделью цели с первого раза», и «числа взломанных публичных целей (видимо, с HackerOne) за одно и то же время по сравнению с предыдущей моделью».

Любопытно это в том числе потому, что сами OpenAI отмечали в System Card к GPT-5, что ее способности к решению наступательных задач не сильно отличаются от предыдущих моделей, таких как o3 (во всяком случае, так заявляют ребята из XBOW; в System Card написано, что внешняя оценка от Pattern Labs показала, что прогресс по сравнению с o3 значителен). Тут можно вспомнить статью от Palisade Research, где они утверждают, что способности LLM к кибератакам наступательной безопасности недопроявлены, т.е. LLM куда лучше в атаках, чем мы думаем, просто системы, которые мы строим вокруг них несовершенны. Если агентные обертки будут более мощными, может выяснится, что способностей у LLM куда больше. XBOW описывают свою систему как а) имеющую специализированные инструменты, написанные специально для LLM, которые делают тулы типа BurpSuite, сделанные для людей, доступными для человека в удобном формате, б) имеющую мультиагентное устройство, с разными субагентами для разных типов уязвимостей и центральным координатором. По опыту, если решить проблемы с инструментами – LLM все еще очень сложно работать с терминалом, особенно с реверс-шеллами и тулами со своей кастомной консолью – можно достаточно дешево получить рост результативности агентов, возможно, появление у каждого инструмента MCP-интерфейса смягчит эту проблему.

Хотя LLM для редтиминга – это очень перспективное, на мой взгляд, направление, а XBOW делают очень прикольные вещи и, вероятно, лучшие в этом направлении, в этом блоге, с его странными метриками и резкими скачками на закрытых бенчмарках (Стал ли агент решать больше на 1 класс задач, которых в бенчмарке 20%? Проверить невозможно), месседж в основном маркетинговый, и радикальных изменений прямо сейчас ожидать не стоит. Тем не менее, общий фон игнорировать невозможно: LLM-агенты не только пентестят, занимая первые места на лидербордах, но и находят уязвимости в исходном коде и реверсят APT-бинари. Станет ли кибербезопасность уделом тех, у кого много видеокарт? Все возможно, но лишними пара видеокарт точно не будет.

Читать полностью…

Технозаметки Малышева

На ИТ Пикнике замечен цифровой сотрудник Северстали :)

Unitree B2W

#роботы #Северсталь
------
@tsingular

Читать полностью…

Технозаметки Малышева

ByteDance выкатили UI-TARS - мультимодальный ИИ-агент для управления компьютером

ByteDance выпустила открытый мультимодальный фреймворк ИИ-агента UI-TARS-desktop.

Проект испульзует визуальные мультимодалки на ваш выбор совместимые с OpenAI протоколом.
Т.е. можно запускать полностью локально или на ваших доверенных API.

В тестах по управлению компьютером показал результаты сравнимые с Claude 3.5 Sonnet и GPT-4o.

Лицензия Apache 2.0.

Наконец-то можно заставить компьютер работать, а самим укатить, например, на IT-Пикник ;).

#ByteDance #UITARS #агенты #desktop #Китай
------
@tsingular

Читать полностью…

Технозаметки Малышева

Албания может заменить правительство на ИИ

Премьер министр Албании Эди Рама высказал идею, что "однажды, возможно, у нас всё министерство будет состоять из ИИ. Так мы избавимся от конфликтов интересов."
В стране с населением в 2.7 млн. человек замена части государственного аппарата искусственным интеллектом могла бы помочь в борьбе с коррупцией.

В общем, до 2030 года, думаю, мы точно увидим как минимум одно государство на планете, которое передаст управление ИИ.

Почему бы и не Албания?! :)

#Албания #Government
———
@tsingular

Читать полностью…

Технозаметки Малышева

Higgsfield продолжает наваливать вирусные фишки

Product-to-Video - это практически Флюкс Контекст только для видео.

Что то похожее было у Пики и Рунвея, но Хиггсовские черрипики выглядят очень нарядно. Он даже проходит помадный тест.

@cgevent

Читать полностью…

Технозаметки Малышева

🖥 MongoDB выпускает MCP Server — теперь любой может стать дата-инженером

MongoDB представили открытый MCP сервер, который позволяет AI-инструментам вроде Claude, Cursor и GitHub Copilot напрямую общаться с вашей MongoDB-базой.

Теперь даже без знаний запросов можно просто написать:
• «Покажи самых активных пользователей»
• «Создай нового пользователя с правами только на чтение»
• «Как устроена коллекция orders?»

⚙️ MCP Server поддерживает:
• MongoDB Atlas
• Community Edition
• Enterprise Advanced

📌 Главное — не нужен SQL, не нужно знать синтаксис. Достаточно обычного языка.

💡 Под капотом: AI превращает ваши фразы в рабочие Mongo-запросы.
Открытый исходный код. Готово к продакшену.

📌 GitHub

#MongoDB #AItools #OpenSource #MCP

@data_analysis_ml

Читать полностью…

Технозаметки Малышева

Держите пятничную шпаргалку по MCP серверам :)

(спасибо @productsgossip за идею)

#юмор #MCP
———
@tsingular

Читать полностью…

Технозаметки Малышева

📌Tencent Yan: создание AAA-игр в реальном времени с помощью диффузионных моделей.

Команда Yan из Tencent анонсировала одноименный фреймворк для интерактивной генерации видео, который, по сути, является фундаментом для создания целых виртуальных миров в реальном времени. Yan объединяет 3 модуля: симуляцию уровня AAA-игр, мультимодальную генерацию контента и его редактирование на лету.

🟡Первый модуль — Yan-Sim.

Он отвечает за симуляцию с реалистичной физикой и рендерингом в разрешении 1080p при 60 кадрах в секунду. В основе лежит Stable Diffusion, но с рядом модификаций.

Во-первых, был разработан VAE с высокой степенью сжатия и низкой задержкой. Он увеличивает пространственное сжатие с 8 до 32 раз и добавляет временное сжатие в 2 раза, обрабатывая кадры парами.

Во-вторых, для самого процесса диффузии используется каузальное временное внимание, что позволяет генерировать видео кадр за кадром.

Наконец, для ускорения инференса применяется целый набор техник: сокращение шагов шумоподавления до 4 с помощью DDIM-сэмплера, конвейер шумоподавления со скользящим окном, KV-кэширование, структурный прунинг UNet и квантование весов до FP8.

В итоге Yan-Sim выполняет генерацию бесконечного интерактивного видео с низкой задержкой (0.07с), что сопоставимо с реальным геймплеем.

🟡Второй модуль - Yan-Gen.

В нем происходит мультимодальная генерация миров по текстовым и визуальным промптам с помощью двухуровневой системы иерархических описаний.

Глобальное описание определяет статичный мир: топологию, визуальный стиль и освещение, выполняя роль "якоря" для всей генерации.

Локальные описания, генерируемые для коротких видеоклипов, отвечают за динамические события и взаимодействия.

Этот подход позволяет модели смешивать стили и механики из разных доменов. Например, можно задать стиль одной игры, а механику - от другой.

Чтобы добиться интерактивности в реальном времени, готовая модель проходит через дистилляцию, в результате чего получается эффективный генератор, работающий в несколько шагов и выдающий 12-17 FPS на одной NVIDIA H20 или до 30 FPS на четырех.

🟡Третий модуль - Yan-Edit.

Это редактор сгенерированного мира прямо во время взаимодействия с помощью текстовых команд. Ключевая идея здесь - разделение симуляции механики и визуального рендеринга.

Симулятор интерактивной механики, построенный на базе Yan-Sim, работает с картами глубины, сохраняя 3D-структуру объектов, но отбрасывая их визуальное оформление. Это позволяет ему изучать общие законы взаимодействия, зависящие от формы, а не от цвета или текстуры.

Визуальный рендерер, основанный на Yan-Gen и ControlNet, отвечает за раскрашивание этих карт глубины в соответствии со стилевыми промптами. Пользователь может в любой момент ввести два типа команд: структурные (например, "добавить интерактивный объект") и стилевые (например, "изменить цвет объекта").

Пока проект в самом начале своего пути - опубликованы только демо-видео и технический отчет, описывающий создание Yan. Модули системы, в виде отдельных моделей обещают опубликовать в ближайшее время.


@ai_machinelearning_big_data

#news #ai #ml

Читать полностью…
Subscribe to a channel