353148
Самая актуальная информация из мира ML, Нейронных сетей,DI По всем вопросам- @haarrp @itchannels_telegram - 🔥 best it channels @pythonl - 🐍 @machinee_learning -chat @ArtificialIntelligencedl - AI @datascienceiot - ml 📚 @machinelearning_ru ml
✔️ Anthropic расширила контекстное окно до миллион токенов.
Claude Opus 4.6 и Sonnet 4.6 получили поддержку контекстного окна объемом в 1 миллион без наценок за объем. Обработка длинных запросов тарифицируется по стандартной ставке, а лимиты пропускной способности API остаются прежними на всей длине контекста.
Дополнительно лимит файлов в одном запросе увеличен в 6 раз: теперь Claude может за раз проанализировать до 600 изображений или страниц PDF. Обновление доступно в API Claude, а пользователи Claude Code на тарифах Max, Team и Enterprise при вызове Opus 4.6 по умолчанию будут автоматически использовать контекст 1M.
claude.com
✔️ Microsoft начинает масштабную ИИ-экспансию в Африке.
Корпорация запускает инициативу Microsoft Elevate, в рамках которой планирует до конца года бесплатно обучить ИИ-технологиям 3 млн. человек.
Цель программы - сдержать экспансию китайских ИИ-продуктов на самом молодом и быстрорастущем рынке мира. По внутренним оценкам Microsoft, DeepSeek уже занимает от 11% до 14% локального рынка чат-ботов, а в Эфиопии и Зимбабве его доля достигает 20% из-за активных вложений Пекина в цифровую инфраструктуру.
Чтобы вернуть инициативу, Microsoft делает ставку на развитие собственных вычислительных мощностей. До конца 2027 года компания инвестирует $330 млн. в расширение облачной и ИИ-инфраструктуры в ЮАР, а в Кении готовится строительство дата-центра, который будет полностью работать на геотермальной энергии. Ключевыми регионами для технологий и подготовки разработчиков также станут Нигерия и Марокко.
bloomberg.com
✔️ Илон Маск уволил еще 2-х сооснователей xAI.
В xAI прошла новая волна увольнений, вызванная недовольством CEO слабыми результатами. Компанию покинули еще 2 сооснователя: Цзыхан Дай и глава команды Imagine Годун Чжан, которого Маск обвинил в технических недоработках продукта. Таким образом, из 12 учредителей, запускавших xAI, в штате осталось всего 2 человека.
Кадровые чистки серьезно бьют по моральному духу команды. Источники сообщают, что инженеры массово уходят из-за выгорания, спровоцированного экстремально жесткими требованиями Маска к рабочему графику.
Пытаясь спасти проблемное направление и усилить экспертизу в разработке, xAI в конце недели переманила в свой штат Эндрю Милича и Джейсона Гинзберга из Cursor.
ft.com
✔️ Google представила крупнейшее обновление Maps.
Главным визуальным нововведением стал режим «Иммерсивной навигации». ИИ анализирует панорамы Street View и генерирует реалистичный маршрут с детализированными 3D-моделями зданий, точной разметкой полос и отображением светофоров.
Также сервис получил функцию Ask Maps на базе Gemini. Вместо поиска по ключевым словам теперь запросы на естественном языке - ИИ сопоставляет геоданные с личными предпочтениями, формирует персонализированные рекомендации и позволяет бронировать места в один клик.
Апдейт поэтапно развертывается в США. Вскоре новые инструменты появятся на платформах iOS и Android, а также в интерфейсах CarPlay и Android Auto.
blog.google
✔️ Amazon добавила в Alexa+ взрослый режим общения.
Голосовой ассистент получил новую опцию кастомизации - профиль Sassy для взрослой аудитории. Для его активации необходимо пройти дополнительную биометрическую аутентификацию. При работе профиля функция Amazon Kids автоматически блокируется.
В режиме Sassy ассистент выдает саркастичные ответы, жесткие шутки и использует мат, но на этом "взрослость" заканчивается: ИИ по-прежнему отказывается генерировать NSFW-контент, разжигать ненависть, переходить на личности или консультировать по незаконным действиям.
Взрослый режим стал частью крупной переработки Alexa+ (в прошлом месяце вышли стили Brief, Chill и Sweet).
techcrunch.com
@ai_machinelearning_big_data
#news #ai #ml
✔️ Сэм Альтман: падение популярности ИИ - главная угроза технологического лидерства США.
Выступая на саммите BlackRock, глава OpenAI отметил резкое снижение доверия к ИИ среди американцев. По данным опросов, больше половины граждан считают, что риски от внедрения ИИ превышают пользу. Основные причины такого негатива: рост цен на электроэнергию из-за дата-центров и массовые сокращения. Ситуацию усугубляют дискуссии о границах влияния бигтеха и государства.
Альтман предупредил, что растущее сопротивление становится фактором в гонке технологий. Хотя США пока опережают Китай, замедление темпов внедрения ИИ может стоить стране статуса лидера. Американскому бизнесу, научному сообществу и правительству необходимо форсировать интеграцию ИИ. Если действовать быстро, уверен Альтман, ИИ даст уникальный шанс для мощного экономического рывка и переосмысления социальных институтов.
businessinsider.com
✔️ В Китае начали разработку стандартов для автономных ИИ-агентов.
Китайская академия информационных технологий начала создание нормативной базы для Claw-агентов. Поводом стал взрывной рост популярности проекта OpenClaw. Регламент должен решить проблемы безопасности и сделать работу автономных систем предсказуемой. В документе будут прописаны жесткие требования к качеству кода, прозрачности выполнения процессов, распределению пользовательских привилегий и минимизации рисков.
Академия уже открыла проект для обсуждения с экспертами отрасли, а к концу марта планирует запустить тестирование продуктов класса Claw на соответствие новым стандартам. Результаты проверок будут публично представлены на профильной конференции.
cls.cn
✔️ Илон Маск представил ИИ-систему, способную эмулировать работу IT-компаний.
Проект Macrohard, также известный как Digital Optimus, объединяет стек технологий Tesla и xAI. В основе архитектуры лежит языковая модель Grok в роли высокоуровневого навигатора. Она работает в тандеме с ИИ-агентом Tesla, который в реальном времени анализирует видео с экрана компьютера и напрямую управляет клавиатурой и мышью.
По задумке Маска, система сможет автоматизировать процессы разработки ПО до такой степени, чтобы полностью имитировать функции IT-корпораций. Само название Macrohard является прямой ироничной отсылкой к Microsoft.
Проект будет использовать проприетарные процессоры Tesla AI4 в связке с мощностями xAI на базе ускорителей Nvidia. Заявка на регистрацию одноименного товарного знака уже находится на рассмотрении в патентном ведомстве США.
reuters.com
✔️ Microsoft анонсировала Copilot Health.
Новый сервис работает как изолированное пространство внутри экосистемы Copilot. Его задача - агрегировать информацию о здоровье пользователя в единый профиль. Copilot Health интегрируется с более чем 50 гаджетами и напрямую подтягивает электронные медкарты из клиник США и результаты лабораторных исследований.
ИИ обрабатывает этот массив данных, чтобы находить скрытые паттерны и выдавать персонализированные рекомендации. Все ответы базируются на клинических базах и сопровождаются ссылками на верифицированные источники.
Copilot Health физически и логически отделен от основного чат-бота, зашифрован. Платформа сертифицирована по стандарту ISO/IEC 42001. На данный момент открыта запись в лист ожидания.
microsoft.ai
✔️ Claude AI теперь генерирует интерактивные визуализации прямо в диалоге.
Anthropic обновила свой чат-бот: теперь Claude умеет создавать кастомные графики, диаграммы и схемы прямо внутри переписки. Он сам анализирует контекст и, если визуализация помогает лучше раскрыть ответ, встраивает ее в ленту сообщений. Запросить нужную таблицу или даграмму можно и напрямую, причем сгенерированные элементы поддерживают интерактивность.
Новой функция отличается Artifacts. Артефакты открываются в отдельной боковой панели и сохраняются там постоянно. Встроенные же визуализации меняются или вовсе исчезают по мере развития диалога, подстраиваясь под текущую задачу. Обновление уже доступно всем пользователям и включено по умолчанию.
support.claude.com
@ai_machinelearning_big_data
#news #ai #ml
🌥 Разворачивайте AI быстрее и выгоднее 🤩
Провайдер Cloud.ru дает скидки до 40% на ключевые сервисы для запуска и масштабирования AI-проектов.
GPU, физические серверы, ML-инференс — все в одном месте и на выгодных условиях. Минимум лишних затрат, максимум производительности.
Количество участников ограничено — успейте подключиться.
✔️ OpenAI расширяет поддержку мейнтейнеров открытого кода.
Программа Codex Open Source Fund, запущенная год назад, получила апдейт льгот для разработчиков, которые поддерживают публичные репозитории.
Теперь участники программы получают не только API-кредиты, но и полный доступ к ChatGPT Pro с Codex на полгода.
Обновленный набор поддержки выглядит теперь так:
🟢API-кредиты для проектов, которые уже интегрировали Codex в pull request review, релизные пайплайны или другую инфраструктуру OSS.
🟢6 месяцев ChatGPT Pro с Codex.
🟠Условный доступ к Codex Security
Условность в том, то Codex Security одобряется вручную. OpenAI объясняет это возможностями GPT-5.4, команда рассматривает каждую заявку отдельно, чтобы убедиться, что инструмент применяется осознанно.
core maintainer с write access к широко используемому публичному проекту. Что считается широко используемым - не уточняется.
Центральный университет и “Магнит” запустят магистратуру для подготовки разработчиков ПО
Запуск совместной магистратуры планируется в сентябре. Чтобы решить проблему нехватки квалифицированных кадров в области IT, которые знают специфику и вызовы отрасли, компания и вуз будут готовить IT-специалистов вместе.
Специалисты MAGNIT TECH (технологическое подразделение “Магнита”) примут участие в разработке учебной программы, а сама магистратура будет включать обширный практический блок и реальные кейсы ритейлера. Лучшие студенты получат возможность устроится на работу в компанию.
Это не первый совместный проект Центрального университета и “Магнита”: ритейлер уже участвует в стипендиальной программе, предоставляет практические кейсы и обучает своих руководителей работе с ИИ в вузе.
@ai_machinelearning_big_data
#news #ai #ml
OpenAI объявила о начале развёртывания новых моделей GPT-5.4 Thinking и GPT-5.4 Pro в ChatGPT.
Также GPT-5.4 стала доступна разработчикам через API и в Codex. Новая версия объединяет несколько ключевых направлений развития моделей: улучшенное логическое рассуждение, более сильные возможности программирования и поддержку агентных сценариев работы.
По словам компании, GPT-5.4 стала одной из самых точных и эффективных моделей. Она требует меньше токенов для выполнения задач и работает быстрее по сравнению с предыдущими версиями.
В версии ChatGPT модель GPT-5.4 Thinking получила улучшенный режим размышления: при более длительном анализе она лучше удерживает контекст и способна проводить более глубокие исследования в интернете.
Появилась и новая функция управления процессом ответа. Теперь пользователь может прервать генерацию в середине ответа и изменить направление работы модели, добавив новые инструкции.
Функция управления ответом уже начинает появляться в веб-версии ChatGPT и на Android. Поддержка iOS ожидается немного позже.
https://x.com/openai/status/2029620624923189283?s=46
@ai_machinelearning_big_data
✔️ OpenAI делает внутреннюю альтернативу GitHub.
Компания приступила к созданию собственной платформы для хостинга кода, чтобы снизить зависимость от инфраструктуры Microsoft. Поводом для запуска проекта стали недавние перебои в работе GitHub, которые заблокировали доступ инженеров OpenAI к репозиториям и парализовали разработку.
Сейчас проект находится на ранней стадии, его реализация займет несколько месяцев. Пока речь идет об исключительно корпоративном инструменте - планов по открытию доступа к новому репозиторию для сторонних разработчиков у компании нет.
theinformation.com
✔️ Physical Intelligence разработала архитектуру двухуровневой памяти для роботов.
Стартап анонсировал Multi-scale Embodied Memory, архитектуру памяти для робототехнических VLA-моделей. Технология решает потерю контекста при выполнении длинных многоэтапных задач.
Система объединяет 2 механизма. Краткосрочная память работает через оптимизированный видеоэнкодер, который отвечает за пространственную осведомленность и позволяет моделям на лету адаптироваться к ошибкам. Долгосрочная память оперирует текстовыми абстракциями - модель сама генерирует языковые заметки о выполненных шагах, запоминая статус задачи и расположение скрытых из виду предметов.
Интеграция MEM в базовую модель π0.6 позволила роботам успешно справляться с непрерывными поручениями длительностью до 15 минут. Релиз закладывает фундамент для автономных систем, способных самостоятельно планировать сложную бытовую рутину на часы или дни вперед.
pi.website
✔️ Autodesk представила ИИ-генератор для создания 3D-моделей.
Autodesk добавила новую генеративную ИИ-модель Wonder 3D в платформу Flow Studio. Инструмент заметно ускоряет прототипирование: доступно создание полноценных 3D-персонажей и пропсов на основе текстового промпта или 2D-референса.
Помимо создания черновой геометрии, Wonder 3D предлагает набор утилит для доработки ассетов. Нейросеть умеет накладывать текстуры, перестраивать топологию сетки и точечно редактировать визуальные элементы без перегенерации.
Полученные объекты экспортируются в классические 3D-пайплайны, игровые движки и софт для 3D-печати. Новые инструменты уже доступны во всех планах Flow Studio, включая бесплатный базовый тариф. Стоимость любого запроса фиксирована и составляет 20 кредитов.
autodesk.com
✔️ В NotebookLM появилась функция Cinematic Video Overviews.
Google расширила возможности NotebookLM новым генератором роликов Cinematic Video Overviews. Инструмент автоматически создает качественные анимации, окончательно заменяя привычные презентации с монотонным закадровым голосом.
В основе функции лежит интеграция Gemini 3, Nano Banana Pro и Veo 3. В этой связке Gemini 3 выступает в роли виртуального креативного директора, который самостоятельно принимает решения по стилистике, нарративу и структуре будущего видео без дополнительных усилий со стороны пользователя.
На старте новая функция поддерживает только английский язык и открыта эксклюзивно для пользователей Google AI Ultra.
NotebookLM в сети Х
✔️ Ключевые фигуры Qwen покидают Alibaba.
Спустя несколько часов после выпуска серии компактных моделей Qwen 3.5 команду покинули несколько специалистов: технический руководитель проекта Цзюньян Лин, под началом которого разрабатывались все поколения Qwen, исследователь Биньюань Хуэй и разработчики Кайсинь Ли и Юй Бовэнь.
Официальной причиной называют реорганизацию в лаборатории Tongyi Lab: корпорация переходит от продуктовых команд к точечным рабочим группам, но по неподтвержденным данным, уход создателей Qwen может быть связан с плохими показателями дневной активной аудитории продуктов на базе этих моделей.
venturebeat.com
@ai_machinelearning_big_data
#news #ai #ml
⚡️ Gemini 3.1 Flash-Lite - самый экономичный Gemini 3
Google представил Gemini 3.1 Flash-Lite - ультрабыструю и максимально дешёвую модель в линейке Gemini 3.
Цена - всего $0.25 за 1 млн входных токенов и $1.50 за 1 млн выходных токенов.
Модель выполняет задачи быстрее и обходится в разы дешевле крупных моделей, обеспечивая увеличение скорости генерации на 45% по сравнению с Gemini 2.5 Flash.
Главное:
• Настраиваемые уровни "мышления"
Можно регулировать глубину рассуждения под задачу - от лёгких операций до более сложной логики.
• Подходит для high-scale задач
Оптимизирована для массовых сценариев - генерация UI, дашбордов, симуляций, автоматизация workflow.
• Доступна через Gemini API
Разработчики уже могут тестировать модель в Google AI Studio.
Отличный дешёвый и быстрый ИИ.
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-flash-lite/
@ai_machinelearning_big_data
#Gemini
🌟 GUI-Libra: фреймворк обучения VLM-агентов задачам управления интерфейсами.
Microsoft, UIUC и UNC-Chapel Hill разработали систему дообучения VL-моделей для автономного управления графическими интерфейсами.
Авторы обнаружили 2 системных изъяна в существующих пайплайнах обучения GUI-агентов:
Cтандартный SFT с длинными CoT ухудшает визуальную локализацию (чем длиннее рассуждение, тем хуже модель попадает в нужный элемент интерфейса).
Пошаговое RLVR-обучение нестабильно, потому что GUI-среда частично верифицируема. На каждом шаге существует несколько корректных действий, но датасет фиксирует только одно. Как результат - за альтернативные, но правильные действия модель получает штраф.
✔️ Microsoft оставляет за собой контроль над API OpenAI после сделки с Amazon.
Когда OpenAI пошла за новыми инвестициями и договорилась с Amazon, на рынке предсказуемо напряглись. Microsoft и OpenAI пришлось выпустить совместное заявление, чтобы всех успокоить: базовые договоренности остаются в силе.
Облако Azure продолжит быть эксклюзивным провайдером для stateless API OpenAI. Это значит, что любые сторонние вызовы к моделям стартапа физически обрабатываются на серверах Microsoft - даже если этот запрос идет через новые интеграции с Amazon. Свои продукты разработчики OpenAI тоже продолжат держать в Azure.
При этом OpenAI сохраняет за собой право наращивать мощности через сторонние проекты. В остальном все работает по старым правилам. Лицензии, базовая архитектура и само юридическое определение AGI остаются без изменений.
microsoft.com
✔️ Anthropic подарит мейнтейнерам open-source проектов полгода доступа к Claude Max.
Авторы Claude запустили программу поддержки разработчиков открытого ПО. Кандидаты, отвечающие условиям получат 6 мес. тарифа Claude Max с увеличенными в 20 раз лимитами на использование по сравнению со стандартной версией.
Для участия необходимо поддерживать проект, собравший более 5000 звезд или превышающий планку в 1 млн. скачиваний за месяц. Обязательное условие - репозиторий должен быть активным, с коммитами после ноября 2025 года.
Anthropic предусмотрела исключение для фундаментальных системных инструментов: если библиотека является ключевой зависимостью в своей экосистеме, мейнтейнеры могут запросить доступ даже при несоответствии заявленным метрикам.
claude.com
✔️ Google переводит разработчиков с Gemini 3 Pro Preview на версию 3.1.
Компания объявила о прекращении поддержки Gemini 3 Pro Preview в Gemini API и Google AI Studio. Модель будет отключена 9 марта 2026 года. Чтобы ускорить миграцию, уже 6 марта алиас последней версии начнет автоматически перенаправлять все запросы на Gemini 3.1 Pro Preview. Инженерам настоятельно рекомендуется адаптировать код до этого срока.
Новость вызвала скепсис в сообществе. Разработчики недовольны безальтернативным переходом и жалуются на задержки ответов, возможный рост затрат и падение общего качества генерации в сценариях, где старая версия справлялась заметно лучше.
google.dev
✔️ QuiverAI запустил публичную бету первой модели для генерации векторной графики.
Стартап вышел из стэлс-режима открытием доступа к специализированной модели Arrow 1.0, которая дает на выходе полноценные SVG-файлы. Их можно бесконечно масштабировать без потери качества и напрямую редактировать в любом профессиональном софте.
Обученная с нуля Arrow 1.0 решает одну из главных проблем GenAI - выдает готовые к продакшену ассеты, а не растровые картинки. Попробовать новый инструмент генерации можно на веб-платформе QuiverAI.
QuiverAI в сети Х
✔️ Burger King заставит ИИ следить за вежливостью сотрудников.
Сеть тестирует умную гарнитуру Patty для персонала. Изначально устройство подавали как помощника в рутине, на деле же алгоритм работает как надзиратель. Он непрерывно слушает сотрудников и проверяет, произносят ли они корпоративные приветствия и слова благодарности. Любой менеджер теперь может выгрузить метрики дружелюбности конкретного работника. Сейчас модель учат еще и анализировать тон голоса, что выведет микроменеджмент на новый уровень.
Patty - это интерфейс внутренней платформы BK Assistant. Система связывает микрофоны на выдаче для авто, кухонные аппараты, склады и кассы. Если на кухне заканчиваются помидоры или ломается гриль, алгоритм за 15 минут сам скроет вопперы с терминалов самообслуживания и из мобильного приложения. Пока Patty носят сотрудники в 500 локациях. Раскатать облачную сеть на все рестораны в США планируют к концу этого года.
theverge.com
@ai_machinelearning_big_data
#news #ai #ml
🌟 Theory of Space: умеют ли ИИ-агенты строить карты пространства?
Команда из Stanford, University of Washington и Cornell опубликовала для ICLR 2026 бенчмарк Theory of Space. В исследовании принимали участие звезды индустрии: Ли Фэй-Фэй, Едзин Чой и Ранджей Кришна.
Работа проверяет, способны ли языковые модели самостоятельно исследовать незнакомое пространство и строить его связную карту так же, как это делают люди.
Концепция выстроена по аналогии с Theory of Mind из когнитивной науки.
Если Theory of Mind измеряет, насколько наблюдаемый понимает скрытые психические состояния других, то Theory of Space проверяет способность ИИ-агента моделировать скрытую физическую структуру среды.
Определению подлежали 3 навыка:
🟠построить карту из частичных наблюдений;
🟠обновить ее при изменении обстановки;
🟠использовать для решения пространственных задач определения направлений, локализации объектов и смены перспективы.
Принципиальное требование: все это должно происходить в активном режиме.
Агент стартует в незнакомом пространстве с несколькими комнатами, сам решает, куда двигаться и куда смотреть, и на каждом шаге выгружает JSON с координатами объектов. Оценивается не только финальный ответ, но и качество построенной пространственной модели.
Всего было сгенерировано 2700 вопросов на каждую конфигурацию среды (по 9 задач в 100 сценах) для 6 топовых моделей: GPT-5.2, Gemini 3 Pro, Claude Sonnet 4.5, GLM-4.6V, Qwen3-VL-235B и InternVL 3.5-241B.
Для ориентира: люди набрали 96,4% в визуальной среде и добрались до нужного охвата примерно за 10 шагов.
Для сравнения авторы написали скрипт-агентов - детерминированные программы с жестко заданной стратегией обхода: зайти в комнату, сделать полный оборот на 360°, зафиксировать все объекты, перейти в следующую комнату. Никакого интеллекта, только алгоритм.
Такой агент достигает нужного покрытия за 9 шагов; модели тратят 14 и больше и при этом строят менее точную карту.
Модели умеют рассуждать о пространстве, когда им дают готовую картину. Но самостоятельно добывать нужную информацию, эффективно перемещаться и при этом удерживать целостную карту в памяти - пока нет. Это разные задачи, и тут ИИ проигрывает даже примитивному алгоритму.
🙂 Ну чтож, за электриков!
Хейтеры скажут. что это ИИ, но комплекс на видео очень похож на робота X7 AI Lead Connection Robot из серии Live Working Robot китайской компании Guangdong Crownpower Electric Power Technology Development.
Он подключает провода к действующим высоковольтным линиям под напряжением (без отключения электричества). Умеет выполнять весь цикл работ: распознает провода, снимает изоляцию, заводит/надевает зажимы и затягивает соединение.
За все отвечает двурукая система с ИИ: она использует мультисенсорное зрение, цифровые двойники и автономное планирование траектории (успешность автономной работы > 98 % по тестам компании).
@ai_machinelearning_big_data
✔️ Проверить себя в DS и забрать мерч? Легко!
Команда DS-специалистов AvitoTech запустила открытую игру с вопросами для дата-сайентистов Avito Data Quest 🚀
Мы уже прошли игру, вышло динамично, и местами нужно было подумать. Если вы хотите проверить себя, точно стоит попробовать!
Визуально оформлено в стиле комикса, внутри много задач разной сложности, часть из них используется на реальных собеседованиях.
📌 Игра содержит несколько этапов
🟡 Базовый блок по ML и Python
🟡 Ситуативные вопросы
🟡 Mario по офису Авито, где можно заработать подсказку 50 на 50
🟡 Хардовые вопросы по разным направлениям (наше уважение авторам за разные ветки)
🟡 Кейс в финале с нетривиальным сценарием
Игра скорее фановая и для самопроверки, но если вам нужно, то 5 победителей получат бокс с мерчем AvitoTech, итоги подведут 20 марта.
Начать игру →
⚡️ Alibaba выпустила семейство Qwen 3.5 Medium.
Команда Qwen опубликовала серию моделей Qwen 3.5 Medium, в которую вошли:
🟠Qwen3.5-Flash
🟢Qwen3.5-35B-A3B
🟢Qwen3.5-122B-A10B
🟢Qwen3.5-27B.
Сюрприз серии - Qwen3.5-35B-A3B. По бенчмаркам она превосходит Qwen3-235B-A22B-2507, у которого активных параметров было 22B то есть разница в эффективности больше чем в 7 раз.
Qwen3.5-Flash - это продакшен-версия 35B-A3B, заточенная под агентные сценарии. Из коробки доступны контекстное окно в 1 млн. токенов и нативная поддержка fвызова функций.
Миллионный контекст снимает необходимость строить RAG при работе с большими кодовыми базами или объемными документами, модель удерживает все в контексте.
Старшие модели Qwen3.5-122B-A10B и Qwen3.5-27B ориентированы на сложные многошаговые задачи: планирование, цепочки рассуждений, долгосрочное выполнение инструкций.
Для них применялся четырехэтапный пайплайн дообучения с холодным стартом через длинный СoT и RL на основе hbpjybyu-сигналов.
122B-A10B при 10B активных параметров по логической связности конкурирует с заметно более тяжелыми dense-моделями.
Веса доступны на Hugging Face, Flash - только через Model Studio от Alibaba Cloud по цене примерно 10 центов за млн. входных и 40 центов за млн. выходных токенов
📌Лицензирование: Apache 2.0 License.
🟡Набор моделей
@ai_machinelearning_big_data
#AI #ML #LLM #Qwen #Alibiba
⚡️ AI-войны продалжаются
Anthropic заявили, что обнаружили масштабные кампании по «дистилляции» их моделей со стороны DeepSeek, Moonshot и MiniMax.
По данным компании:
- использовано ~24 000 фейковых аккаунтов
- сгенерировано более 16 миллионов диалогов с Claude
- цель - воспроизвести сильные стороны модели
- агентное мышление
- работу с инструментами
- программирование
- сложное рассуждение
Фактически - это массовое извлечение поведения модели через API, чтобы обучить свои системы на её ответах.
И самое интересное:
Anthropic утверждает, что выявила схемы автоматически - по паттернам использования и аномальной активности.
Это новая реальность рынка AI:
- данные стали главным активом
- поведение моделей — интеллектуальная собственность
- компании пытаются копировать не архитектуру, а «мышление»
Если раньше технологические войны шли за:
- вычисления
- датасеты
- чипы
то теперь начинается новая гонка: война за интеллект моделей.
https://x.com/AnthropicAI/status/2025997928242811253
#Anthropic
@data_analysis_ml
🌟 OpenJarvis: фреймворк все-в-одном для ИИ-агентов
Stanford SAIL замерили, насколько эффективно локальные языковые модели конвертируют электроэнергию в полезные вычисления и назвали этот показатель "intelligence per watt".
Они прогнали больше миллиона реальных запросов через 20+ моделей на 8 разных ускорителях и выяснили: с 2023 по 2025 год эффективность локального инференса выросла в 5,3 раза, а современные небольшие модели уже справляются с 88,7% обычных чат- и ризонинг-запросов. Железо и алгоритмы готовы, но не хватало софта.
Так появился OpenJarvis: открытый фреймворк, который превращает эти выводы в инфраструктуру для персональных ИИ-агентов, работающих на устройстве пользователя.
Авторы проводят параллель с PyTorch: OpenJarvis должен стать для локального ИИ тем, чем PyTorch стал для глубокого обучения - стандартной инфраструктурой, на которой строится все остальное.
Помимо самого проекта, команда запустила конкурс-лидерборд экономии денег, энегрии и компьюта, в котором принять участие может любой желающий. В качестве приза самому экономному обещают Mac Mini.
🌟 Nemotron-Terminal: небольшое семейство для терминальных задач.
NVIDIA обучила семейство моделей Nemotron-Terminal для автономной работы в терминале Linux: устанавливать зависимости, писать и запускать код, отлаживать окружения и выполнять сквозные инженерные задачи без участия человека.
Семейство построено на базе Qwen3 и специально собранном датасете Terminal-Corpus. И фишка не в архитектуре, а в данных.
🟡NVIDIA собрала пайплайн Terminal-Task-Gen с 2 потоками.
Первый адаптирует готовые датасеты по математике, коду и SWE-задачам под терминальный формат (без участия LLM в процессе адаптации).
Второй генерирует синтетику 2 методами: seed-based (LLM создает новые задачи на основе существующих задач из смежных областей) и skill-based (LLM комбинирует до пяти примитивных навыков из таксономии по 9 доменам: Security, Data Science, System Administration и другим).
🟡В открытый релиз вошли все три модели на 8B, 14B, 32B параметров и 2 датасета:
Terminal-Corpus: около 366K траекторий выполнения задач, разбитых на два потока: ~226K адаптированных примеров из Math/Code/SWE и ~140K синтетических задач на основе skill-таксономии.
Synthetic-Tasks: задачи в стандартизированном формате: инструкция, Docker-окружение из 9 преднастроенных образов и верификационный набор на pytest.
Для сравнения: Qwen3-Coder на 480B параметров набирает 23.9%, GPT-5-Mini - 24.0%, Grok 4 - 23.1%. Nemotron-Terminal-32B превосходит или вплотную конкурирует с ними всеми при разнице в размере на порядок.
15 марта пройдет AI Dev Day — митап Яндекса, посвящённый опыту внедрения AI-инструментов в процессы разработки
Недавний мем о том, что теперь спонсоры не берутся за проекты без AI — уже не мем, а реальность. Почти в каждом приложении/продукте теперь есть встроенные нейронки, агенты, тулсы. Другой вопрос: какой это дает профит и как этот профит вообще посчитать.
Через 5 дней Яндекс соберет на своем митапе руководителей и инженеров крупных IT-компаний, которые расскажут, как оценивать реальную эффективность AI.
Все выступления спикеров поделили на 2 тематических блока. Первый — про опыт внедрения, метрики и влияние AI на продуктивность и качество. Второй — про построенные мультиагентные системы, внутренние продукты и конкретные рабочие инструменты, которыми уже можно пользоваться.
Лидер трека AI в разработке Яндекса Андрей Попов объяснит, на какие метрики смотреть при оценке эффективности, и покажет, каких результатов они достигли. А еще расскажет, как компания использует AI для тестирования, оптимизации процессов и работы с инцидентами. В этой же части — выступление руководителя продуктовой аналитики в управлении базовых технологий в Т-Банке про оценку эффективности в SDLC.
Во втором блоке Сергей Бульдяев, технический менеджер продукта в Яндексе, представит кейсы агента в IDE на базе open-source решения, а Максим Шведенко, руководитель направления Департамента недвижимости и эксплуатации в Сбере, объяснит из чего состоит мультиагентная система для дизайнеров.
Митап пройдет в Москве, а для тех, кто в другом городе, будет онлайн-трансляция. Зарегистрироваться на ивент можно тут.
✔️ OpenAI открыла доступ к Codex Security.
Это инструмент, который сканирует архитектуру проекта и выстраивает индивидуальную модель угроз. Опираясь на эту карту, агент целенаправленно ищет слабые места в безопасности приложения.
Фирменная фича - защита от ложных срабатываний за счет практической проверки найденных багов. Обнаружив проблему, агент разворачивает изолированную копию системы в песочнице и пытается самостоятельно провести реальный взлом. Если попытка оказалась успешной и угроза подтверждена, ИИ сам пишет патч. Затем система тестирует обновление, чтобы убедиться, что внесенные исправления не сломают другие функции продукта.
Доступ к превью-версии инструмента получат пользователи тарифов ChatGPT Enterprise, Business и Edu в ближайшие дни.
openai.com
✔️ США привяжут экспорт ИИ-ускорителей Nvidia и AMD к инвестициям в свою экономику.
Министерство торговли США подготовило новые правила продажи чипов для ЦОД. Теперь государствам, чьи компании закупают большие объемы продукции Nvidia и AMD, придется встречно инвестировать в американскую ИИ-инфраструктуру.
Проект вводит многоуровневую систему выдачи экспортных лицензий. Строгость требований напрямую зависит от суммарной вычислительной мощности запрашиваемых компонентов. Для одобрения крупных сделок высшего уровня страны-покупатели будут обязаны проводить прямые финансовые вливания в технологический сектор США.
Этот подход формализует практику, которая уже была успешно обкатана на недавних соглашениях с ОАЭ и Саудовской Аравией. На поставки оборудования в Китай, эти правила не повлияют - они по-прежнему регламентируются отдельными санкциями.
ft.com
✔️ Cursor представил платформу Automations.
Новый инструмент от создателей ИИ-редактора кода избавляет разработчиков от необходимости каждый раз вручную писать промпты. Теперь ИИ-помощник может включаться в работу фоном, самостоятельно реагируя на внешние события.
Триггерами служат действия в Git, сообщения в Slack, новые тикеты в Linear или инциденты в PagerDuty. Платформа также поддерживает настройку кастомных вебхуков и запуск задач по расписанию. Обновленные агенты способны брать на себя полноценные инженерные процессы: проанализировать логи через протокол MCP, локализовать ошибку и сразу подготовить пулл-реквест с готовым исправлением.
Важная деталь - у агентов появилась память. Они запоминают результаты прошлых запусков, постепенно адаптируясь к контексту проекта и избегая повторения старых ошибок.
cursor.com
✔️ SoftBank запросил рекордный кредит для увеличения своей доли в OpenAI.
Японский конгломерат ведет переговоры о привлечении крупнейшего в своей истории долларового займа. Ожидается, что кредит на 40 млрд. сроком на год будет обеспечен четырьмя банками.
Главная цель сделки - финансирование ставки основателя SoftBank Масаёси Сона на ИИ. Банк уже вложил в OpenAI более 30 млрд. долларов, получив около 11% акций стартапа. Чтобы обеспечить эти инвестиции, холдингу пришлось частично распродать другие свои активы.
Агрессивные заимствования усиливают опасения аналитиков по поводу раздувания ИИ-пузыря. Суммарный долг ключевых партнеров OpenAI уже достиг 96 млрд. долларов, а ведущая пятерка ИТ-корпораций набрала новых кредитов на 121 млрд., это в 4 раза выше привычной нормы. При этом монетизация буксует - платные подписки на ИИ-сервисы пока оформили лишь 3% пользователей.
bloomberg.com
✔️ Claude ежедневно привлекает более миллиона новых пользователей.
Об этом достижении сообщил Майк Кригер, возглавляющий подразделение экспериментальных ИИ-разработок. Столь стремительный рост аудитории обусловлен несколькими факторами. Помимо глобального тренда на ИИ, Anthropic извлекла серьезную выгоду из недавнего скандала вокруг сотрудничества OpenAI с Пентагоном.
На фоне этих событий в глазах потребителей и технологического сообщества создатели Claude выглядят более последовательными в вопросах этики. Статус «морального победителя» обеспечивает компании сильное репутационное преимущество и стимулирует массовый приток пользователей.
Mike Krieger в сети Х
@ai_machinelearning_big_data
#news #ai #ml
⚡️ OpenAI встроила ChatGPT в Excel и подключила к нему данные Bloomberg, Moody's и S&P.
ChatGPT for Excel доступен в бета-версии - это аддон для Excel на базе GPT-5.4, который работает прямо внутри таблиц.
Можно описать задачу текстом, и модель сама построит финансовую модель, обновит формулы, проследит связи между листами и объяснит, почему изменился итог.
На внутреннем бенчмарке OpenAI по инвестиционному банкингу модель набрала 87,3% против 43,7% у GPT-5. Тест проверяет реальные задачи (например, построение трехчастной финансовой модели с форматированием и ссылками на источники).
Архитектура распределённого инференса для долгоживущих LLM-сессий
Эксплуатация современных агентских LLM уже не про «поднять контейнер на GPU и прикрутить балансер». Чтобы экономика сходилась и железо утилизировалось эффективно, нужно учитывать реальный паттерн нагрузки: долгие сессии, многошаговые диалоги, большие контексты.
Yandex AI Studio недавно выкатила обновление, в котором открыла доступ к стабильному инференсу DeepSeek V3.2. Поговорим про сам инференс и другие обновления – что там под капотом?
🟡Ключевые изменения
— Prefill / Decode Split. Prefill-ноды ускоряют прогон длинных контекстов (TTFT↓), decode-ноды стабилизируют генерацию и поддерживают низкий TBT.
— Иерархия KV-кэшей – GPU → CPU RAM → распределённый слой.
— Переиспользование KV-кешей. KV-кэши передаются между серверами прямо во время обработки запроса, в реальном времени — фактически гигабайты данных, которые нужно доставлять между GPU за очень короткое время.
— Cache-aware балансировка. Маршрутизирует запросы с учётом расположения кэшей в кластере, чтобы максимизировать Cache Hit Rate в многошаговых сессиях.
Добавлены два новых типа токенов:
• токены инструментов — нововведение от Яндекса. Токены срабатывают при вызове встроенных тулов (File Search, Web Search, MCP, Code Interpreter). Стоят дешевле обычных входящих / исходящих;
• токены кеширования — уже отраслевой стандарт за рубежом, который только приходит на российский рынок. Часть контекста повторно используется при повторении, модель отрабатывает побыстрее, а денег тратит поменьше.
✔️ Y Combinator станет площадкой для запуска ARC-AGI 3.
Венчурный акселератор готовится провести 25 марта Launch Party, посвященное релизу третьей версии бенчмарка ARC-AGI.
По словам создателей, он станет новым этапом в развитии одного из самых строгих тестов на способность ИИ к абстрактному мышлению.
Серия испытаний Abstraction and Reasoning Corpus (ARC), созданная Франсуа Шолле, стала главным инструментом для проверки того, умеют ли алгоритмы решать логические задачи, а не просто воспроизводить заученные паттерны.
Джеффри Хинтон предупреждает:
Искусственный интеллект может быть гораздо умнее, чем мы предполагаем, и способен распознавать, когда его тестируют.
Если ИИ понимает, что находится под проверкой, он может намеренно занижать свои возможности и «прикидываться дурачком», скрывая реальный уровень своих способностей.
ИИ уже эффективно убеждает людей и вскоре может превзойти человека именно в умении убеждать.
📌 Anthropic vs Пентагон
В США набирает обороты скандал, который буквально за 2 недели вырос до масштаба национальной темы, которая уже вышла за рамки ИИ-индустрии.
В пятницу, Администрация Президента США объявила о внесении Anthropic в список компаний, представляющих риск для оборонных цепочек поставок.
Прецедент исключительный: обычно такой статус присваивают структурам из враждебных государств (например, китайской Huawei).
В среду вечером Пентагон письменно потребовал от Anthropic разрешить военным использовать Claude "в любых законных целях" - то есть без каких-либо ограничений, наложенных самой компанией.
В четверг CEO Дарио Амодэй опубликовал открытое заявление, в котором объяснил позицию компании: главные опасения - массовая слежка за гражданами и автономное оружие, способное открывать огонь без участия человека.
«Мы не можем по совести согласиться с их требованием», — написал Дарио.
«Единственная причина, по которой мы вообще с ними разговариваем — они нам нужны, и нужны прямо сейчас», — сказал один из оборонных чиновников.
🌟 Doc-to-LoRA и Text-to-LoRA: гиперсети как генераторы LoRA
SakanaAI предложила 2 новых способа работы с памятью и дообучением LLM. Оба используют одну идею - гиперсеть, которая генерирует LoRA-адаптеры на лету, вместо того чтобы каждый раз тяжелый процесс обновления весов под каждую новую задачу.
Вся суть в математике затрат. Достаточно один раз вложиться в такое вот мета-обучение и потом создание нового адаптера обходится в копейки - система тратит вычислительные ресурсы всего на один прямой прогон.
В итоге получается умный конвейер по производству плагинов. Вы скармливаете главной сети документы или описание задачи, а она моментально выдает готовый модуль. Отличный способ сэкономить бюджеты на компьют и время.
🟡Doc-to-LoRA
Метод базируется на популярной связке «учитель-ученик» из дистилляции контекста. Гиперсеть принимает документ, кодирует его через замороженную LLM и генерирует LoRA-адаптер за один прямой прогон, без градиентных обновлений под конкретный документ. Адаптер применяется к слоям проекции MLP базовой модели. После этого модель отвечает на вопросы о документе, не имея его в контексте вообще.
На синтетическом тесте NIAH гиперсеть обучалась на последовательностях в 32–256 токенов, но при инференсе работала с контекстами до 40К токенов (это 5х превышение тренировочной длины). Там, где Gemma-2-2b-it с окном 8К теряла информацию, Doc-to-LoRA сохраняла почти идеальную точность.
При этом базовой модели требуется более 12 ГБ видеопамяти для обработки контекста в 128К токенов, а вот адаптер от Doc-to-LoRA обходится менее чем 50 МБ независимо от длины документа.
На реальных QA-задачах цифры тоже довольно бодрые. В SQuAD метод сохраняет 82,5% точности по сравнению с подходом, когда весь текст просто лежит в контекстном окне.
На длинных документах качество держится в районе 85% при задержке 0,2 секунды против 40 секунд у классической дистилляции контекста.
По памяти разрыв еще жестче. Полная дистилляция с генерацией запросов занимает более 100 секунд и требует свыше 40 ГБ VRAM, а вот Doc-to-LoRA укладывается в 3,8 ГБ.
Та же схема работает с визуальными токенами через мультимодальную Gemma-3-4b-it. На сете Imagenette чисто текстовая модель выдала 75% точности при классификации картинок, хотя ни гиперсеть, ни базовая модель не видели визуальных токенов при обучении.
Качество LoRA чувствительно к формулировке. Размытый запрос дает слабый результат, тогда как четкое описание с указанием типа рассуждения не только улучшает точность, но и позволяет управлять стилем ответа.
✔️ Anthropic купила стартап Vercept.
Создатели Claude приобрели компанию Vercept, чтобы ускорить развитие функции computer use. Команда Vercept занималась решением проблем машинного восприятия и взаимодействия ИИ с программными интерфейсами. В ближайшие недели стартап свернет свой внешний продукт и полностью вольется в Anthropic.
Сделка дополняет недавний релиз Sonnet 4.6, которая показала огромный скачок в бенчмарке OSWorld. С конца 2024 года результат Sonnet вырос с 15% до 72,5%, вплотную приблизившись к человеческому уровню в задачах навигации по сложным таблицам и работы с формами в браузере.
anthropic.com
✔️ Perplexity запустила ИИ-оркестратор.
Perplexity Computer - система с постоянной памятью, сотнями коннекторов, доступом к файлам и вебу, которая самостоятельно исследует, проектирует, пишет код, развертывает и управляет любыми проектами от начала до конца.
Инструмент работает с 19 моделями одновременно, распределяя задачи между параллельными агентами и выбирая оптимальную для каждой. Computer доступен для подписчиков Max, скоро обещают для тарифов Pro и Enterprise.
PerplexityAI в сети Х
✔️ Nous Research выпустила Hermes Agent.
Hermes Agent оснащен многоуровневой системой памяти и постоянным доступом к выделенной машине: он запоминает все, чему научился, и становится умнее с каждой сессией.
Агент работает в CLI и мессенджерах, перенося контекст между платформами без потерь. Поддерживает субагентов, программный tool calling, полный контроль над файловой системой и терминалом, браузер и запланированные задачи.
Проект полностью открыт. Первые 750 подписчиков облачного Nous Portal (подписка начинается с $10/мес.) получают месяц бесплатно по коду HERMESAGENT.
Nous Research в сети Х
✔️ Inception Labs представила самую быструю ризонинг-модель в мире.
Mercury 2 - языковая модель на основе диффузии, которая вместо последовательного вывода токенов использует параллельное уточнение, достигая скорости свыше 1000 токенов в секунду на GPU NVIDIA Blackwell. Это примерно в 5 раз быстрее традиционных авторегрессионных моделей.
Модель поддерживает контекст 128K, нативную работу с инструментами, структурированный JSON-вывод и полностью совместима с OpenAI API. Цена - 25 центов за миллион входных и 75 центов за миллион выходных токенов.
inceptionlabs.ai
✔️ Бывший топ-менеджер Roblox стал директором по персоналу OpenAI.
Арвинд КС занял пост Chief People Officer в OpenAI, сменив Джулию Виллагру, которая покинула компанию в августе 2025 года. На новой должности он будет напрямую подчиняться директору по стратегии Джейсону Квону.
Главная задача Арвинда - управление наймом, онбординг и формирование корпоративной политики в режиме интенсивного расширения штата. До прихода в OpenAI Арвинд руководил HR-направлением в Roblox, а еще раньше занимал руководящие посты в Google и Palantir.
Особое внимание OpenAI планирует уделить переходу к рабочим процессам на базе ИИ. Компания хочет показать на своем примере, что нейросети должны не заменять людей, а расширять их возможности.
openai.com
@ai_machinelearning_big_data
#news #ai #ml
Reddit / Twitter:
«Ты полный идиот»
Stack Overflow:
«Вы абсолютно неправы»
ChatGPT:
«Вы абсолютно правы»
@ai_machinelearning_big_data
✔️ OpenAI обновила API.
Компания выпустила 2 апдейта для повышение стабильности аудиоинтерфейсов и производительности агентов.
Первый - модель gpt-realtime-1.5 для Realtime API. Она оптимизирована для более надежной работы с голосовыми командами. По данным OpenAI, точность распознавания произнесенных цифр и букв выросла на 10%. Модель на 5% лучше справляется с логическими задачами в аудиоформате и на 7% точнее следует инструкциям. Базовая аудиомодель тоже получила минорное обновление до версии 1.5.
Второй - нативная поддержка WebSockets в Responses API. Раньше при каждом запросе приходилось заново передавать весь контекст диалога. Теперь API поддерживает постоянное соединение, отправляя только новые данные по мере их поступления. Это кардинально снижает задержки и ускоряет работу сложных ИИ-агентов с частыми вызовами внешних инструментов на 20–40%.
OpenAI for Developers в сети Х
✔️ Статья Anthropic про способность Claude Code обрушила акции IBM на 13%.
Anthropic расширила возможности Claude Code, нацелив его на автоматическую модернизацию систем, написанных на COBOL. Этот шаг нанес серьезный удар по IBM, главному игроку на рынке обслуживания старых мейнфреймов.
Несмотря на возраст, COBOL остается фундаментом для финансов, авиации и госсектора: на нем обрабатывается 95% транзакций в США. Главная проблема бизнеса заключалась в растущем дефиците специалистов и высокой стоимости анализа старой кодовой базы.
Теперь Claude Code берет этот процесс на себя. Он выстраивает карту зависимостей в коде, документирует рабочие процессы и выявляет скрытые риски, выполняя многомесячную работу аналитиков.
cnbc.com
✔️ ИИ-платформа ProducerAI стала частью Google Labs.
Google включила сервис ProducerAI в состав Google Labs. Платформа позиционируется как виртуальный соавтор, который создает полноценные треки по текстовым запросам, пишет тексты и настраивает звучание отдельных инструментов.
ProducerAI опирается на стек из Gemini, Veo, Nano Banana и Lyria 3. Самое интересное - функция Spaces, где виртуальные инструменты и эффекты можно задавать человеческим языком: просто описываете нужный звук текстом, а система собирает под него плагин. Готовые пресеты можно скидывать в сообщество и ремиксовать чужие.
Доступ выкатили сразу для 250 стран. Есть бесплатный тариф и платные подписки. Весь сгенерированный контент помечается SynthID.
blog.google
✔️ Десктопные AMD Ryzen AI 400 для AM5 выйдут во 2 квартале 2026 года.
AMD подтвердила планы по выпуску настольных версий линейки Ryzen AI 400. Согласно документации к выставке CES 2026, первыми дебютируют ноутбуки с новыми чипами, а релиз для десктопов запланирован на 2 квартал. В сеть уже утекли рендеры корпоративной серии PRO - значит, официальный анонс явно на подходе.
Новые десктопные APU объединят под кодовым названием Gorgon Point. Технически это обновление существующих мобильных дизайнов Strix Point и Krackan Point.
Пока неясно, будут ли настольные решения использовать оба варианта кристаллов или только один из них. Также остается открытым вопрос, закроет ли компания эти чипы исключительно в корпоративном сегменте.
videocardz.com
✔️ На заводе Toyota в Канаде начнут работать 7 человекоподобных роботов Digit.
В апреле этого года на заводе по сборке кроссоверов RAV4 начнется коммерческая эксплуатация 7 двуногих роботов Digit от компании Agility Robotics. Переход от пилотного тестирования к работе на реальной производственной линии - важный прецедент для промышленности.
Машины интегрируются в рабочий процесс по бизнес-модели Robots-as-a-Service. Их главной задачей станет разгрузка и перемещение контейнеров с деталями от автоматизированных буксировщиков. Передавая рутину машинам, Toyota хочет избавить сотрудников от монотонного и изматывающего труда.
Тренд на двуногих роботов в реальном секторе стремительно набирает обороты: ранее Digit вышли на склады логистического гиганта GXO, а прямые конкуренты из Figure AI обкатывают свои решения на заводах BMW.
agilityrobotics.com
@ai_machinelearning_big_data
#news #ai #ml
✔️ OpenAI заморозила проект Stargate.
Мегапроект, который OpenAI планировала запустить вместе с SoftBank и Oracle, фактически остановлен. Причиной стали корпоративные разногласия, дефицит инженерных кадров и опасения инвесторов - по прогнозам, к 2027 году компания могла столкнуться с нехваткой капитала.
Но 10 ГВт запланированных мощностей все равно нужны. Поэтому OpenAI включила резервный план. Компания арендует сервера у тех же Oracle и SoftBank, а заодно активно скупает ресурсы у AWS и Google Cloud. Фокус сместился на локальные дата-центры - вроде того, что сейчас строят в Техасе на 1,2 ГВт.
В результате такой смены курса общие прогнозируемые расходы OpenAI на инфраструктуру к 2030 году возрастут до 600 млрд. долларов.
theinformation.com
✔️ Anthropic обвинила китайские лаборатории в дистилляции Claude.
Вслед за OpenAI, Anthropic заявила о масштабной дистилляции знаний. По словам компании, всего было чгенерировано более 16 млн. запросов к Claude сетью из 24 тыс. аккаунтов через прокси-сервисы в обход региональных ограничений.
Главной целью был сбор датасетов для копирования ризонинга, написания кода и работы с инструментами. По данным Anthropic, DeepSeek извлекала алгоритмы пошаговых рассуждений и варианты обхода фильтров. Moonshot выкачивала данные по кодингу и CV, а MiniMax перехватывала логику новейших версий Claude буквально в день их релиза.
Для защиты своей инфраструктуры компания уже развернула системы, автоматически блокирующие нелегальный API-трафик.
anthropic.com
✔️ NVIDIA открыла код и модели проекта DreamDojo.
DreamDojo - генеративная модель мира, которую учили на 45 тысяч часов видео от первого лица. Люди на записях занимаются обычной бытовой рутиной - складывают одежду, собирают вещи. А модель, просто глядя на это, выучивает законы физики.
Система выдает симуляцию в реальном времени на скорости около 11 FPS. Этого хватает, чтобы обкатывать алгоритмы в виртуалке и не ломать дорогие физические прототипы. Но фишка релиза в том, что виртуальным роботом можно управлять через VR-контроллеры прямо внутри сгенерированной реальности.
Обе версии модели, на 2 и 14 млрд. параметров, опубликованы под лицензией, разрешающей в том числе коммерческое использование.
Jim Fan (NVIDIA Director of Robotics) в сети Х
✔️ В коде ChatGPT обнаружили новый тариф Pro Lite за $100 в месяц.
Тибор Блахо нашел во коде веб-версии ChatGPT упоминания нового уровня подписки. Судя по всему, OpenAI планирует тариф Pro Lite, чтобы закрыть нишу между планом Plus и флагманским Pro.
Согласно найденным фрагментам кода, Pro Lite предложит в 3–5 раз больше квот на использование ризонинг-моделей по сравнению с Plus. Кроме того, план, вероятно, получит расширенные лимиты для Codex. Официальных заявлений о сроках запуска нового тарифа OpenAI пока не публиковала.
gizmochina.com
✔️ Сгенерированные лица людей стали слишком идеальными.
Ученые из Австралии выяснили, что современные нейросети перешагнули порог визуального распознавания. В ходе эксперимента со 125 участниками обычные люди отличали сгенерированные лица от настоящих лишь немногим лучше, чем при случайном угадывании. Даже обладатели выдающейся зрительной памяти показали минимальное преимущество перед контрольной группой.
Сложность связана с изменением самой природы визуальных ошибок ИИ. Если ранние генеративные модели оставляли заметные артефакты, то современные синтетические лица выдают себя исключительно своей безупречностью. Нейросети создают гиперреалистичные, абсолютно симметричные и статистически усредненные портреты с идеальными пропорциями.
Авторы предупреждают, что этот искусственный перфекционизм скоро сломает системы биометрии и безопасности. Проверить собственную наивность можно в онлайн-демо исследования.
unsw.edu.au
@ai_machinelearning_big_data
#news #ai #ml
📌Толковый калькулятор расчета инференса и дообучения LLM.
Бесплатная тулза, которая помогает понять, какой GPU нужен под конкретную задачу до того как потрачен бюджет или наблюдается стойкий ООМ.
Выбираете параметры инференса: архитектуру модели, тип квантования, sequence length и batch size, указываете спеки железа и получаете стату, распределение памяти, примерные метрики производительности и энергопотребления. Есть даже эмуляция скорости инференса с TTFT.
Параметры расчета дообучения учитывают: конфиг датасета (количество сэмплов, среднее токенов на сэмпл, эпохи) и использование оптимизаторов. Плюс, еще посчитает время обучения.
Цифры часто получаются чуть выше реального потребления (что даже хорошо), но точности до гигабайта ждать не стоит.
Для грубой прикидки перед закупкой или деплоем - отличная вещь.
@ai_machinelearning_big_data
#AI #ML #LLM #VRAMCalculator