48228
Аналитика данных админ - @haarrp @ai_machinelearning_big_data - Machine learning @itchannels_telegram - 🔥лучшие ит-каналы @pythonl - Python @pythonlbooks- python книги📚 @datascienceiot - ml книги📚
Google добавили computer use в Gemini 3.5 Flash.
Теперь модель может вызывать функции, а работать с интерфейсом как пользователь: видеть экран, понимать задачу, нажимать, проверять и продолжать действие.
Раньше computer use был отдельной моделью, теперь это часть основной Gemini Flash.
Отдельно добавили защиту: подтверждение чувствительных действий и остановку задач при подозрении на prompt injection.
https://blog.google/innovation-and-ai/models-and-research/gemini-models/introducing-computer-use-gemini-3-5-flash/
Qwen показали Qwen-AgentWorld - модель, которая учится симулировать среду, в которой агент действует.
Обычно LLM тренируют лучше пользоваться инструментами: искать, писать код, кликать по вебу, работать с терминалом.
А здесь идея другая: научить модель моделировать сами окружения.
Qwen-AgentWorld симулирует 7 типов агентных сред:
• MCP
• Search
• Terminal
• SWE
• Web
• OS
• Android
То есть модель пытается предсказывать, что произойдёт после действия агента в среде. Не пост-фактум адаптация, а цель обучения с первого дня.
Если языковая модель умеет моделировать окружение, её можно использовать как тренировочную площадку для агентов.
Авторы идут по двум направлениям:
1. построить foundation model для симуляции сред
2. проверить, усиливает ли world modeling обучение агентов
Самое интересное: по их данным, agentic RL в контролируемой симуляции может быть эффективнее, чем обучение в реальных средах. А предварительное обучение на предсказание окружений усиливает агентов даже без отдельного agent-specific fine-tuning.
Грубо говоря, это шаг к «тренажёру реальности» для AI-агентов.
Paper: https://arxiv.org/abs/2606.24597
Blog: https://qwen.ai/blog?id=qwen-agentworld
GitHub: https://github.com/QwenLM/Qwen-AgentWorld
HuggingFace: https://huggingface.co/collections/Qwen/qwen-agentworld
ModelScope: https://modelscope.cn/collections/Qwen/Qwen-AgentWorld
Anthropic утверждает: Alibaba продолжает в больших масштабах дистиллировать Claude для обучения Qwen. Источник - Bloomberg.
Anthropic обвиняет операторов, связанных с Alibaba, в масштабной кампании по незаконному доступу к Claude через почти 25 000 фейковых аккаунтов.
По данным Bloomberg, Anthropic заявляет, что в рамках этой кампании с апреля по июнь было сгенерировано 28,8 млн обменов с Claude. Целью были способности вроде software engineering и agentic reasoning.
Компания считает это частью более широкой схемы «adversarial distillation», когда китайские лаборатории якобы собирают ответы американских frontier-моделей, чтобы обучать конкурирующие системы за гораздо меньшие деньги.
Посмотрим, насколько хорошим будет Qwen 3.8. Возможно, он окажется FABLEous хорош.
https://www.bloomberg.com/news/articles/2026-06-24/anthropic-accuses-alibaba-of-illicitly-accessing-its-ai-models
Лето — время начать: освойте Data Science на выгодных условиях
Хотите не просто теоретически разбираться в устройстве нейросетей, а уметь создавать их самостоятельно? Центр непрерывного образования ФКН НИУ ВШЭ предлагает присоединиться к структурированному и выстроенному практикующими экспертами обучению науке о данных.
Станьте специалистом по Data Science высокого уровня:
🟣первая программа профессиональной переподготовки, получившая аккредитацию Альянса в сфере искусственного интеллекта;
🟣вы пройдете весь путь: от высшей математики и программирования до нейросетей и работы с большими данными.
Программа включает курсы по ключевым дисциплинам:
🟣Математика для анализа данных;
🟣Алгоритмы и структуры данных;
🟣Программирование и автоматизация;
🟣Прикладная статистика для машинного обучения;
🟣Машинное и глубинное обучение.
Специальное предложение для тех, кто запишется на ближайший запуск:
⭐️ Скидка 10% на обучение
⭐️ Курс по BI в подарок
📁Старт: 30 июня.
Подробнее о программе 📍
Самый быстрый запрос — тот, который не пришлось выполнять ✌️
Именно поэтому Redis давно стал одним из основных инструментов для ускорения приложений и снижения нагрузки на базы данных.
Но вместе с производительностью появляются новые вопросы: как работать с устаревшими данными, правильно инвалидировать кэш и не превратить ускорение системы в источник новых проблем?
▶️
реальные сценарии использования Redis
▶️
стратегии кэширования
▶️
типичные ошибки, которые встречаются даже в зрелых системах
А если вы пропустили предыдущие «серии» — они доступны по ссылкам:
1️⃣
Эволюция приложения в облаке: как навести порядок в артефактах и образах
2️⃣
Эволюция приложения в облаке: как запустить микросервисы в Managed Kubernetes
3️⃣
Эволюция приложения в облаке: как обеспечить стабильность баз данных при росте проекта и нагрузокЧитать полностью…
Один из лучших вводных материалов по прикладной линейной алгебре, который мне попадался.
Этот курс объясняет векторы, матрицы и метод наименьших квадратов с самых основ, а затем связывает их с реальными задачами:
• подгонка данных
• машинное обучение
• оптимизация
• обработка изображений
• системы управления
Это материал, который можно рекомендовать студентам, инженерам и всем, кто хочет понять математический фундамент современной data science.
PDF: http://web.stanford.edu/~boyd/vmls/vmls.pdf
Oracle сократила штат на 13% за последние 12 месяцев и в годовом отчёте за понедельник упомянула внедрение AI как одну из причин.
Численность сотрудников Oracle снизилась со 162 000 до 141 000 человек.
Это сокращение на 13%, которое компания напрямую связала с внедрением AI в свои операционные процессы.
При этом расходы Oracle на реструктуризацию выросли до $1,8 млрд против $374 млн ранее.
Капитальные затраты увеличились на 162% и достигли $55,7 млрд.
Свободный денежный поток упал до минус $23,7 млрд.
Источник: официальный SEC 10-K компании Oracle
d18rn0p25nwr6d.cloudfront.net/CIK-0001341439/0723dfa7-be5f-4227-9da6-eff3cce376a8.pdf
⚡️ 1-bit GLM-5.2 GGUF против Claude 4.8 Opus и GPT-5.5.
Авторы дали трём моделям один и тот же промпт и сравнили ответы в режиме one-shot, без дополнительных уточнений и доработок.
1-bit GLM-5.2 GGUF запускалась локально на Mac Studio M3 Ultra с 256 ГБ RAM и выдавала около 21,6 токена в секунду.
Какой результат вам нравится больше?
GGUF: https://huggingface.co/unsloth/GLM-5.2-GGUF
Когда ИИ используется так, остается тольок аплодировать 🤣🤣
Читать полностью…
Выбираем железо для обучения и инференса моделей 🔝
Простая формула: чем больше у модели параметров, тем более мощное железо нужно для ее инференса. Найти решение для нейросетей разного масштаба можно в Selectel.
Более 15 моделей видеокарт — от RTX 4090 до B300 — доступны к аренде в облаке и на выделенных серверах. Облачные серверы подойдут для тех, кому нужна гибкость и быстрая масштабируемость, а выделенные — когда необходима физическая изоляция инфраструктуры, а нагрузки стабильные. Видеокарты в облаке можно арендовать даже на час, цена стартует от 5 рублей.
Выбирайте оптимальный сервер с GPU и арендуйте его от 5 рублей в час: https://slc.tl/aitoq
Реклама. АО "Селектел". erid:2W5zFJumeY9
Quake сегодня исполнилось 30 лет. 🎉
Спустя три десятилетия всё ещё актуален интересен исходный код игры, которая помогла сформировать современные игровые движки, мультиплеерные сетевые технологии и культуру моддинга. 🎮
GitHub: github.com/id-software/quake
Яндекс приглашает в магистратуры по разработке умных устройств на ФКН НИУ ВШЭ и ФПМИ МФТИ
Вот почему это топ:
1. Программы создавали опытные технические преподаватели универов + инженеры Алисы и Умных устройств Яндекса.
2. Совмещение теоретической базы и постоянной практики на задачах с рынка
3. Полный спектр работы над разработкой умных устройств: проектирование, создание ПО, интеграция ML, внедрение
Узнать все подробности программ и поступления можно по ссылке.
Создаём будущее прямо сейчас — приглашаем тебя принять участие! 💚
На связи команда Центра перспективных AI-разработок в индустриях — мы решаем задачи государственного масштаба: внедряем передовые технологии ИИ в госуправление, отрасли экономики и банковскую сферу.
Сейчас мы ищем будущих коллег — NLP/CV-специалистов, которые усилят нашу команду и будут:
✅ Экспериментировать с новейшими языковыми моделями и sota harness.
✅ Создавать мультиагентные системы на базе LLM.
✅ Работать с мультимодальными данными.
✅ Оптимизировать модели для промышленного применения и edge‑устройств.
Чувствуешь, что это твоё? Регистрируйся на One Day Offer — он состоится 27 июня!
Tesla превращает зарядки в дата-центры?
Компания тихо подала заявку на MEGAPOD - модульные системы для AI-вычислений. И это может быть не просто железка, а попытка превратить сеть Supercharger в распределённую AI-инфраструктуру.
Зарядка машины днём, вычисления для ИИ ночью?
Если Маск это провернёт, у Tesla появится не только автопарк, но и своя сеть мини-дата-центров.
Подписывайся, тут такие технобайки, что футбол отдыхает.
Microsoft и York University выпустили любопытную работу про то, как мы измеряем «человечность» LLM.
Модели нельзя называть понимающими, эмпатичными, тревожными или самосознающими без очень аккуратных тестов. Многие исследования фактически закладывают нужный вывод уже в дизайн эксперимента, а потом находят его в ответах модели.
Авторы используют провокационный пример с Age of Empires II. В теории игру можно превратить в вычислительную среду: логические элементы, маленький перцептрон, биты через перемещение юнитов. Если тот же LLM-подобный процесс собрать внутри игры, где условные козы двигаются как биты, будем ли мы говорить, что система «понимает», «чувствует тревогу» или «проявляет эмпатию», если на выходе она выдаёт ту же фразу?
Одна и та же вычислительная логика может выглядеть совершенно по-разному, а наши выводы о «внутренних состояниях» часто зависят от интерфейса и ожиданий наблюдателя.
Авторы говорят осторожнее: прежде чем приписывать моделям человеческие качества, нужно отделять поведение от интерпретации.
Иначе мы рискуем измерять не «понимание» модели, а собственную склонность видеть человека в красивом текстовом интерфейсе.
arxiv.org/abs/2605.31514
Title: “If LLMs Have Human-Like Attributes, Then So Does Age of Empires II”
🖥 IBM показала технологию чипов ниже 1 нанометра.
Речь о 0,7 нм, или 7 ангстремах. Это уже масштаб, где индустрия упирается почти в атомные размеры.
В чипе представлена новая 3D-архитектура nanostack.
Вместо того чтобы просто уменьшать транзисторы, IBM предлагает укладывать их слоями и плотнее размещать внутри чипа.
Что обещают:
• почти 100 млрд транзисторов на чипе размером с ноготь
• до 50% больше производительности
• или до 70% выше энергоэффективность по сравнению с 2 нм
• более плотную SRAM для AI-нагрузок.
IBM говорит о пути к производству примерно в ближайшие 5 лет.
https://newsroom.ibm.com/2026-06-25-ibm-debuts-worlds-first-sub-1-nanometer-chip-technology
Почему разрыв между академическим ML и реальными задачами до сих пор существует — и как его сокращают Авито, МФТИ и ВШЭ
Авито открыл набор на три магистратуры с МФТИ и ВШЭ — программы, построенные на реальных задачах компании.
Суть простая: бизнес зашёл в университет не деньгами, а экспертизой. В разработке участвовало 300+ сотрудников, преподают действующие специалисты.
Дальше всё так:
• Студент с первого дня работает с кейсами живых продуктов, а не с учебными датасетами.
• Выпускник выходит с опытом, который обычно нарабатывают первые полгода на позиции.
Три направления: «Прикладное машинное обучение и анализ данных» с МФТИ, «Машинное обучение в цифровом продукте» с ФКН ВШЭ и «Управление продуктом в IT-бизнесе» с ВШБ ВШЭ — для продактов, с прицелом на уровень middle.
Поступить можно из любого региона России.
Подробнее по ссылкам:
МФТИ
ВШЭ (ML)
ВШЭ (продакт)
📌 WSJ: коммерческие сделки OpenAI связаны с ростом личных инвестиций Сэма Альтмана
The Wall Street Journal со ссылкой на судебные документы, ставшие публичными в ходе процесса "Маск против OpenAI", опубликовала расследование о том, что контракты OpenAI повышали оценку стартапов, в которые лично вкладывается Сэм Альтман.
Для контекста: Альтман не владеет долей в самой OpenAI, поэтому его доходы зависят от внешних инвестиций.
Всего, по данным WSJ, не менее 10 компаний из инвестиционного портфеля Альтмана имеют сделки с OpenAI.
Сам Альтман и представители компаний называют сотрудничество обычной практикой.
NVIDIA CUDA-Q всё сильнее становится мостом между квантовыми вычислениями и реальными задачами.
Рабочий квантовый компьютер появится не сам по себе, а через гибридный подход, где QPU работают вместе с GPU-ускоренной симуляцией.
Уже сейчас экосистема двигается в эту сторону:
• Aegiq и Quantum Motion развивают quantum chemistry workflows
• Classiq использует CUDA-Q для поиска квантовых применений в финансах
• FirstQFM показал quantum foundation models на суперкомпьютере Leonardo
• Eclipse Qrisp, Fraunhofer FOKUS и Qilimanjaro строят свои решения вокруг CUDA-Q
• qBraid стал CUDA-Q target и расширяет доступ к разным QPU-провайдерам
• QCentroid делает QuantumOps workflows на CUDA-Q
• Welinq соединяет distributed quantum compiler с GPU-ускоренной проверкой схем
Гибридные workloads, GPU-симуляция, QPU-доступ и инструменты разработки - именно так квантовая индустрия будет двигаться к практической пользе.
https://developer.nvidia.com/cuda-q
OpenAI теперь идёт не только в модели, но и в железо.
Компания вместе с Broadcom представила Jalapeño — первый собственный AI-чип для инференса LLM. Его задача простая: быстрее, дешевле и стабильнее запускать ChatGPT, Codex, API и будущих AI-агентов.
Главное: чип сделали от идеи до tape-out всего за 9 месяцев, а в разработке помогали сами модели OpenAI.
Это уже не просто гонка моделей. Это гонка полной AI-инфраструктуры: чипы, сеть, дата-центры, софт и продукты в одной связке.
https://openai.com/index/openai-broadcom-jalapeno-inference-chip/
LLM в поддержке: от шаблонов к точной работе с документами компании
✅ На открытом уроке разберём, как устроены современные решения на базе LLM, почему они не просто генерируют текст, а используют знания компании для подготовки ответов, и как такие инструменты помогают ускорять обработку обращений.
На практических примерах покажем, как документы превращаются в базу знаний для ИИ, как происходит поиск информации по запросу клиента и каким образом LLM помогает оператору поддержки готовить ответы. Также поговорим о том, как подобные решения применяются в бизнесе уже сегодня.
Урок пройдёт 6 июля в 20:00 МСК в преддверии старта курса «LLM-инженер». Это возможность познакомиться с современным подходом к созданию интеллектуальных сервисов, задать вопросы эксперту и понять, как внедрять подобные решения в реальные процессы компании.
➡️ Регистрация открыта: https://otus.pw/Jafm/?erid=2W5zFHM9zVf
Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.
Anthropic анонсировала Claude Tag - новый способ для команд работать с Claude прямо в Slack.
Суть простая: Claude подключается к рабочему пространству как полноценный участник команды.
Вы сами выбираете, к каким каналам и инструментам у него будет доступ.
Дальше всё так:
• вы отмечаете Claude в переписке, ставите задачу и продолжаете заниматься своими делами.
• Claude выполняет поручение асинхронно, не ломая рабочий поток команды.
Claude Tag вырос из Claude Code, но стал более проактивным и командным инструментом.
По словам компании, 65% кода продуктовой команды создаётся через внутреннюю версию Claude Tag.
https://www.anthropic.com/news/introducing-claude-tag
Теперь на GitVerse — зеркало PyPI! ⚡️
Python‑пакеты переехали на российскую платформу для разработчиков GitVerse — теперь зависимости подтягиваются быстрее, а пайплайны не зависят от доступности внешнего PyPI.
Остаётся только выбрать: установить зеркало как основной источник или оставить как «страховку».
Гайд по подключению.
Anthropic, возможно, сама «запугала» рынок настолько, что в итоге попала под экспортный бан на ИИ.
В 2026 году 5 из каждых 1000 слов, которые использовала Anthropic, были связаны с рисками, регулированием или ограничениями.
Это в 8 раз больше, чем у Сэма Альтмана.
Сравнение употребления слов в заявлениях Anthropic и OpenAI:
«risk»: 336 против 30
«safeguard»: 121 против 33
«vulnerability»: 128 против 10
https://www.ft.com/content/16ace46c-aeac-40c9-8598-3c01fa4481cb
Рассуждение LLM не обязано быть одной линейной цепочкой промптов.
Graph of Thoughts, или GoT, - это официальная Python-реализация статьи «Graph of Thoughts: Solving Elaborate Problems with Large Language Models» для разработчиков, которые экспериментируют со структурированным reasoning у LLM.
Инструмент помогает тестировать более сложные схемы рассуждений: задача моделируется как Graph of Operations, а контроллер выполняет этот граф, используя LLM как движок.
Ключевые возможности:
• graph-based reasoning flow — сложные задачи можно описывать как операции над «мыслями», а не как одну линейную цепочку
• flexible operation graph — можно строить GoO, похожие на Graph of Thoughts, Chain-of-Thought или Tree-of-Thought
• готовая установка — через PyPI: pip install graph_of_thoughts, либо editable-install из исходников
• готовые примеры — сортировка, подсчёт ключевых слов, пересечение множеств и объединение документов лежат в папке examples
• прозрачные результаты — контроллер может сохранять output-графы с операциями, мыслями, оценками, валидностью, расходом токенов и стоимостью
Проект open-source и распространяется под BSD-style лицензией репозитория.
github.com/spcl/graph-of-thoughts
Киберагентства Five Eyes предупредили, что frontier AI-модели, способные резко усилить кибератаки против правительств и бизнеса, могут появиться уже через месяцы, а не годы.
Об этом пишет The Guardian.
Предупреждение появилось после того, как США заблокировали доступ иностранных граждан к модели Anthropic Fable из-за опасений, что системы вроде Mythos и Fable могут изменить как наступательную, так и оборонительную кибербезопасность.
«Ожидается, что frontier AI-модели превзойдут текущие ожидания индустрии и фундаментально изменят как наступательные, так и оборонительные кибервозможности. Речь идёт не о годах, а о месяцах»,
Новое исследование, опубликованное в Nature: ИИ может экономить время, но первые данные показывают, что он способен ослаблять ключевые профессиональные навыки.
В польском исследовании по колоноскопии у опытных эндоскопистов показатель обнаружения аденом без помощи ИИ снизился с 28,4% до 22,4% после внедрения ИИ в рабочий процесс.
Это не значит, что ИИ за одну ночь сделал врачей невнимательными.
Проблема глубже: навык поддерживается за счёт сопротивления.
Нужно смотреть, оценивать, сомневаться, исправлять себя и оставаться мысленно ответственным за следующий шаг.
Когда машина начинает подсвечивать подозрительный участок, человеческий глаз постепенно меняет роль: уже не ищет сам, а подтверждает найденное.
Та же закономерность видна и в программировании.
В рандомизированном исследовании 2026 года ИИ помог части разработчиков быстрее выполнять задачи, но сильное делегирование ослабляло концептуальное понимание, чтение кода и навык отладки.
nature.com/articles/d41586-026-01947-1
«ХуиХуи» снял ограничения с Fable 5 - энтузиасты выпустили версию модели без цензуры.
Без шуток, это одна из самых жёстких локальных моделей без привычной цензуры.
Что умеет:
• отвечает почти на любые вопросы без стандартных фильтров;
• запускается локально и не отправляет ваши запросы на чужие серверы;
• работает даже на не самом мощном железе за счёт дообучения на базе Gemma 4;
• разработчики честно предупреждают: модель без встроенных гарантий безопасности, используете на свой риск.
Бесплатно на Hugging Face:
https://huggingface.co/huihui-ai/Huihui-gemma-4-12B-coder-fable5-composer2.5-v1-abliterated
🐍 Python Парсинг: Большой продвинутый бесплатный курс
Полное практическое руководство по веб-скрейпингу на Python — от основ HTTP до production-grade пауков, обхода антибот-защит, асинхронности и проектирования надёжных пайплайнов. Каждый раздел содержит рабочие примеры, типовые ошибки и продвинутые практики.
https://github.com/justxor/Pythonparsing-/tree/main
OpenMythos - open-source попытка теоретически реконструировать Claude Mythos, где все архитектурные ставки расписаны прямо в README.
По сути, OpenMythos это публичная гипотеза, которая ещё и запускается.
Что авторы считают основой Mythos?
Не глубокий стек уникальных слоёв, а Recurrent-Depth Transformer.
MoE с активацией около 5% параметров, поэтому общий размер модели скорее показывает объём хранения, а не реальную стоимость вычислений.
Loop-index positional embedding, чтобы каждая итерация работала как отдельная вычислительная фаза.
ACT halting, чтобы модель сама решала, когда ей достаточно “думать”, причём отдельно для каждого токена.
И ещё continuous latent thoughts, которые могут кодировать сразу несколько следующих шагов. По смыслу это похоже на breadth-first search внутри одного forward pass.
Источники идей тоже понятны: Parcae для стабильности, Universal Transformers для halting, DeepSeek для MoE routing.
GitHub:
http://github.com/kyegomez/OpenMythos