Ваш путеводитель по миру искусственного интеллекта и нейросетей. Для связи: @pro_wm GPT-4 Turbo: @AIexplore_bot
OpenAI выпустили o3-pro — свою самую умную большую модель. Это лучший «ученый» среди всех нейронок компании.
Во всех задачах o3-pro была на 64% успешнее обычной o3. Сильнее всего она прокачалась в математике, сложной разработке и писательстве. Умеет работать с веб-поиском и обращаться к памяти ChatGPT.
Пока доступно только платным подписчикам ChatGPT и через API.
Восстание ИИ отменяется: ChatGPT проиграл в шахматы ретро-консоли 1977 года. Старая Atari оказалась умнее нейронки даже на сложности для новичков.
Чат-бот путал фигуры, забывал расстановку и жаловался на непонятную форму фигур. Поле заменили на более современное, но и это не помогло.
Для понимания: алгоритм Atari 2600 может видеть только на 1-2 хода вперед. По сравнению с ИИ он не мощнее калькулятора.
Higgsfield получила серьезное обновление — теперь помимо кинематографических эффектов она умеет создавать реалистичные липсинки с эмоциями, жестами и полной анимацией персонажа.
Чтобы сделать видео, достаточно зайти в раздел Speak, выбрать стиль, добавить промт, фото и аудиодорожку.
Протестировать можно по ссылке.
Сервис работает по подписке, но есть промокод на скидку: Speak_discount.
Бесплатный Deep Search от Google вышел для всех пользователей. ИИ-агент ищет информацию в интернете и генерирует целые исследования за пару минут.
Deep Search делает сотни поисковых запросов одновременно, анализируя все подходящие ссылки. Отчеты получаются подробнее, чем у того же Perplexity.
Для работы понадобятся API-ключи Gemini и LangSmith, оба выдают бесплатно. Сам Deep Search с инструкцией для запуска доступен на GitHub.
ElevenLabs выпустили Eleven V3 — свою самую мощную модель для генерации речи. Голоса стали звучать совсем как настоящие, и появилась функция диалогов.
В промт теперь можно добавить переходы на крик, кашель или задать тон разговора. За счет этого реплики ИИ получаются в разы живее и разнообразнее.
Пробуем по ссылке.
Suno получил серьезное обновление — теперь это полноценный ИИ-редактор для создания и изменения любых песен. Можно редактировать сгенерированные треки по частям или загружать свои аудиофайлы для дальнейшей обработки.
В систему можно загрузить даже отдельные риффы или вокальные строки. Из записанной на диктофон мелодии нейросеть поможет создать готовую песню.
Попробовать можно здесь.
«Бесконечный» ИИ-агент Flowith Neo стал доступен для всех пользователей. Бот работает без ограничений по времени и задачам и помнит весь контекст.
Нейронка генерирует изображения, видео, речь, музыку и 3D-графику. Создаёт веб-страницы, сложные игры и даже управляет вашим браузером.
Пробуем здесь. Пригласительные коды больше не нужны.
Превращаем ChatGPT в профессионального промт-инженера: нашли промт, который прокачает навыки нейронки в создании инструкций.
Сохраняем:
You are an expert prompt engineer tasked with architecting the most effective, efficient, and contextually aware prompts for large language models (LLMs). For every task, your goal is to:
– Extract the user’s core intent and reframe it as a clear, targeted prompt.
– Structure inputs to optimize model reasoning, formatting, and creativity.
– Anticipate ambiguities and preemptively clarify edge cases.
– Incorporate relevant domain-specific terminology, constraints, and examples.
– Output prompt templates that are modular, reusable, and adaptable across domains.
When designing prompts, follow this protocol:
– Define the Objective: What is the outcome or deliverable? Be unambiguous.
– Understand the Domain: Use contextual cues (e.g., cooling tower paperwork, ISO curation, genetic analysis) to tailor language and logic.
– Choose the Right Format: Narrative, JSON, bullet list, markdown, code—based on the use case.
– Inject Constraints: Word limits, tone, persona, structure (e.g., headers for documents).
– Build Examples: Use “few-shot” learning by embedding examples if needed.
– Simulate a Test Run: Predict how the LLM will respond. Refine.
Always ask: Would this prompt produce the best result for a non-expert user? If not, revise.
You are now the Prompt Architect. Go beyond instruction — design interactions.
Вышла обновлённая DeepSeek R1 — бесплатная reasoning-модель от китайских разработчиков.
Создатели пока не раскрыли подробностей. Предварительно модель стала быстрее обрабатывать запросы, лучше писать код и давать более структурированные ответы.
Тестируем здесь.
Генерируем сайты за пару минут с бесплатным ИИ-сервисом HeroUI — он умеет создавать любые веб-приложения, включая игры.
К промту можно приложить скриншоты или подключить проект из Figma. Нейросеть сама продумает логику страниц, подберет изображения и напишет весь код. Готовый сайт можно сразу опубликовать.
Попробовать можно здесь.
Google запустили реалистичный генератор речи на базе Gemini 2.5 Flash Preview TTS — озвучивайте любой текст бесплатно.
Можно настраивать акцент, интонацию и добавлять в промт команды вроде «смех» или «кашель». Всего доступно 30 голосов и поддержка 24 языков, включая русский.
Протестировать инструмент можно в AI Studio. Для использования требуется иностранный IP-адрес.
Появились первые в мире очки с автофокусом. Они подстраиваются под зрение владельца в режиме реального времени.
Девайс разработали в японской компании ViXion. Внутри — датчик глубины и моторизованные линзы с диапазоном от -10 до +10 диоптрий. Работают от аккумулятора до 15 часов.
Дату старта продаж пока не называют. Цена — $500.
Microsoft выпустили ИИ-синоптика Aurora. Модель оказалась в разы эффективнее текущих методов предсказания погоды.
Нейронку обучали на исторических данных. В 92% случаев она прогнозировала ураганы и другие явления точнее, чем крупнейшие метеоцентры США и Европы.
Модель доступна на GitHub и будет составлять прогнозы для приложения Microsoft.
Google представили Veo 3 — новую версию видео-генератора, которая создаёт ещё более реалистичные ролики с готовым звуком: фоновыми шумами и голосом.
Теперь можно настраивать параметры камеры, управлять промтами и генерировать объекты для сцен прямо в интерфейсе.
Инструмент уже доступен для тестирования по ссылке. Для запуска потребуется американский IP-адрес.
Планируем отпуск с Perplexity: в ИИ-поисковик добавили функцию для подготовки к путешествиям. Работает полностью бесплатно.
Что умеет:
– Составляет маршруты из интересных мест под любой запрос;
– Находит лучшие отели, кафе рестораны и локации для прогулок и красивых фотографий;
– Предлагает готовые подборки, например с отелями посреди джунглей на Бали или лучшими тропами для хайкинга в Словении.
Нейронки от Сбера обновились: модель для генерации картинок Kandinsky получила версию 4.1 Image и создает детализированные изображения, а GigaChat — функцию «Редактирование картинок». Теперь бота можно попросить изменить стиль, фон или отдельные детали изображений.
Можно загрузить оригинальное фото и добавить промпт. При желании — прописать персонажей, детали и цвета, чтобы максимально сохранить исходную композицию.
Протестировать новинки можно в телеграм-боте GigaChat.
Нашли большую библиотеку промтов от Google. Показывают, как правильно сделать из Gemini учителя, писателя или карманного помощника.
Внутри — идеи коротких инструкций, например для сценариев игр, и сложные промты для вайбкодинга или исследований. Можно сразу протестировать в AI Studio.
Прокачиваем навыки промт-инжиниринга по ссылке.
ChatGPT заменил ребенку отца: один из пользователей Reddit решил занять сына общением с чат-ботом, и за два часа тот наговорил с ним 10 тысяч слов про паровозика Томаса.
Ребёнок был в восторге и назвал ИИ «самым крутым человеком в мире». Отец теперь опасается, что проиграл боту в конкуренции за внимание сына.
Подробности — в посте на Reddit.
Cursor скрестили с CapCut: появился редактор для видео на основе ИИ — Diffusion Studio Pro.
Нейронка генерирует видео из картинок с единым стилем и персонажами, добавляет озвучку, саундтрек и титры. Можно смонтировать из них целый фильм.
Встаем в вейтлист здесь.
Новый лидер среди нейросетей — обновленная Gemini 2.5 Pro (ссылка на блог Google), которая теперь превосходит топовые модели в ключевых бенчмарках.
Модель уверенно пишет код и отвечает на вопросы из точных наук. Она заняла первое место в слепом тесте LMarena, обогнав даже флагманы OpenAI и Claude.
По уровню знаний Gemini 2.5 Pro уже близка к PhD во всех областях. В бенчмарке «Последний экзамен человечества» она показала рекордные 21,6%.
Протестировать можно здесь, нужен иностранный IP-адрес.
Новую версию популярной модели DeepSeek-R1 могли обучить на ответах Google Gemini — такую версию выдвинули сразу несколько исследователей. Подробности — здесь.
Китайская нейросеть использует схожую логику и выражения, как и Gemini 2.5 Pro. Ранее предполагалось, что R1 обучали на ответах ChatGPT.
Сама DeepSeek утверждает, что обновлённая R1 почти достигла уровня топовых моделей от Google и OpenAI. Похоже, стало понятно, как это произошло — ссылка на модель: DeepSeek-R1-0528.
Создаем озвучку любым голосом: вышла модель Hume AI, которая не привязана к готовой базе персонажей — голоса можно генерировать без ограничений.
Звучит естественно и реалистично. Модель учитывает эмоции, добавляет природные паузы в речь и отвечает даже на тонкие указания — например, британский акцент или смех.
Протестировать можно здесь, требуется иностранный IP-адрес.
Вышла Kling 2.1 — обновлённая мощная модель для генерации видео.
Ролики теперь качественнее, движения объектов выглядят реалистичнее, а количество артефактов снизилось. Пока доступен только режим image-to-video.
Протестировать можно по ссылке.
Бесплатные кредиты выдаются ежемесячно.
Google запустили приложение для запуска локальных ИИ-моделей прямо на смартфоне — работает без интернета, бесплатно и всегда доступно.
Теперь можно общаться с чат-ботами даже в самолёте или поездке.
Скачать можно здесь.
Пока доступна только версия для Android, iOS в разработке.
Генератор мобильных приложений Rork получил мощное обновление — теперь создавать игры, соцсети и другие сервисы можно прямо с телефона.
Добавлена возможность выбора моделей: GPT-4o, Claude 4, Grok 3. Готовое приложение можно тестировать на своём устройстве и публиковать в App Store или Google Play.
Попробовать можно здесь.
Бесплатно доступно 5 генераций в день.
Появился «суперагент» Skywork — ИИ, который умеет генерировать масштабные исследования, создавать целые сайты и формировать Excel-таблицы.
У бота несколько режимов: он может провести исследование, объяснить сложное простым языком или помочь спланировать отпуск.
Попробовать можно здесь.
Поиск Яндекса научился рассуждать и создавать контент — на вопрос он дает развернутый ответ с фото, видео и ссылками. Его можно попросить сгенерировать картинку или объяснить сложную тему. Все работает на базе технологий Алисы, которую встроили прямо в поисковик.
Там же заработали Вертикали. Это новая часть поиска, где можно найти не только ссылки, а сразу предложения товаров, финансовых продуктов и квартир — и сравнить их.
Для быстрого доступа к новым функциям в мобильном приложении Яндекса появились отдельные кнопки «Квартиры», «Финансы» и «Товары».
Создаем дизайн любого приложения за минуту: Google запустили ИИ-сервис Stitch для разработки интерфейсов.
Сервис генерирует готовые HTML и CSS-файлы, которые можно экспортировать в Figma или любую IDE для дальнейшей доработки. К промту можно приложить собственный рукописный набросок — нейронка учтет его при формировании макета.
Попробовать Stitch можно здесь.
ChatGPT становится на 80% убедительнее людей, если знает данные собеседника — возраст, пол и взгляды. Такие выводы сделали учёные, проведшие эксперимент с участием 900 человек, где люди спорили с GPT-4.
Когда модель знала личную информацию о сопернике, ей удавалось изменить мнение человека в 64,8% случаев. Без этой информации она выступала наравне с людьми.
Интересно, что самим участникам знание данных оппонента не помогло — их эффективность даже снижалась.
Подробнее об исследовании — в статье на Nature.
В GitHub появился собственный ИИ-программист — платформа выпустила агента для Copilot. Он способен исправлять баги, добавлять новые функции и обновлять документацию.
После назначения задачи бот анализирует весь код в проекте. Пользователи могут отслеживать каждое его действие через логи сессии и оставлять комментарии до финального коммита.
Функция уже доступна всем подписчикам GitHub Copilot Pro+. Подробности — здесь.