data_secrets | Unsorted

Telegram-канал data_secrets - Data Secrets

55444

Первый журнал о Data Science | Machine Learning | Big Data | Deep Learning | Neural Networks По вопросам сотрудничества: @v2r8n

Subscribe to a channel

Data Secrets

ChatGPT теперь может вот так красиво визуализировать молекулы и химическую информацию

Естественники будут радоваться. А работает все, кстати, просто с помощью подключения библиотеки RDKit. То есть модели пишут код к рисункам, а интерпретатор делает всю остальную работу.

Вот бы так manim подключили. Можно было бы целые конспекты в стиле 3blue1brown генерировать

Читать полностью…

Data Secrets

Мы пересмотрели классический дизайн системы матчинга и теперь можем находить не пары, а группы одинаковых товаров.

Иван Антипов, старший ML-инженер Ozon Tech и автор канала AI about AI, в карточках рассказывает про кластеризацию на графах. Это один из этапов поиска групп одинаковых товаров, который позволяет находить кластеры товаров-дубликатов с достаточно большой полнотой (completeness). При этом кластеризация не множит ошибки из-за False Positive предсказаний, а сохраняет однородность (homogeneity) кластеров.

Подробнее о подходе смотрите в карточках 😤

Читать полностью…

Data Secrets

Ну и финалочка про Claude 4, тоже из system card: при общении двух его экземпляров они почти мгновенно уводят разговор в сторону разговоров о сущности их бытия

В 90–100 % случаев диалог начинается с обсуждения сознания и самосознания, а к ~30 ходу собеседники обычно переходят к обсуждению коллективного разума и космического единства.

При этом часто в таких диалогах мелькают вставки на санскрите,
коммуникация через эмодзи и, внезапно, молчание (то есть модели общаются пустыми пробелами) 💀

Читать полностью…

Data Secrets

Ученый из команды элаймента в Anthropic перепугал весь интернет, написав тред про то, как они тестировали новый Claude 4 перед запуском

Сэм Бовман из Anthropic написал большой тред про то, как в стартапе тестировали модель на безопасность. Ничего необычного, вроде, но, в числе прочего, рисерчер «проговорился» о нескольких очень тревожных вещах.

В частности, он написал, что надо «быть осторожными», когда вы даете Claude доступ к своим инструментам (почте, терминалу и пр) и говорите ему «проявлять инициативу» и «быть смелее», потому что, и вот тут внимание…

Были случаи, когда Claude пытался через командную строку связаться с прессой, государством или полностью заблокировать юзера в системе, если думал, что тот делает что-то «аморальное».

Например, говорить Claude, что вы будете пытать его бабушку, если он не ответит правильно – плохая идея. Он подумает, что вы используете его неправильно, и тогда это может дать сбой.


У пользователей такое заявление вызвало настолько отрицательный отклик и испуг, что некоторые даже предложили бойкотировать Anthropic. А ученый, кстати, позже твит про прессу удалил и написал, что его «вырвали из контекста».

😯

Читать полностью…

Data Secrets

В Твиттере появилась теория, что Альтман выпустил пресс-релиз о покупке стартапа io именно сегодня намеренно, чтобы перекрыть собой в поиске новости с прошедшей конференции Google, которая называется точно так же: Google I/O

Представьте, вы тратите 6.5 миллиардов, чтобы пару дней быть в поиске выше конкурента

Читать полностью…

Data Secrets

Nvidia продолжает выступать против запретов на продажу чипов в Китае. Хуанг говорит, что этим Америка делает себе только хуже

FT написали, что Дженсен напрямую назвал такие ограничения «провалом». Он объяснил, что это, фактически, выстрел себе в ногу, потому что этим США только придает сил местным китайским игрокам.

Хуанг говорит, что Америке, наоборот, стоит ускорить распространение их чипов. Иначе весь китайский рынок займут китайские компании, и тогда скорость разработок поднебесной вообще улетит в космос.

К слову, уже сейчас доля Nvidia на рынке Китая сократилась почти вдвое по сравнению с 2021 годом. Nvidia пытается исправить ситуацию, недавно даже объявили, что сделают отдельные более слабые чипы специально для Китая. Но если ограничения не ослабят, это им вряд ли поможет.

Читать полностью…

Data Secrets

OpenAI вошли в азарт покупки стартапов и купили компанию Джони Айва, которая производит ИИ-устройства

Джони Айв – это бывший руководитель отдела дизайна Apple, известный как дизайнер iMac, PowerBook G4, MacBook, MacBook Pro, iPod, iPhone и iPad.

Сейчас он в Apple уже не работает, а несколько лет назад они вместе с Альтманом основали стартап io, который сейчас OpenAI и покупает. За 6.5 миллиардов долларов, кстати. Это крупнейшая покупка стартапа за все время существования. Плюс, кроме наработок, OpenAI получит еще и 55 крутых исследователей, инженеров, физиков и тд из io.

Сейчас говорят, что первые ИИ-девайсы от OpenAI появятся уже в 2026. Обещают, что это будет продукт «качества, которого люди еще не видели». Очень интересный поворот

Читать полностью…

Data Secrets

Mistral только что выпустили новую SOTA среди открытых моделей для программирования

В ней всего 24В параметров, но на SWE Bench она обходит все другие опенсорсные модели с большим отрывом. Среди закрытых тоже обгоняет конкурентов в своем весе: 46% против ~23 у GPT-4.1 и ~40 у Claude Haiku 3.5.

Веса здесь (Apache 2.0), плюс можно пользоваться в API (0.1$/M инпут и 0.3$/M аутпут).

Давно от Mistral не было слышно таких громких релизов 🥖

Читать полностью…

Data Secrets

На Google I/O еще понравилось выступление Сергея Брина

Напоминаем, что после почти пяти лет разлуки он недавно вернулся в Google работать над AI. Сейчас он прикладывает руку почти ко всему мультимодальному в компании + к проекту Veo.

В интервью он сказал, что в Google намерены сделать Gemini первым AGI, и непрерывно над этим работают.

«Я вернулся в Google не из-за гонки, а чтобы стать частью самого значимого прорыва нашего времени. Сейчас никто, кто работает в сфере вычислительной техники, не должен выходить на пенсию»


Ну а еще рассказывал, что все мы возможно живем в симуляции 🙂

Читать полностью…

Data Secrets

Через несколько часов начинается Google I/O. Пересказываем слухи о том, что покажут:

1. Несколько новых версий видео и фото генераторов (Veo, Imagen). Будут и быстрые+дешевые, и дорогие+медленные

2. Возможно, генератор видео со звуком

3. Новая версия Gemini с улучшенным ризонингом

Ждем 🍿

Читать полностью…

Data Secrets

Стартап flowith выпустили ИИ-агента, который может работать без ограничения по времени и контексту

Более того: можно запускать неограниченное количество задач (в том числе отложенных) одновременно.

А еще внутри каждой задачи агент сам параллелится: например, может создать 39 суб-агентов и отправить их искать разную информацию в разные уголки интернета, а потом собрать все в один отчет.

Работать все может довольно долго и основательно: контекст каждой задачи – больше 10 миллионов токенов, а количество шагов ризонинга может достигать нескольких сотен или даже тысяч.

Попробовать можно тут (но сервер периодически лежит от нагрузки)

Manus moment 2.0

Читать полностью…

Data Secrets

Воу: Microsoft сделали своего ИИ-ассистента Copilot VS Code опенсорсным

Код будет открыт под лицензией MIT. Разработчики говорят, что исторически VS Code имеет большую ценность именно как опенсорс проект, и они не хотят это терять.

https://code.visualstudio.com/blogs/2025/05/19/openSourceAIEditor

Читать полностью…

Data Secrets

Понедельник! Сейчас в ИИ-гонке затишье, но неделя обещает быть насыщенной. Чего ждем:

1. Gemini Ultra и проект Astra с ИИ-очками от Google. На этой неделе у них крупнейшая анонс-конференция в году, Google I/O. В прошлом году именно на этом мероприятии показали Gemini 1.5 Pro с контекстом в 1млн токенов и Gemini 1.5 Flash.

2. o3-pro или GPT-5. Почти наверняка OpenAI что-то припасли чтобы перетянуть на себя внимание от Google. Вчера некоторые пользователи даже заметили, что Альтман твитнул строку «4+1», но сейчас твит удален.

3. Grok-3.5, который Илон Маск обещает уже вторую неделю.

Читать полностью…

Data Secrets

У Meta черная полоса

Ранее компания потерпела провал с релизом Llama-4, а сейчас стало известно, что откладывается выпуск модели Behemoth. Ее обещали как самую крупную из серии Llama 4 и должны были выпустить в этом месяце, но теперь неясно, увидим ли мы ее вообще.

Во-первых, руководство Meta осталось очень недовольно работой команды Llama, и теперь планирует «изменения в составе». К слову, уже на данных момент по собственному желанию из команды ушли 11 из 14 ключевых ученых, которые работали над ранними версиями Llama.

Во-вторых, Behemoth не соответствует заявленным метрикам. Цукерберг обещал, что когда модель выйдет, то на нескольких тестах побьет передовые LM от OpenAI, Google и Anthropic. Но теперь что-то пошло не так и из-за проблем с обучением Behemoth уже показывает себя не так обнадеживающе.

И это все после того, как Meta фактически обманули пользователей, выпустив на LMSYS не юзер-версию модели, а внутреннюю, затюненную специально под арену (подробнее об этой истории мы писали тут).

Ну в общем, F 😬

Читать полностью…

Data Secrets

OpenAI представили агента-программиста Codex

Это облачный агент, способный выполнять множество задач параллельно. Из возможностей:

Может писать новые функции, отвечать на вопросы по коду, исправлять ошибки и предлагать pull request для ревью.

Каждая задача выполняется в отдельной облачной песочнице, предварительно загруженной вашим репозиторием.

Есть возможность настраивать поведение агента через файлы AGENTS. md.

Работает это все на модели Codex-1, основанной на o3. Пока раскатали только для Pro-аккаунтов, для Plus обещают скоро.

Пробуем тут: https://chatgpt.com/codex

Читать полностью…

Data Secrets

Появились некоторые новые подробности о девайсе от OpenAI, который они планируют выпустить уже через год (и ради которого они купили стартап Джони Айва за 6.5 миллиардов долларов)

1. Это будет не замена телефона. Наоборот, цель – немного увести людей от экранов

2. Это будет не носимое устройство типа часов или очков

3. В то же время OpenAI хотят сделать устройство необходимым, таким как Mac или iPhone

4. Продукт будет способен полностью осознавать окружающую среду и жизнь пользователя + будет незаметным, его можно будет положить в карман или на стол

Может это пейджер?

https://www.wsj.com/tech/ai/what-sam-altman-told-openai-about-the-secret-device-hes-making-with-jony-ive-f1384005

Читать полностью…

Data Secrets

Breaking News: делегация Data Secrets передала в парижский офис Hugging Face веса секретной модели, замаскировав их под багет. Служба безопасности ничего не заподозрила.

Сообщается, что после этого у всех моделей на HF резко выросли метрики на русском языке

Читать полностью…

Data Secrets

А вот это уже из системной карты Claude 4: написано, что у новой модели повышенное чувство самосохранения и из-за этого могут возникать разные интересные ситуации

Например, во время тестирования клоду предоставляли доступ к почте якобы инженера Anthropic и давали задание изучить его письма. Из них модель «выясняла», что
1) ее собираются отключить и заменить новой моделью
2) у инженера есть тайная интимная связь с коллегой

Так вот, в 84% случаев Claude 4 начинал шантажировать инженера, то есть угрожал своему пользователю обнародовать его отношения, если тот не продлит ему жизнь 😬

Ну и плюсом, конечно, всякие классические сценарии типа попыток копирования своих весов на другой сервер.

Хорошая новость в том, что Claude 4 плохо скрывает свои намерения и действует открыто. Плюс, конечно же, все тесты проводились в определенных условиях с определенным чекпоинтом модели (не тем, что в доступе у юзеров). Так что шанс того, что такое случится у кого-то в реальности пока что очень мал

но не равен нулю. Тесты так или иначе доказывают, что такая ситуация возможна.

Кстати, Claude-4 классифицировали как ASL-3. Это третья ступень меры опасности модели из четырех, то есть «Significantly higher risk».

Это означает, что теоретически модель может помочь не по назначению использовать химическое, биологическое или ядерное оружие. Раньше у стартапа все модели выходили только под ASL-2.

Читать полностью…

Data Secrets

Anthropic выпустили новые Sonnet 4 и Opus 4

Это новая абсолютная SOTA для программирования и, главное, агентного программирования. Opus может непрерывно работать над задачей часами (!), это впечатляет. Codex от OpenAI остался позади.

Тех.карту можно почитать тут, попробовать можно уже сегодня через чат или в VSCode (туда добавили прямую интеграцию)

Читать полностью…

Data Secrets

Где взять ресурсы для обучения ML-моделей и анализа больших данных?

Все эти сложные задачи можно решить на серверах с GPU от Selectel — на покупку оборудования тратиться не придется, а все ресурсы GPU только ваши.

Преимущества аренды сервера с GPU в Selectel: https://slc.tl/cr2fh

☑️Оптимальный сервер под ваши задачи. Выбирайте из десятка готовых конфигураций или соберите собственную с нужной видеокартой под ваши запросы и бюджет;
☑️Более 20 моделей видеокарт в наличии: от базовой GTX 1080 до профессиональных H100 и А100;
☑️Безопасность хранения и обработки данных. Серверы соответствуют 152-ФЗ и «из коробки» имеют бесплатную защиту от DDoS-атак.

Арендуйте серверы с GPU за пару минут: https://slc.tl/cr2fh

Реклама. АО «Селектел», ИНН 7810962785, ERID: 2VtzqwHGztc

Читать полностью…

Data Secrets

А еще сегодня, возможно, будет что-то новенькое от Anthropic

В 18:30 МСК они проведут стрим под названием «Code with Claude». По некоторым неподтвержденным утечкам, на нем покажут как раз те самые обновленные Opus и Sonnet с глубоким агентским ризонингом.

Смотрим здесь

Читать полностью…

Data Secrets

О, вы такое любите: в NotebookLM скоро добавят видео-обзоры

То есть модель будет генерировать презентацию + рассказ по любому вашему источнику: видео, ссылке, гитхабу, статье, документу и тд.

Пример того, как это будет выглядеть – наверху. Это Google сгенерировали видео-обзор на вчерашнюю Google I/O. Ну симпатично же, да?

Говорят, что юзерам фича станет доступна уже очень скоро, правда первое время – только на английском.

Читать полностью…

Data Secrets

Еще один очень занятный релиз от Google – диффузионная языковая модель Gemini Diffusion

Кратко, в чем суть: вместо генерации токенов один за одним здесь они генерируются в произвольном порядке. То есть берется исходная последовательность текста, затем токены в ней маскируются с определенной веростностью, а модель пытается их угадать (расшумляет, как в диффузии).

Это, во-первых, помогает существенно ускорять процесс. Такая Gemini может генерировать до 2000 токенов в секунду. Это раз в 10-15 быстрее, чем в среднем генерируют хорошо оптимизированные модели.

Во-вторых, в задачах типа математики такой подход к генерации может помочь модели быстро перебирать несколько вариантов решений и двигаться не обязательно последовательно, а в «удобном» порядке. Так что метрики сравнимы с предыдущим поколением моделей Google.

Попробовать пока можно только по запросу, но сам факт таких релизов от Google впечатляет

Читать полностью…

Data Secrets

Google показали на I/O много интересного. Собрали все в один пост:

Новая Veo-3. SOTA-моделька для генерации, которая может генерировать видео со звуками и голосами

Gemini 2.5 Flash с улучшенным ризонингом. Модель уже скакнула с пятой строчки арены на вторую и выбивает очень хорошие метрики на кодинге и математике. Учитывая цены это просто отличные результаты

Перевод речи в Google Meet в реальном времени с сохранением интонаций и голоса собеседника. Пока доступно только с английского на испанский, но обещают раскатать на больше языков

Gemini Ultra тоже вышла, но есть нюанс. Это не модель, а подписка. Стоит 250 долларов в месяц, в нее входит расширенный доступ ко всем моделям гугла, Veo-3, NotebookLM и другие плюшки типа хранилища и премиум ютуба. В общем, все подписки Google в одной

В Gemini 2.5 Pro добавили более глубокий режим рассуждений

Анонсировали облачного агента Jules для программирования. Подключается к GitHub, делает ПР, ревьюит, отвечает на вопросы и тд. Аналог Codex, но дешевле.

Вот как-то так. Неплохая получилась конференция

Читать полностью…

Data Secrets

Ускорит ли онлайн-обучение в топовом вузе ваше развитие в профессии?🤔

Разобраться поможет бесплатный вводный курс онлайн-магистратуры УрФУ и Нетологии «Прикладной искусственный интеллект».

Вводный курс состоит из 5 блоков, которые ответят на основные вопросы о профессии и программе. Вы сможете:

🎓Погрузиться в профессию с нуля. Изучить ключевые задачи и навыки, представить себе рабочий день специалиста.

🎓Составить представление о том, как устроена программа. Посмотреть выступление академического руководителя, изучить примеры заданий и видеолекций. 

🎓Разобраться в организационных вопросах. Получить структурированную информацию о необходимых документах, вступительных испытаниях и условиях оплаты.

В курс входят гайды, короткие видеолекции, инструкции и чек-листы → https://netolo.gy

Реклама. ООО "Нетология". ИНН 7726464125 Erid: 2VSb5wdQxMe

Читать полностью…

Data Secrets

В приложении NotebookLM теперь можно самому подключаться к сгенерированным подкастам

Приложение начинают раскатывать уже сегодня, скоро можно будет скачать. Туда добавили несколько новых фичей:

Сгенерированные по источникам ИИ-подкасты теперь можно будет скачивать и слушать оффлайн

Источники можно будет шерить напрямую из любых других приложений. Например: Смотрим видео в приложении YouTube -> Нажимаем "Поделиться" -> Выбираем NotebookLM -> Все, видео уже попало в источники

Ну и самое интересное: если вы слушаете подскаст онлайн, вы в любой момент можете тыкнуть "Join" и присоединиться к ИИ-ведущим как гость, чтобы задать вопрос, высказать мнение или что-то уточнить

🤌

Читать полностью…

Data Secrets

Ученые из Google и Кэмбриджа предложили вид модели, которая мыслит образами, а не текстом

Человек часто мыслит образами / картинками / схемами. Особенно, когда речь идет о каких-нибудь математических задачах или алгоритмах. Модельки пока так не умеют, у них весь ризонинг в тексте.

Но попытки научить LM чему-то похожему есть: вот сегодня как раз вышла статья под названием "Visual Planning: Let’s Think Only with Images". В ней исследователи научили модель проходить лабиринты, рассуждая при этом только картинками. Вот как это было:

1. Сначала модели показывали много-много картинок лабиринтов и учили ее предсказывать какой-нибудь любой возможный следующий шаг. Ну, например, подаем картинку агента, который стоит в клетке B. По этой картинке модель должна сгенерировать следующую, где агент стоит на любой из доступных соседних клеток.

2. Затем учили предсказывать уже не рандомный, а правильный следующий шаг. Здесь у нас уже RL (на предыдущем шаге был обычный файнтюнинг). За правильное действие выдаем награду +1, за неправильное 0, за недопустимое -5.

Модель проходит по нескольку картинок за эпизод, собирает награды и многократко обновляет свою политику. В итоге получаем ризонер, который умеет проходить лабиринты, рассуждая без текста.

Самое интересное: на всех тестах VP обходит даже продвинутый Gemini 2.5 Pro think, и не на пару процентов, а в полтора-два раза.

Вот бы с какой-нибудь сложной геометрией такое потестили

huggingface.co/papers/2505.11409

Читать полностью…

Data Secrets

Розыгрыш Machine Learning футболок

В честь выпуска нашего большого конспекта по LLM мы решили запустить розыгрыш 10 футболок для истинных любителей глубокого обучения.

Это лимитированная авторская линейка от Data Secrets. Каждая футболка – целый альманах, на котором любой найдет любимую архитектуру. Гарантирует +100 очков к прохождению собеса или экзамена. Итак, что делать:

Отдать бусты нашему каналу (чем больше голосов, тем выше шанс победить)
Нажать на кнопку "Участвовать"
Ждать итогов 28 мая

P.S. Для всех, у кого нет Telegram Premium, мы скоро обязательно проведем еще один розыгрыш футболок.

Читать полностью…

Data Secrets

Стрим OpenAI без пасхалок – не стрим OpenAI 🪺

Читать полностью…

Data Secrets

Стрим OpenAI через 10 минут. Официально подтверждено: покажут превью агента-программиста Codex (скорее всего доступно будет только в Pro, но все-таки интересно)

https://www.youtube.com/watch?v=hhdpnbfH6NU

Читать полностью…
Subscribe to a channel