Первый журнал о Data Science | Machine Learning | Big Data | Deep Learning | Neural Networks По вопросам сотрудничества: @v2r8n
Цукерберг заявил, что исследователи уходят к нему вовсе не из-за денег
Он говорит, что новости не совсем честно освещают, почему ученые из многих лабораторий охотно уходят в его новое подразделение MSL. Дело, мол, по большей степени не в деньгах, а в корпоративной структуре и количестве компьюта.
Команды в MSL будут очень маленькие и подчиняться будут напрямую Марку, чтобы ученые тратили минимум времени на бюрократию, созвоны и согласования.
Кроме того, в MSL будет самый большой объем компьюта на одного речерчера. Каждый получит в распоряжение сотни GPU, и количество доступных вычислений будет быстро увеличиваться.
К 2026 компания построит кластер Prometheus на 1GW, а потом примется за строительство Hyperion, который будет масштабироваться до 5GW+. Для частной компании это просто невероятные мощности.
Ну и да, сотни миллионов за переход – это так, приятное дополнение 👉
Оказывается, там еще и пасхалка спрятана: из первых букв имен этой толпы ученых можно сложить фразу "GEMINI MODELS CAN THINK AND GET BACK TO YOU IN A FLASH", то есть "Gemini может подумать и ответить вам мгновенно"
Ощущение, что даже с самим тех.отчетом они так не напрягались, как с этим списком
Мем: в вопросах политики и мировоззрения Grok-4 пользуется твитами Маска, как референсом
Твиттер прямо сейчас заполнен примерами того, как перед ответом модель шерстит посты миллиардера и пытается подстроить свой ответ под них.
😐😐😐
Акции Nvidia снова подскочили и теперь это первая компания в истории, пробившая капитализацию в 4 миллиарда долларов
И это, кстати, несмотря даже на все ограничения экспорта в Китай.
* Для сравнения, Apple стоит 3 триллиона, а ВВП Великобритании – 3.3 триллиона.
Где-то один Дженсен Хуанг свитает, сколько кожанок можно купить на 4 триллиона 🔵
В Твиттере завирусился тренд: нужно скинуть картинку, которую поймут только люди из твоей субкультуры
Среди реплаев нашлось вот это золото
Согласны? Узнали?
Дочерняя компания Google DeepMind набирает людей на первые испытания противораковых препаратов, изобретенных ИИ
Лаборатория называется Isomorphic Labs, и в ней работают те же люди, что стояли за AlphaFold. Это та самая громкая модель для предсказания структуры белков и других молекул от Google.
В общем, недавно Isomorphic Labs получили финансирование в размере 600 миллионов долларов и сейчас сообщают журналистам, что скоро планируют перейти Рубикон в мире ИИ-медицины.
Амбиций у них хоть отбавляй: они верят, что в будущем смогут побороть с помощью ИИ любую болезнь. Сейчас они работают над единым ядром для разработки лекарств.
По слухам – есть успехи. Представители самой компании говорят, что несколько раз уже проводили испытания на людях, и сейчас набирают добровольцев на противораковые препараты.
Наткнулись на историческое видео восьмилетней давности, где Альтман берет интервью у Цукера и говорит:
«Я точно знаю, что одна вещь, которую Facebook делает невероятно хорошо, – это найм. Расскажите, как вы нанимаете сотрудников?»
«Слева Роналду, Реал Мадрид потратил 80 млн долларов, чтобы он перешел к ним из Манчестер Юнайтед.
Справа — Цзяхуэй Юй, Meta заплатила 100 млн долларов, чтобы он перешел к ним из OpenAI»
Там в открытый доступ вышла самая свежая книга Себастьяна Рашки «Machine Learning Q and AI»
С книгами Рашки, наверное, многие знакомы. Он один из разработчиков scikit learning и просто очень опытный и известный рисерчер, написавший много учебной литературы. Если пока ничего его авторства не читали – сильно рекомендуем.
Конкретно эта книга – сборник всей базы по Deep Learning. В ней 30 больших глав по нейросетям, компьютерному зрению, LLM, эвалу и методам деплоя моделей. Много практики, примеров, схем и картинок.
К каждой главе есть упражнения и список дополнительных источников. Ну, в общем, мед.
Сама книга вышла примерно год назад, но до этого дня ее можно было только заказать с Amazon. Сегодня же Себастьян выложил ее в открытый доступ полностью бесплатно.
«Сейчас лето, сезон стажировок и технических интервью. Надеюсь, моя книга будет полезна» – написал он 👼
Илья Суцкевер появился на YouTube с новым рассказом про прошлое и будущее ИИ
Опубликовал его Открытый Университет Израиля, который Илья посещал в юности. Они, вслед за университетом Торонто, присудили ему степень почетного доктора наук. В честь этого, собственно, и произносилась речь.
Видео короткое, так что прикрепляем полностью 👆
«ИИ может спасти нас от многих болезней, заниматься медициной, увеличить продолжительность жизни. Но если ИИ может это, то что еще он сможет?
Ответ – все что угодно. Проблема в том, что ИИ невероятно силен, непредсказуем и немыслим. ИИ может начать создавать следующие поколения ИИ, и тогда случится взрыв интеллекта. И что мы будем делать?
Все эти вопросы пока остаются без ответа»
OpenAI планирует создать прямого конкурента Microsoft Office
Это будет «приложение для всего»: совместное (с ИИ или другими пользователями) написание текстов и кода, таблицы, презентации, запись встреч, умные заметки и др. Об этом сообщает The Information.
Говорят, внутри компании прототип уже существует довольно давно, а функция Canvas в ChatGPT – это что-то типа мини-демоверсии.
Интересно, как отнесется к такому Microsoft. Ведь это буквально означает, что стартап, который они спонсировали миллиардами несколько лет, становится их прямым конкурентом 🤡
Стали известны некоторые подробности продукта стартапа Миры Мурати
Оказывается, у Thinking Machines Lab пока не будет собственной ИИ-модели. Они целятся в первую очередь в b2b, и будут предлагать клиентам разработки на базе опенсорсных моделей.
При этом особое внимание в пост-обучении будет уделяться RL – и специально под такие метрики, как выручка или LTV.
Один из инвесторов, говоривших с Мирой, назвал ее продукт «RL для бизнеса» 🧐
Где получить высшее образование, которое ценят в IT-индустрии? На вузовских программах Яндекса!
Сейчас доступно более 25 программ бакалавриата, магистратуры и аспирантуры — от анализа данных до искусственного интеллекта. Поступить можно в ведущие университеты — ИТМО, МФТИ, НИУ ВШЭ и не только.
Учёба построена на практических задачах, а курсы разрабатываются при участии экспертов Яндекса и Школы анализа данных — опытных преподавателей и практиков в Machine Learning и Data Science.
Если хотите больше узнать о программах, переходите на сайт и читайте подробности!
Кем я себя ощущаю, когда вижу хорошие метрики у модели:
Читать полностью…В Apple обсуждают покупку Perplexity
Сейчас Perplexity оценивается в 14 миллиардов долларов. Это относительно небольшая сумма для Apple, учитывая, что может принести им эта покупка.
Во-первых, это большой приток новых талантов. Принимая в расчет текущую гонку на специалистами и бонусы за переходы, это очень ценный пункт.
Во-вторых, сама технология, которая в теории может возродить Siri из пепла.
Ну и в-третьих, источник дохода, если систему встроят в Safari. Сейчас Apple уже почти потеряли сделку с Google, которая приносила им около 20 миллиардов долларов в год. На данный момент с делом активно разбирается антимонопольная полиция, так что времени что-то придумать у Apple не так уж и много.
Кстати, Цукерберг недавно тоже пытался купить Perplexity, но по неизвестной причине – не выгорело. Может, Apple повезет больше
Белые хакеры из университета Торонто придумали новую атаку на GPU
Те, кто увлекается кибербезом, точно знают, что такое Rowhammer. Это классическая аппаратная атака, которая заключается в многократном чтении (или записи) определённых строк памяти. Это вызывает электрические помехи и приводит к непреднамеренным изменениям (bit flip) в соседних ячейках памяти.
Изначально Rowhammer была обнаружена для обычной оперативки, но теперь оказалось, что она может быть адаптирована и для видеопамяти (это назвали GPUHammer).
Причем эффект может быть даже страшнее, потому что в случае ИИ всего один ошибочный бит в весах модели может привести к катастрофическому снижению точности. Прямо в статье это доказали на примере ImageNet: метрика скакнула с 80% до менее чем 1%.
Уязвимы все системы с видеокартами NVIDIA на GDDR6 (например, A6000). Такие ооочень часто используются в дата-центрах. Причем существующие защиты вроде TRR не сильно спасают.
Nvidia порекомендовали включать ECC (Error-Correcting Code): он позволяет автоматически исправлять некоторые типы ошибок в памяти. Но есть нюанс: ECC роняет производительность на 10–50%. Так что в перспективе нвидии все-таки придется реагировать изменениями в архитектуре.
В общем, спасибо ребятам за исследование, конечно, но не от всей души 🎧
Курс с углублённым изучением профессии аналитика данных.
Станьте незаменимым специалистом на рынке труда с курсом от Нетологии.
Преподаватели курса — эксперты из крупных компаний: Сбера, Яндекса, Gett, Работы.ру и других.
Вы изучите:
- продвинутые инструменты — A/B-тестирование, аналитику больших данных, SQL и Python;
- современные российские BI-решения — AW BI и DataLens;
- нейросети, которые можно использовать при анализе.
А ещё все студенты получат доступ к профессиональному комьюнити с еженедельными офлайн и онлайн-митапами. На них разбираем актуальные инструменты и делимся опытом.
До конца июля на курс действует сразу 2 скидки: летняя — 40%, и дополнительная — 10 000 рублей по промокоду DATA10.
➡️ Посмотреть программу курса
Реклама. ООО "Нетология". ИНН 7726464125 Erid 2VSb5y6vPL4
А тем временем другой ИИ-браузер – Comet от Perplexity – вышел уже сегодня
Это первый за три года принципиально новый продукт от Perplexity. Выглядит как обычный браузер, но добавляется окошко чат-бота. По черрипикам тестеров из X выглядит интересно: агента даже можно залогинить в ваши учетки и он сможет автономно (реально автономно, а не как Operator) выполнять какие-то действия от вашего имени.
Comet уже доступен для юзеров подписки Max (200 долларов). Вряд ли кто-то пользуется этим тарифом, поэтому ждем, когда раскатят с лимитами на обычную и бесплатную подписки.
Вы гляньте, какая прелесть: HuggingFace только что открыли продажи на этого малыша
Его зовут Reachy Mini, и он опенсорсный. Разработали его буквально за пару месяцев совместно со стартапом Pollen Robotics, который HF купили в апреле.
Reachy может видеть, слышать и говорить. Цена на него начинается от 299 долларов, это в несколько дешевле айфона.
И самое прекрасное – робота можно полностью программировать на Python: подключать любые модели с HF или собрать датасет и обучить его чему-то своему. Код открытый, так что придумывать можно вообще все, что хочешь.
Нам такого надо
У МТС теперь есть свой AI для понимания данных, и он уже работает на бизнес
В MTС Web Services запустила первого в России AI-агента для автоматического документирования корпоративных данных – называется он MWS Data Scout.
Суть: берёт все базы компании, парсит, находит, что где лежит, как связаны таблицы, где чувствительные данные, – и аккуратно описывает всё это в понятной форме. Не просто по названиям столбцов, а по смыслу. К примеру, указывает, округлены ли цифры в «Выручке», по какой методике ода считалась или в какой валюте указана «Сумма сделки».
AI-агент интегрируется с DataHub, OpenMetadata и другими каталогами. Подключить агента можно и локально в вашем контуре, и из облака.
Это большой шаг в сторону автоматизации дата-менеджмента. Особенно для банков, промышленности, ритейла и остального бизнеса, где данных море, а описывать их всегда нужно вручную.
В будущем этот агент сможет строить пайплайны, прогонять данные до BI и ML и ловить аномалии.
Говорят, только на описании данных компании могут сэкономить от 50 миллионов рублей. А сам процесс ускоряется в 10 раз. И это уже не говоря о гораздо более высоком качестве и полноте документации.
Пользуясь случаем, не можем еще раз не подсветить замечательный канал Валерия Neural Deep
Во-первых, автор большой спец по RAG, LLMOps, локальному инференсу и всему, что связано с AI Infrastructure (отсюда и такие частые и глубокие разборы кейсов с локальными LLM на канале).
За весь свой опыт Валерий успел построить рексис в Билайне, кучу RAG-платформ для крупных заказчиков, а теперь работает Head of AI в red_mad_robot.
Пишет он про железо, RAG, реальный опыт внедрения LLM в прод и запуск ИИ-продуктов. Инженерно, интересно, иногда хардово.
Из последнего – обязательно почитайте пост про вайб-кодинг. Это, пожалуй, наиболее трезвое мнение по поводу этого явления: просто потому что это слова не вайб-кодера из X, которому «Ааа, ИИ сгенерировал приложение за 5 минут», а технически подкованного человека с кучей лет опыта, который видит в коде любые косяки и понимает важность системного подхода.
Советуем от души: @neuraldeep
Двое ключевых разработчиков Claude Code ушли в Anysphere работать над Cursor
В индустрии началась какая-то мощная волна перемещений талантов. Бонусы за переходы исследователей сейчас достигают абсолютного исторического максимума. Конечно, во многом на это повлиял Цукерберг со своей политикой громкого агрессивного хантинга, но, в целом, даже и без него все к этому и шло.
Так вот: сорока принесла на хвосте, что в этот раз крупно повезло стартапу Anysphere. Они сцапали себя двух лидеров из Anthropic – Бориса Черного и Кэт Ву. Оба работали непосредственно над Claude Code – то есть над прямым конкурентом Cursor от Anysphere.
Бориса, многие, вероятно, знают. Он давал кучу интервью и работал руководителем разработки Claude Code. Кэт же была менеджером по продукту. В Anysphere Черный займет должность главного архитектора, а Ву – руководителя продуктового отдела.
Сейчас, кстати, Cursor не так уж и сильно отстает от Claude Code по доходу. Годовая выручка первого на сегодня уже 500 миллионов долларов, а у Anthropic – 4 миллиарда. По меркам сегодняшнего рынка разница мизерная, и шансы Anysphere обогнать конкурента довольно неплохие.
Ну а пока где-то плачет один Дарио Амодеи
Уже через пару недель выйдет ARC-AGI-3
Об этом сообщили сами разработчики. Они пообещали показать новую версию легендарного бенчмарка на митапе в Сан-Франциско 17 июля.
Однако это будет только раннее исследовательское превью. На его основе от тестеров будут собирать подробную обратную связь, и полноценный улучшенный бенч выйдет зимой.
Уже точно известно, что внутри ARC-AGI-3 будут игры. Или, точнее говоря, интерактивные среды-головоломки, в которых понадобится уже не просто понимание символов, а арифметика, геометрия, агентские способности и умение по-настоящему рассуждать.
Ждем результаты по нулям от всех самых мощных моделей 👍
Есть информация, что OpenAI переходит на чипы TPU
Журналисты пишут, что большое количество чипов уже внедрено, и Google продолжают уговаривать OpenAI почти полностью отказаться от GPU и перейти на тензорные процессоры.
Зачем это Google – понятно: конкуренция с Nvidia. До сих пор OpenAI была крупнейшим клиентом Хуанга, а теперь впервые будет в больших масштабах пользоваться чем-то другим. Неплохая заявочка на увеличение доли рынка TPU.
А в чем резон OpenAI?
Все просто. Это политика. Если они перейдут на TPU, это сильно подорвет роль Microsoft как эксклюзивного партнера, у которого OpenAI берет мощности.
Для Microsoft это означает потерю власти и ослабление позиций как в общей гонке ИИ, так и в сотрудничестве с OpenAI – особенно сейчас, когда Альтман мечтает отобрать у них право на интеллектуальную собственность на модели стартапа и снизить их долю прибыли.
Press F, в общем 😐
Всплыло, что Anthropic потратили миллионы на покупку и сканирование бумажных книг для обучения Claude Sonnet
Началось все с очередного иска в суд: Anthropic обвинили в нарушении авторского права. Якобы стартап незаметно обучал свой ИИ на пиратских копиях книг.
Anthropic же заявили, что пользовались книгами законно, и не скачивали пиратские копии, а именно покупали бумажные экземпляры, чтобы затем их использовать. Потратили они на это, ни много ни мало, миллионы долларов.
Их юристы утверждали, что закон об авторском праве не только не запрещает, но и поощряет такое обучение, потому что оно к тому же способствует общему техническому прогрессу.
И в итоге… компанию оправдали. Это первый прецедент, когда суд официально согласился, что обучение ИИ на авторских работах законно. Вот что сказал судья:
Как и любой читатель, стремящийся стать писателем, ИИ Anthropic обучался на этих работах не для того, чтобы повторять или вытеснять их, а для того, чтобы создать что-то другое.
Уже пользовались GigaChat? Предлагаем принять участие в его разработке! 💻
Сбер приглашает на One Day Offer талантливых DL-инженеров в команду production-внедрения GigaChat.
С вас — понимание, как работают модели на уровне математики и аппаратуры, и желание оптимизировать работу LLM моделей, создавать инфраструктуру для нагрузок на кластеры и выводить новые архитектуры в промышленную среду.
С нас — интересные задачи, современное железо, график на выбор и классное IT-комьюнити.
Встречаемся 28 июня в 10:30, а потом, вполне возможно, и за соседним рабочим столом в офисе! Зарегистрироваться! 👌
Глядите, в Стэнфорде сделали искусственную кожу, которая может с помощью ML симулировать осязание
Первое, что бросается в глаза, – это однослойность. Здесь нет кучи слоев с датчиками, вместо этого используется тонкая гидрогелевая пленка, в которую вообще не зашито ничего твердого. Для улавливания сигналов у нее только гибкие электроды из серебряной нити.
Это похоже на кожу, но с таким подходом есть трудности. Когда мы получаем отклик от такой мембраны, его нельзя сразу локализовать. Измерения тока с электродов не стреляют в отдельные сенсоры, это скорее похоже на сложно-распределенное поле по всей поверхности гидрогеля.
Вот тут-то как раз и работает ML. Авторы используют PCA для сокращения количества каналов обработки, а потом обычную полносвязную нейросеть для локализации прикосновения и классификации.
В итоге такая рука может «чувствовать» порезы, механическое нажатие, прикосновения человека, влагу/температуру и даже ожоги.
Футуристичненько 🚬
www.science.org/doi/10.1126/scirobotics.adq2303
У нейросети Сбера GigaChat появился режим глубоких исследований
Искусственный интеллект берёт на себя сбор информации, анализ источников и написание текста. Как итог — ощутимая экономия времени при подготовке отчётов, обзоров и других материалов.
В начале работы появляется окно с базовыми настройками. Здесь нужно выбрать подходящий тон: объективный, академический, аналитический или оценивающий. А ещё есть опция ограничить мониторинг данных конкретным сайтом.
Финальный шаг — составить промпт. Придерживайтесь простых формулировок без лишней воды👇🏻Сделай прогноз по самым востребованным hard & soft skills на рынке труда через 10-15 лет в условиях развития ИИ. И как это повлияет на сферу образования?
Сравни причины падения Римской империи и современные угрозы для западной цивилизации
Получить экспертный ответ на любой вопрос.
Китайский стартап выпустил Deep Research агента, который лучше аналогов от OpenAI и Google
Kimi.ai – не новый стартап, и он уже радовал нас несколькими приятными релизами. Но такой прорыв у них в первый раз.
Взгляните на метрики: их агент Kimi-Researcher занимает лидирующие позиции на всех бенчмарках, включая известный Humanity’s Last Exam.
Говорят, для одной задачи агент в среднем делает 23 ризонинг-шага и параллельно исследует более 200 URL.
За основу взята собственная модель стартапа k 1.5, которую end-to-end дообучали с помощью обучения с подкреплением. При этом потребовалось минимум размеченных данных, потому что выдача награды была, в основном, автоматизирована. Отдельно тюнили умение использовать инструменты (там кстати, подкручены MCP).
Все подробности о данных, подходах в обучении и строении инфраструктуры исследователи подробно расписали в блогпосте.
Попробовать агента скоро можно будет здесь. Если хотите получить ранний доступ, лучше записаться в лист ожидания
Умеют удивлять
Цукерберг был готов купить компанию Ильи Суцкевера за 32 миллиарда долларов, чтобы тот ушел работать в Meta
32 миллиарда – это последняя, апрельская оценка компании Safe Superintelligence. И, судя, по всему, Meta была готова уплатить эту цену. Но Илья, ожидаемо, отказался.
И все-таки без ничего Meta не осталась: идет слух, что им удалось переманить CEO и со-основателя SSI Дэниэла Гросса.
Вместе с ним, кстати, Цукерберг планирует нанять бывшего гендира GitHub Ната Фридмана.
Интересная команда собирается