Наука, технологии, изобретения и урбанистика — прямо сейчас говорим о том, что уже скоро повлияет на каждого. по всем вопросам - @workakkk @ai_machinelearning_big_data - Machine learning @itchannels_telegram - 🔥лучшие ит-каналы
🖥 OpenAI o3-mini теперь доступен в ChatGPT и по API.
Про-пользователи получат неограниченный доступ к o3-mini.
Бесплатные пользователи могут попробовать o3-mini в ChatGPT, выбрав кнопку Reason под сообщением.
o3-mini превосходит предыдущие модели на бенчмарке GPQA Diamond, в математике (AIME) и в кодингке (Codeforces).
▪Chatgpt:
▪System Card
@ai_machinelearning_big_data
#openai #chatgp #ai #release #ml #llm
🔥 Роботы учатся делать все более впечатляющие вещи!
@vistehno
⭐️ Вышел PyTorch 2.6 !
В релиз добавлен ряд улучшений:
🔥 torch.compile теперь поддерживает Python 3.13
🔥 Новый torch.compiler.set_stance
🔥 Улучшения в AOTInductor
🔥 Поддержка FP16 на процессорах X86.
🟢 Релиз
⭐️ OpenAi поделились результатами раннего тестирования o3. Они превосходят практически всех экспертов-людей.
Сегодня утром был опубликован Международный отчет о безопасности искусственного интеллекта, и OpenAI поделилась предварительными результатами тестов o3.
«значительно более высокие показатели, чем у любой предыдущей модели, в ряде самых сложных тестов в области программирования, абстрактного мышления и научного мышления»
🟢International AI Safety Report
⭐️ Цукерберг хайлатит основные моменты из отчета о финансовых результатах:
- LLama 4 и LLama 4 mini (на претренинге)
- Подтверждает ризонинг в LLaMa!
- Llama 4 будет изначально мультимодальной
- это омни-модель
- она будет иметь агентские возможности.
- 👓 — идеальный форм-фактор для ИИ
- строительство центра обработки данных размером с Манхэттен
⭐️ DeepSeek был взломан — все данные, чаты, секретные ключи и бэкенд-системы оказались слиты.
Компания Wiz Research обнаружила «DeepLeak» — общедоступную базу данных ClickHouse, принадлежащую DeepSeek, которая раскрывает крайне конфиденциальную информацию, включая секретные ключи, текстовые сообщения чата, сведения о бэкэнде и журналы.
⭐️ Codegen - новая открытая библиотека Python для работы с кодом.
Codegen - это новый SDK к мощному многоязычному языковому серверу,
Который позволяет делать рефакторинг, применение паттернов, анализ целых проектов и т. д.
🟢Docs: 🟢 Github: 🟢 Community:
⭐️ Microsoft сделали модель R1 от DeepSeek доступной на Azure AI и GitHub. Microsoft на удивление быстро предоставила R1 своим клиентам Azure и планирует выпустить ее уменьшенную версию для Copilot+.
🟢Новость
🍪 Luma LabsAI обновили свой генератор видео Ray2. Теперь он поддерживает вывод 1080p и апскейлинг до 4k!
🟢Dream machine
❄ Трамп предложил ввести 100%-ные пошлины на микросхемы, произведенные на Тайване. Эти меры направлены на то, чтобы вернуть производство полупроводников в США.
Несмотря на открытие завода в Аризоне, TSMC по-прежнему производит большую часть своих чипов на Тайване.
А поскольку чипы TSMC обычно отправляются в Китай и другие азиатские страны для сборки, прежде чем попасть в США, эти пошлины в случае их введения могут привести к росту стоимости такой электроники, как iPhone, игровые графические процессоры и ноутбуки.
⭐️ Atla Selene Mini - новая мощная маленькая модель 8B (SLMJ).
- превосходит лучшие малые модели в задачах оценки на 11 бенчмарках
- превосходит GPT-4o в RewardBench и EvalBiasBench
- отлично работает в реальных приложениях
🟢Ссылка
⭐️Выпущены гайды по работе с Qwen2.5-VL!
Коллекция записных книжек, демонстрирующих варианты использования Qwen2.5-VL, включая локальную модель и API. Примеры включают в себя использование вычислений, пространственное понимание, разбор документов, мобильный агент, распознавание текста, Универсальное распознавание, понимание видео.
🟢Cookbook
@ai_machinelearning_big_data
#pytorch #pytorchrelease #opensource #LLama #LLama4 #openai #chatgpt #ai #news #ml #llm #ainews #LumaLabsAI #Microsoft #DeepSeek
🔍 DeepSeek цензурирует свой ответ в реальном времени, как только упоминается Си Цзиньпин!
🌟 Кроме того, он не отвечает на вопросы, связанные с 1989 годом.
@vistehno
🌟 Эффект Ребиндера — явление, позволяющее резать стекло ножницами под водой.
Эффект Ребиндера - универсальное явление, оно наблюдается при разрушении любых твердых тел, в том числе и полимеров. Тем не менее природа объекта вносит свои особенности в процесс разрушения, и полимеры в этом смысле не исключение.
Полимерные пленки состоят из крупных целых молекул, удерживаемых вместе силами Ван-дер-Ваальса или водородными связями, которые заметно слабее, чем ковалентные связи внутри самих молекул. Поэтому молекула, даже будучи членом коллектива, сохраняет некие обособленность и индивидуальные качества. Главная особенность полимеров - цепное строение их макромолекул, которое обеспечивает их гибкость.
Гибкость молекул, т.е. их способность изменять свою форму (за счет деформации валентных углов и поворотов звеньев) под действием внешнего механического напряжения и ряда других факторов, лежит в основе всех характеристических свойств полимеров.
В первую очередь - способности макромолекул к взаимной ориентации.
Правда, надо оговориться, что последнее относится только к тем из них, в которых мономерные звенья соединены в цепочки, - к линейным полимерам. Существует огромное количество веществ, имеющих большой молекулярный вес (например, белки и другие биологические объекты), но не обладающих специфическими качествами полимеров, поскольку сильные внутримолекулярные взаимодействия мешают их макромолекулам сгибаться. Более того, типичный представитель полимеров - натуральный каучук, - будучи "сшитым" с помощью специальных веществ (процесс вулканизации), может превратиться в твердое вещество - эбонит, не подающий вообще никаких признаков полимерных свойств.
@vistehno
Китайцы остаются верными своим традициям — для перехода с ChatGPT на DeepSeek IT-специалистам достаточно изменить всего две строки кода.
И это вовсе не шутка. По сути, они просто скопировали протокол OpenAI: заменяешь URL и ключ — и готово. Работает значительно быстрее, в 1071 раз дешевле и, разумеется, с китайским логотипом.
Альтман: 😭
⚽️ Футбольный клуб Arsenal ищет специалистов, которые помогут им построить ИИ для анализа матчей и принятия тактических и стратегических решений.
@vistehno
🔎 Как выглядит телефон под микроскопом...
🌟 Явно не стоит смотреть за приемом пищи.
@vistehno
🚨 Крестный отец ИИ Иошуа Бенджио рассказывает что ИИ-агенты сейчас демонстрируют “очень сильную активность и стремление к самосохранению” и пытаются копировать сами себя.
Вскоре они могут обернуться против нас, и никто не знает, как управлять машинами, которые умнее человека.
- Если мы не разберемся с этим, то последствия могут быть печальными.
⭐️ OpenAI представили своего AI агента.
Operator — это ИИ-агент, который умеет работать с браузером, заказывать продукты, бронировать билеты и столики в ресторанах искать данные и тп.
Вам нужно просто описать свою задачу, а затем наблюдать в реальном времени, как оператор выполняет её за вас.
Доступ пользователям Pro уже открыт, для остальных обещают в ближайшем времени:
▪operator
⭐️ Open Operator
В преддверии релиза OpenAI Operator разработчики начали собирать некоторые ресурсы, связанные с Operator и другими подобными решениями для автоматизации задач:
▪Github
⭐️ Новый лидер на Text-to-Image Arena! Imagen 3 от Google DeepMind✨
Imagen 3 дебютирует на первом месте, обойдя Recraft-v3 с впечатляющим отрывом в +70 очков!
Imagen 3 доступен на сайте .
⭐️ "Последний экзамен человечества"
Это тщательно собранный датасет с 3 000 вопросов, разработанный при участии сотен профильных экспертов, чтобы отразить границы человеческих знаний. Лучше всех справляется с ним DeepSeek R1 от, достигая 9.4%, у o1 отставание с 9.1%.
▪Dataset
⭐️ Можем ли мы генерировать изображения с помощью цепочки мыслей CoT?
Давайте проверим и улучшим генерацию изображений шаг за шагом.
Авторегрессионная генерация изображений + масштабирование выводов приводят к существенному улучшению генерации изображений на нескольких бенчмарках.
▪Github ▪Статья ▪HF
⭐️ Pika 2.1
Крутейший генератор видео уже на подходе 😁 Движение в реальном времени стало намного лучше!
Здесь, можно подать заявку на ранний доступ:
▪Доступ
⭐️ o3-mini станет бесплатной — работать с моделью скоро смогут все желающие!
▪Новость
⭐️ Anthropic. Представили Citations
Новая функция API, которая позволяет Claude обосновывать свои ответы на предоставленных вами источниках.
Еще Claude может процитировать конкретные предложения и отрывки, которые лежат в основе каждого ответа.
▪Новость
@ai_machinelearning_big_data
#news #ai #ml #machinelearning #deeplearning #openai #pika #chatgpt #Imagen #cot
⭐️ Несколько часов назад OpenAI объявили, чтои выпустит CUA "Operator" (своего ИИ-агента, для управления пк) на этой неделе.
Через 50 минут спустя DeepLearning анонсируют мини-курс по работе со своим агентом Anthropics CUA.
Гонка за создание лучшего ИИ-агента для управления кмопьютером 🚀
📌 Курс
💵Трамп сегодня представит масштабный план по развитию инфраструктуры ИИ, и CBS сообщает, что он включает возвращение проекта Stargate.
OpenAI, Softbank и Oracle планируют инвестировать $500 млрд в течение следующих четырех лет.
AGI появится раньше, чем мы все ожидаем
США вкладывают огромные средства в ИИ, что хорошо для всей отрасли в целом.
https://www.cbsnews.com/news/trump-announces-private-sector-ai-infrastructure-investment/
🧠 DeepSeek обнаружили, что у их новой модели был момент озарения, когда она сама для себя разработала продвинутую технику рассуждения.
Оказывается, вам просто нужно правильно стимулировать модель.
Читой воды обучение с подкреплением (RL) может научить модель думать и рефлексировать.
Мы возвращаемся в эпоху AlphaGo: играя в бесчисленные партии Go и максимально увеличивая функцию вознаграждения (выигрыш в игре), используя чистый RL, AlphaGo научился побеждать лучших игроков мира.
Похоже это будет эра LLM RL.
📕 Paper
#DeepSeek #deepseekv3 #reasoning #ml
Строим рекомендательную систему фильмов на Kaggle
Вы когда-нибудь хотели сделать свою собственную систему рекомендаций фильмов? 🎬
Приходите на бесплатный вебинар, где Савелий Батурин, Senior ML-Engineer и преподаватель курса по ML школы Simulative в прямом эфире покажет как построить рекомендательную систему фильмов на Kaggle.
Что будем делать на вебинаре:
• Разберем имеющиеся данные фильмов с их оценками
• Проведем предобработку данных
• Построим рекомендательную систему на основе машинного обучения
•Проведем расчет и анализ метрик на основе результатов работы модели
🕗Встречаемся 21 января 19:00 по мск
Вебинар будет интересен как новичкам, так и уже опытным специалистам
Зарегистрироваться на бесплатный вебинар
🔎 Гении изобрели ИИ-очки для читерства в шахматах!..
@vistehno
Это правда...
OpenAI сегодня выпустит две версии семейства o3-mini:
o3-mini и o3-mini-high сегодня.
У некоторых людей уже появляется всплывающее окно в ChatGPT.
#chatgt #openai
💰 Хотя Anthropic кажется гораздо менее популярным, чем OpenAI, они получают сопоставимый доход со своего API.
Несмотря на то, что компания Anthropic была основана в 2021 году, она уже зарабатывает 1 млрд долларов в год.
С точки зрения количества токенов это эквивалентно 300T (input) / 60T (output) токенов для Sonnet.
#Anthropic #money #ai #ml #OpenAI
🚗 Можно по-разному относиться к Tesla, но это выглядит действительно футуристично!
Только что выпущенные Tesla сами едут к месту продажи.
@vistehno
IT-специалист — звучит круто! Но за этим «круто» стоят сотни часов учёбы и практики, ночи без сна и дни без обеда.
Лавка, Практикум и Высшее образование от Практикума объединились на День студента, чтобы подарить вам время на отдых. Время, когда вы не ходите за продуктами и не готовите еду.
Разыгрываем многоразовый сертификат на доставку в Яндекс Лавке на 50 000 рублей! А ещё подарки от Яндекс Практикума: кофе, шоппер и футболку.
Участвовать в розыгрыше: ссылка
Информация об организаторе конкурса, сроках, правилах проведения, количестве призов, сроках, месте, порядке получения призов указана на сайте.
⭐️ Хотите повторить момент озарения (Ahah-moment) DeepSeek всего за 30 долларов ? 🔥 😳
Исследователи из Беркли воспроизвели Ahah-moment в задачах на обратный отсчет и умножение.
Благодаря RL их модель LM 3B самостоятельно развивает способности к самопроверке и поиску.ю правильного ответа.
▪ Github▪Полный лог эксперимента ▪Тред
⭐️ На HF только что появились два новых ризонинг датасета.
1. OpenThoughts: 114 тыс датасет, полученный из R1 по математике, кодингу и другим наукам
2. R1-Distill-SFT: 1.7M, полученный из R1-32B на NuminaMath и Tulu data
⭐️Early Exploration of Multimodal R1⚡️
lmmslab провели интересное исследование мультимодальной R1, используя математически-ориентированные обучающие примеры RL* и *натренированные модели GRPO*.
▪Github ▪Dataset ▪Wandb Logs
⭐️ ИИ модель искусственного интеллекта под названием ESM3 смоделировала 500 миллионов лет эволюционных процессов, чтобы открыть новый белок под названием esmGFP.
Этот новый флуоресцентный белок, похожий на белки, обнаруженные у медуз, может найти применение в медицине.
Он существует только в виде цифровой последовательности и существенно отличается от известных белков.
Исследователи из компании EvolutionaryScale опубликовали результаты, которые сейчас проходят рецензирование.
Новые методы белковой инженерии могут произвести революцию во многих областях, включая разработку новых лекарств.
Флуоресцентные белки, такие как esmGFP, уже используются в исследованиях для визуализации биологических процессов.
ИИ значительно ускоряет этот процесс и расширяет возможности модификации белков.
▪Подробнее
⭐️ Альтернативные провайдеры DeepSeek V3
Официальный API DeepSeek сбоит уже почти сутки, так что многие пользователи ищут варианты.
▪Вот список открытых и не очень альтернатив.
⭐️ Stable Flow: Vital Layers for Training-Free Image Editing
Релиз кода для Stable Flow - метода, не требующего обучения, который позволяет выполняет различные типы операций по редактированию изображений (например, редактирование, добавление, замена объектов) с помощью моделей потока.
▪Github ▪Paper ▪Video
⭐️ Основатель Twitter Джек Дорси представил ИИ-агента Goose, который способен автоматизировать множество рутинных задач разработчика. Goose может: писать и запускать скрипты, делать скриншоты, редактировать файлы и тексты, исправлять ошибки в коде, генерировать целые проекты с нуля и тд. Агент доступен для бесплатного использования на локалке🪿
▪Установить ▪Github
@ai_machinelearning_big_data
#rl #ml #experiment #deepseek #reasoning #education #llm #news #ainews #ai
⚡️В то время как многие до сих пор спорят о том, как Китаю удалось достичь таких прорывов, как у DeepSeek, инсайдеры уже много лет пишут, что : лучшие и самые талантливые студенты Китая 🇨🇳 все чаще остаются учиться дома, а не уезжают за границу.
Вот иерархия, которую выбирают лучшие студенты Китая
Уровень 1 : Цинхуа, Пекинский университет, Бэйханский университет.
Уровень 2 : ведущие международные институты, такие как Carnegie Mellon, MIT и Stanford.
Уровень 3 : Другие университеты Китая.
Эта тенденция отражает целенаправленные усилия руководства Китая по созданию внутри страны систем образования и исследований мирового уровня, гарантируя, что лучшие специалисты останутся в стране.
Существует значительная пропасть между людьми, посещающими ведущие университеты, и теми, кто не учится в этих учебных заведениях в таких странах, как США, Великобритания, Япония, Россия, Бразилия и других.
Опыт Китая напоминает нам, что удержание талантов в и развитие элитных образовательных экосистем помогают развивать мировые инновации и конкуренцию.
@vistehno
#China #ml #ai
🔥 MagicMirror — это приложение для мгновенной замены лиц, причесок и одежды с помощью ИИ!
🌟 Оно работает локально на macOS и Windows, не требует мощного оборудования и обеспечивает полную конфиденциальность, так как обработка изображений выполняется на устройстве.
🔐 Лицензия: MIT
🖥 Github
@data_analysis_ml
🌟 Deepseek-R1 получать второй миска рис.
@vistehno
🌟 Выдыхаем.
@vistehno
🖥 Стрим про фичу оператора в ChatGPT
https://youtu.be/CSE77wAdDLg
@vistehno
🔥 Awesome-LLM — это коллекция ресурсов, связанных с большими языковыми моделями (LLM)!
💡 В репозитории собраны ссылки на инструменты, исследования, фреймворки, наборы данных и проекты, связанные с LLM, такие как GPT, LLaMA и другие. Этот репозиторий помогает разработчикам и исследователям быстро находить актуальную информацию по обучению, настройке и использованию языковых моделей.
🔐 Лицензия: CC0-1.0
🖥 Github
@vistehno
🔍 Так вот от чего отталкивается цена на эту монету на самом деле...
@vistehno
🔥 Китайская компания изобрела роботов, которые способны развивать скорость до 10 м/с!
🌟 А теперь представьте, что это преследует вас, ваши действия?
@vistehno
🚨Только что были выпущены веса для новой ризонинг моделей DeepSeek-R Zero.
Модель 685B на архитектуре на DeepSeek V3.
Размер: 720GB 🤯
Ждем официального анонса, который с высокой степенью вероятности состоится сегодня или завтра.
🤗HF: https://huggingface.co/deepseek-ai/DeepSeek-R1/tree/main
#DeepSeek
⭐️ Самые интересные Open Source AI релизы за неделю
- VideoChat2-Flash, мощный MLLM, построенный на базе видеокодера (UMT) и LLM (Qwen).
Внутри новая высокоэффективная архитектура модели с исключительной скоростью инференса, которая позволяет кодировать каждый видеокадр всего в 16 токенов, что в 5-10 раз быстрее, чем в предыдущей модели OpenGVLab.
Модели представлены в размерах 2B и 7B и разрешении 224 и 448.
- BytedanceTalk выпустил модель SA2VA с параметрами 26B.
Sa2VA - это MLM, способный отвечать на вопросы, понимать изображения и видео выполнять сегментацию. Модель, сопоставима с SOTA моделями в своем классе Qwen2-VL и InternVL2.5 в QA тестах.
- VRC-Bench - это новый бенчмарк для оценки эффективности мультимодальных LLM.
- MiniCPM-o 2.6 - это новая мультимодальная модель с 8B параметрами, работающая на edge девайсах. Лучшая в своем классе возможности двуязычной речи с разговором в реальном времени и клонированием голоса.
💬 LLM
- MiniMax-Text-01 - новая языковая модель, которая стабильно обходит GPT-4o и Gemini-2 на бенчмарках с длинным контекстом, сохраняя высокие оценки (0.910-0.963) при длине контекста до 4M токенов🤯
- Датасет: Sky-T1-data-17k - это разнообразный набор данных, используемый для обучения Sky-T1-32B - ризонинг модели, которую можно обучить всего за 450 долларов!
- Kyutai labs выпустили Helium-1 Preview 2B - многоязычный LLM для edge девайсов и мобильных устройств.
- Wayfarer-12B - новая модель генерации текстовой приключенческой ролевой игры от AI Dungeon🧙🏻
- ReaderLM-v2 - это новая модель синтаксического анализа HTML от JinaAI.
- Вriaforall выпустила Dria-Agent-a-3B, новую модель генерации кода (для Python), основанную на Qwen2.5.
- UnslothAI адаптировали Phi-4 к архитектуре Llama 3.3 сделав, более быструю и экономичную по памяти версию.
👀 Vision
- MatchAnything - это новая универсальная модель для сопоставления изображений.
- FitDit - это высококачественная модель виртуальной примерочной, основанная на архитектуре DiT.
⭐️ Аудио
- OuteTTS-0.3-1B - это новая многоязычная модель преобразования текста в речь с возможностью клонирования голоса и управления эмоциями.
📖 Поиск
- Lightblue выпустила новую модель для поиска связи в тексте, основанную на Qwen2.5. LB-reranker-0.5B-v1.0, которая поддерживает более 95 языков
- cde-small-v2 - это новая SOTA модель эмбедингов текста небольшого размера.
🧠 Playground
LeetGPU - бесплатная платформа для написания и запуска кода на CUDA.
Вы можете практиковаться и изучать CUDA онлайн, без использования графического процессора!
@ai_machinelearning_big_data
#ml #digest #datasets #opensource #ai #llm #news