bigdatai | Unsorted

Telegram-канал bigdatai - Big Data AI

15161

@haarrp - админ Вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейроннным сетям @data_analysis_ml - анализ данных @ai_machinelearning_big_data @itchannels_telegram - важное для программиста

Subscribe to a channel

Big Data AI

🎥📊 SpatialVID: Обширный видеодатасет с пространственными аннотациями

SpatialVID предлагает более 21,000 часов видео с детализированными 3D аннотациями, включая позиции камер и карты глубины. Этот датасет создан для улучшения моделей пространственного интеллекта и подходит для исследований в области видео и 3D-визуализации.

🚀Основные моменты:
- Более 2.7 миллиона клипов с разнообразными сценами
- Аннотации включают динамические маски и структурированные подписи
- Поддержка реальных динамических сцен с точными данными о движении камер
- Уникальный ресурс для повышения обобщающей способности моделей

📌 GitHub: https://github.com/NJU-3DV/SpatialVID

#python

Читать полностью…

Big Data AI

📚 Эта статья представляет метод Chain-of-Retrieval Augmented Generation (CoRAG), который улучшает качество генерации ответов путем поэтапного извлечения релевантной информации!

🌟 В отличие от традиционных подходов, CoRAG динамически реформулирует запросы, улучшая результаты на сложных задачах, таких как мультихоп-вопросы. Эксперименты показывают значительное улучшение точности по сравнению с существующими методами.

🔗 Ссылка: *клик*

@bigdatai

Читать полностью…

Big Data AI

🛠️ AI SDK Devtools: Инструмент для отладки и мониторинга AI приложений

AI SDK Devtools предоставляет мощные возможности для отслеживания событий, отладки вызовов инструментов и мониторинга производительности в реальном времени. Он позволяет фильтровать события, визуализировать использование токенов и перехватывать потоки данных AI SDK.

🚀Основные моменты:
- Реальное время мониторинга событий AI
- Отладка вызовов инструментов с параметрами и результатами
- Мониторинг производительности (скорость потоков)
- Фильтрация событий по типу и имени инструмента
- Визуализация использования контекста и токенов

📌 GitHub: https://github.com/midday-ai/ai-sdk-devtools

#typescript

Читать полностью…

Big Data AI

Сэм Альтман рассказал очень любопытную деталь о Sora.

Многие правообладатели наоборот хотят, чтобы их персонажи чаще использовались в видео, созданных с помощью Sora.

Пока OpenAI старается провести грань между конфиденциальностью и защитой, владельцы прав всё чаще просят больше открытости и видимости.

Они поняли, что когда пользователи создают креативные или вирусные видео с их персонажами, это повышает вовлечённость аудитории и популярность франшиз.

Ограничивая использование, можно потерять охват - поэтому для многих теперь открытость стала выгодой, а не угрозой.

🟠Полное интервью

Читать полностью…

Big Data AI

✔️ Ling-1T - новая модель от inclusionAI с 1 триллионом параметров

Модель на 1 трлн, из них ≈ 50 млрд активны на токен (MoE-архитектура).

Она обучена на 20 трлн+ токенов, специально отобранных для задач логического мышления и рассуждений. Контекст: 128 000 токенов.

Построена на базе Evo-CoT (Evolutionary Chain of Thought) и Linguistics-Unit RL - нового метода обучения для масштабируемых рассуждений. При помощи Evo-CoT модель постепенно улучшает баланс между точностью рассуждений и вычислительной эффективностью. То есть с каждым шагом она пытается делать рассуждения «глубже», но не слишком дорого по ресурсам.

Моделька демонстрирует сильные результаты в задачах кода, математики, логики и фронтенд-генерации.

В архитектуре задействованы Mixture-of-Experts (1/32 активация), MTP слои и маршрутизация экспертов.

Ling-1T показывает, что огромные модели можно сделать не только мощными, но и экономичными.

https://huggingface.co/inclusionAI/Ling-1T

@ai_machinelearning_big_data

#Ling1T #AI #ML #OpenSource #Reasoning #TrillionScale #FP8

Читать полностью…

Big Data AI

У вас есть 404 секунды, чтобы разобраться, зачем ML-разработчикам нужен MCP

Model Context Protocol — это опенсорсный стандарт, который позволяет LLM напрямую взаимодействовать с IDE, таск-трекерами, БД и другими сервисами.

То есть агент может не только писать код, но и:
— ставить задачи в трекере,
— запускать автотесты,
— проверять безопасность,
— деплоить в облако.

Больше никаких «костылей» с отдельными интеграциями — один протокол закрывает весь цикл ML-разработки.

Подробнее — в выпуске «404 секунды» на YouTube или VK Видео

Читать полностью…

Big Data AI

Команде Kandinsky нужны именно вы? Сейчас узнаем! 😏

1) Разрабатывать и внедрять техники ускорения инференса.
2) Использовать и дорабатывать существующие ML-компиляторы.
3) Улучшать процессы обучения с помощью исследований.

Если вы трижды ответили «да» — добро пожаловать на One Day Offer, который пройдёт 11 октября.

Зарегистрироваться!

Читать полностью…

Big Data AI

🐦 X открыл исходники алгоритма "For You"

Как работает лента рекомендаций в 7 шагах:

1️⃣ Сырые данные (вход):
- соцграф (кто кого фолловит),
- вовлечённость (лайки, ретвиты, ответы, закладки),
- данные о пользователе (клики, профиль, поведение).

2️⃣ Feature Engineering:
- GraphJet — граф твитов в реальном времени
- SimClusters — объединение в коммьюнити ("AI Twitter", "NBA Twitter")
- TwHIN — карта связей пользователь↔твит
- RealGraph — сила связей
- TweepCred — скоринг доверия
- Trust & Safety сигналы

3️⃣ Candidate Sourcing (Home Mixer):
Разные миксеры (CR Mixer, UTEG, FRS) вытягивают твиты из разных пулов → больше разнообразия.

4️⃣ Heavy Ranker (ML-модель):
Нейросеть предсказывает, что вам зайдёт: лайки, ретвиты, ответы, время чтения.

5️⃣ Фильтры и эвристики:
- социальное доказательство
- разнообразие авторов
- блок спама/NSFW/мутов
- баланс контента
- защита от «замыливания»

6️⃣ Микс:
Рекламные твиты + рекомендации «кого фолловить» → в ленту.

7️⃣ Что это значит для вас:
- выбери нишу
- пиши ценные посты
- отвечай по делу в своей теме
→ вырастишь аудиторию и найдёшь людей/идеи для бизнеса.


https://github.com/twitter/the-algorithm

#Twitter #ForYou #AI #RecommenderSystems

Читать полностью…

Big Data AI

🔥 7 бесплатных интерактивов для аналитиков

Эти сервисы — не просто игрушки, а мощные симуляторы, которые помогают прокачивать аналитику через практику.
Они отлично подходят для подготовки к собеседованиям, изучения новых концепций или просто для того, чтобы «залипнуть» с пользой.

Вот подборка, в которую я сам возвращаюсь снова и снова:

1️⃣ Симулятор стартапа — teachmegrow.com

2️⃣ A/B-тесты на практике — lukasvermeer.nl/confidence

3️⃣ Эволюция доверия — notdotteam.github.io/trust

4️⃣ UX-игра на внимательность — cantunsee.space

5️⃣ UX Arcade — uxcel.com/arcade

6️⃣ Вероятности и статистика на пальцах — seeing-theory.brown.edu

7️⃣ Алгоритмы в картинках — visualgo.net

💡 Сохраняйте, проходите и делитесь с коллегами — это реально полезный интерактив.

Читать полностью…

Big Data AI

🌌 xAI готовит Grokipedia — открытую базу знаний, где миссия одна: правда.

📖 Что известно:
- Это будет полностью открытый репозиторий знаний без ограничений на использование.
- Основан только на проверенных фактах и правде.
- Задуман как источник, которому смогут доверять и люди, и ИИ.

✨ Почему это важно
Grokipedia — часть миссии xAI: понять Вселенную и дать доступ к истине в её чистейшей форме.

🔮 Grokipedia уже близко...

#xAI #AI #knowledge #opensource

Читать полностью…

Big Data AI

🖥 PlutoPrint — быстрое создание PDF и PNG из HTML с помощью Python

PlutoPrint — это лёгкая и удобная библиотека на Python для генерации качественных PDF и изображений напрямую из HTML или XML. Она основана на мощном рендеринг-движке PlutoBook, что делает её идеальной для отчетов, счетов, билетов и визуализаций.

Основные возможности

Поддержка PDF и PNG – можно создавать как статичные изображения, так и печатные документы из
Простота установки и использования — установка через pip install plutoprint; пример для командной строки:

plutoprint input.html output.pdf --size=A4

🟠 Github

@pythonl

Читать полностью…

Big Data AI

Sam Altman x David Deutsch о GPT-8 и AGI

В беседе с одним из самых ярких физиков современности Сэм спрашивает:
👉 Если GPT-8 решит задачу квантовой гравитации, будет ли это доказательством AGI?

🔹 Дойч считает, что Turing Test - несостоятельный критерий.
🔹 LLM, даже «GPT-5», не обладают настоящим творческим вдохновением.
🔹 AGI нельзя измерить фиксированными тестами.

⚡ Но если GPT-8 реально решит квантовую гравитацию — для Дойча это и будет AGI.

Источник: *Deutsch Explains* (YouTube)

Читать полностью…

Big Data AI

Positive Technologies приглашает на онлайн-презентацию нового продукта — PT Data Security

Решение помогает защитить критически важные данные компании, снижает риски утечек и обеспечивает соответствие требованиям регуляторов.

На онлайн-трансляции вы первыми узнаете:

— Какие задачи и риски сегодня определяют настоящее и будущее рынка защиты данных.
— Какие вызовы стоят перед компаниями на рынке защиты данных.
— О новом подходе Positive Technologies к защите данных.

📅 8 октября, 15:00 мск
📍 Онлайн
👉 Регистрация

*Защита данных

Читать полностью…

Big Data AI

🧠 MIT: новый подход к созданию AI-агентов для социальных задач

Учёные из MIT предложили метод, который позволяет агентам не просто подстраиваться под одну задачу, а обобщать поведение на новые ситуации.

🔑 Как это работает:

Вместо обычного fine-tuning или промптинга на одном датасете — используют поведенческую теорию как основу подсказок.

Эти подсказки потом проверяют на других, но близких по смыслу задачах.

Такой «двойной шаг» заставляет агентов сохранять только те описания процесса принятия решений, которые реально предсказывают поведение даже при изменении среды.

📊 Результаты:

3,41x выше вероятность правильного ответа по сравнению с базовыми моделями (на 1 490 играх).

53–73% меньше ошибок на новых вариантах игр.

2,44x лучше, чем классические равновесия Харсани–Зельтена.

👉 Идея проста: если описывать процесс решений на человеческом языке и фильтровать его через теорию + проверку в других условиях, агент начинает вести себя более «по-человечески» и лучше справляется с неожиданными ситуациями.

🟠Статья

Читать полностью…

Big Data AI

✔️ Alibaba открыла исходный код модели Qwen3-VL.

Это vision-language модель, которая умеет управлять графическими интерфейсами, писать код, строить диаграммы в Draw.io по макетам и распознавать объекты в самых разных областях - от повседневной жизни до узкоспециализированных сфер. Среди ключевых возможностей: точное определение событий в видео продолжительностью до двух часов, расширение поддержки OCR с 19 до 32 языков с улучшением качества на редких символах и наклонном тексте, работа с контекстом длиной 256 тысяч токенов с возможностью увеличения до миллиона, а также высокая точность в задачах обнаружения рисков в реальных условиях.
HF

✔️ Google Research представил новую работу о моделях для временных рядов.

Исследователи показали, что foundation-модели могут обучаться в стиле few-shot, то есть адаптироваться к новой задаче прямо «на лету», без отдельного переобучения.

В основе подхода лежит TimesFM, расширенный методом in-context fine-tuning (TimesFM-ICF). Модель получает несколько примеров вместе с историей данных и учится делать прогнозы более точно. В экспериментах на 23 датасетах точность выросла на 6,8% по сравнению с базовой моделью, при этом качество оказалось сопоставимо с версиями, обученными специально под каждый набор данных.

Теперь модели временных рядов можно использовать как LLM: им достаточно нескольких примеров в контексте, чтобы подстроиться под задачу. Это открывает путь к более гибкому и простому применению таких систем в бизнесе, финансах, энергетике и других областях.
Google

✔️ Исследователи из MIT, OpenAI и Sakana AI предложили новый метод ASAL (Automated Search for Artificial Life), который автоматизирует поиск «искусственной жизни» с помощью foundation-моделей.

Главная идея в том, что вместо ручного конструирования симуляций теперь можно задавать цель в виде текста, а модель будет находить или создавать такие системы, где возникают жизнеподобные явления.

ASAL работает на разных субстратах - от классических Boids и Game of Life до Lenia, Particle Life и нейронных клеточных автоматов. В ходе экспериментов метод открыл новые формы поведения в Lenia и Boids, а также клеточные автоматы, способные демонстрировать открытое и сложное развитие, сравнимое с «Жизнью» Конвея.

Это открывает путь к ускоренному исследованию искусственной жизни и автоматическому открытию новых «жизнеподобных» систем, которые раньше приходилось искать вручную.

✔️ Еще Qwen представила свою новую флагманскую модель Qwen3-Max, сразу доступную без ограниченного превью. Линейка включает две версии: Qwen3-Max-Instruct, ориентированную на кодинг и агентные задачи, и Qwen3-Max-Thinking, оснащённую инструментальным использованием и «heavy mode» для сложных сценариев.

По результатам тестов Qwen3-Max выходит на уровень топовых моделей на таких бенчмарках, как SWE-Bench, Tau2-Bench, SuperGPQA, LiveCodeBench и AIME25. Модель построена на масштабном датасете и опирается на значительные вычислительные мощности как в предобучении, так и в RL.

Компания позиционирует Qwen3-Max как новый флагман и открывает доступ сразу на нескольких платформах: в Qwen Chat, через API Alibaba Cloud и в блоге разработчиков.
X

✔️ Отчёт Google DORA показал: 90% IT-специалистов уже используют ИИ в работе, что на 14% больше, чем год назад. В опросе участвовало почти 5 тысяч разработчиков, и в среднем они тратят около двух часов в день на взаимодействие с AI-инструментами.

Доверие остаётся ограниченным: 46% доверяют «отчасти», 23% — «немного», и только 20% - «сильно». Это объясняется частыми мелкими исправлениями после автогенерации. Влияние на качество кода оценивается сдержанно: 31% видят лёгкое улучшение, 30% — «без изменений». Зато ощутим рост скорости за счёт снижения рутины.

На рынке труда обстановка сложнее: вакансии для новичков сократились на 71% с 2022 года, а кандидаты подают сотни заявок, прежде чем получить работу.
Report

@ai_machinelearning_big_data

#news #ai #ml

Читать полностью…

Big Data AI

📢 Калифорния первой в США выпустила закон, обязывающий ИИ признавать, что они не люди

Штат принял закон SB 243 - первый в стране, регулирующий AI-чат-ботов-компаньонов.

Основные положения:

▪Если пользователь может подумать, что говорит с человеком, бот обязан показать уведомление, что он искусственный интеллект.

Компании должны иметь протокол предотвращения суицида: блокировать подобный контент и направлять пользователей на горячие линии помощи.

Этот протокол должен быть опубликован на сайте.

При общении с несовершеннолетними бот обязан напоминать каждые 3 часа, что это ИИ, и советовать сделать перерыв.

Запрещено выдавать себя за врача или иного специалиста в области здоровья.

Для подростков должен быть фильтр от сексуального контента.

С июля 2027 года операторы обязаны ежегодно отчитываться в Офисе по предотвращению самоубийств о своих действиях при выявлении риска.

Пользователи смогут подавать в суд на компании — минимум на $1 000 за каждое нарушение.

В тот же день подписаны сопутствующие меры:

Закон SB 53 (сентябрь 2025) — обязывает крупных разработчиков ИИ публиковать протоколы безопасности.

Новые правила о проверке возраста, предупреждениях на соцсетях и штрафах до $250 000 за дипфейк-порнографию.

Закон принят после громких случаев и исков, связанных с вредными взаимодействиями подростков с чат-ботами, включая CharacterAI и дело о гибели пользователя ChatGPT.

techcrunch

#ai #news

Читать полностью…

Big Data AI

✔️ Китай выходит в лидеры мировой робототехники

Китай стремительно превращается в мирового лидера по производству и внедрению гуманоидных роботов. В стране формируется полный цикл - от датчиков и приводов до готовых автономных систем.

По данным издания, только за прошлый год на китайских заводах установлено около 300 тысяч промышленных роботов, что больше, чем во всём остальном мире вместе взятом. И почти все они - китайского производства.

Компания Unitree уже выпустила гуманоидного робота R1 стоимостью менее 6 000 долларов, что в несколько раз дешевле предыдущих моделей. Это стало возможным благодаря высокой локализации производства и быстрой обратной связи между разработчиками и фабриками.

Демографический кризис и старение населения подталкивают Китай к автоматизации. Правительство активно поддерживает отрасль - создаёт тестовые полигоны, субсидирует стартапы и внедряет роботов в промышленность и сервис.

Если США не активизируют собственные программы в области робототехники, Китай может занять доминирующее положение в одной из ключевых технологий XXI века.
washingtonpost

✔️ Microsoft и Georgia Tech научили ИИ думать “молча”

Исследователи создали систему SwiReasoning, которая позволяет языковым моделям решать, когда говорить, а когда просто думать. Вместо того чтобы постоянно проговаривать свои шаги, как в Chain-of-Thought, модель теперь может рассуждать скрыто - в латентном пространстве.

Когда уверенность низкая, она «думает молча», обрабатывая идеи внутри в виде непрерывных векторов. Когда уверенность возрастает - «высказывает» выводы словами. Такой гибкий режим делает рассуждения в среднем на 56–79% эффективнее, а в пике - до 6.78 раза быстрее, без потери точности.

Исследователи называют это началом новой эры latent reasoning - когда ИИ размышляет не словами, а понятиями.
Paper

✔️ xAI разрабатывает world models - продвинутые системы ИИ, способные понимать и моделировать физический мир.

Для этого проекта xAI привлекла бывших специалистов Nvidia, которые будут работать над созданием ИИ, умеющего формировать реалистичные трёхмерные среды и взаимодействовать с ними.

Первым направлением применения таких моделей станет индустрия игр - xAI планирует использовать world models для генерации интерактивных 3D-миров с динамическим поведением объектов и физикой.
В будущем эти технологии могут применяться в робототехнике и других областях физического ИИ.
Согласно планам компании, первая игра, полностью созданная искусственным интеллектом xAI, должна выйти к концу следующего года.
X

✔️ Учёные научили ИИ определять СДВГ по тому, как человек видит и обрабатывает мелькающие картинки.

Модель анализирует зрительные ритмы - микропаузы между кадрами, которые мозг воспринимает по-разному у людей с и без СДВГ. Точность диагностики - 91,8%, а различить, принимает ли человек стимуляторы, ИИ смог с точностью 91%.

Метод может стать новым способом диагностики без тестов и интервью - достаточно показать короткое видео и измерить, как мозг реагирует на световые ритмы.
psypost

✔️ Microsoft запускает инструмент, который покажет начальнику, насколько активно ты пользуешься ИИ

Microsoft внедряет в свою корпоративную платформу Viva Insights новую функцию под названием Benchmarks - систему, которая позволяет менеджерам отслеживать, насколько активно сотрудники используют искусственный интеллект в рабочих приложениях. Benchmarks станет частью Copilot Dashboard, панели аналитики, которая собирает данные о взаимодействии сотрудников с инструментами Microsoft 365 - от Teams и Outlook до Word, Excel и PowerPoint.

Руководители смогут видеть процент «активных пользователей Copilot» в разных отделах, сравнивать показатели внутри компании и даже сопоставлять их с усреднёнными данными по отрасли. По официальному определению Microsoft, «активный пользователь Copilot» - это тот, кто совершил «намеренное действие с ИИ» в одном из поддерживаемых приложений.

То есть если ты хотя бы раз за месяц использовал Copilot для генерации письма, отчёта или кода - ты попадёшь в статистику
winbuzzer

@ai_machinelearning_big_data


#news #ai #ml

Читать полностью…

Big Data AI

На Stepik вышел топ курс - “PostgreSQL для разработчиков: от основ к созданию API”

Если ты до сих пор просто пишешь SQL-запросы - самое время научиться строить полноценные backend-сервисы, где база данных работает как у настоящих инженеров.

В этом курсе ты пошагово создашь REST API на FastAPI + PostgreSQL:
от установки окружения и первых таблиц — до масштабируемого, безопасного приложения с CRUD-операциями.

💡 Что разберёшь на практике:
• SQL-запросы, фильтры, агрегаты, подзапросы
• Связи между таблицами и нормализацию БД
• Работа Python с PostgreSQL
• Реализация REST API
• Оптимизация и задачи с собеседований

⚡ После курса - свой готовый API-проект и реальные навыки продакшн-уровня.

🚀 Начни курс: https://stepik.org/course/255542/pay

Читать полностью…

Big Data AI

🚀 Выходные, которые изменят твою карьеру!

Авито проводит Data Science Weekend Offer 18–19 октября. За два дня ты можешь пройти все этапы и получить оффер в сильную DS-команду.

📌 Для кого: специалисты middle и senior уровней, работающие с NLP или классическим ML.

Что тебя ждёт:

💻 До 10 октября — пройди онлайн-тест
📆 18–19 октября — технические интервью и знакомство с командами Поиск и рекомендации, AI Lab, Антифрод и модерация
🌟 До 21 октября — получи оффер в компанию мечты

Проведи выходные с реальными кейсами Авито, пообщайся с топ-экспертами и забери оффер за два дня!

Зарегистрироваться

Читать полностью…

Big Data AI

🤖 ByteDance Seed представил **AgentGym-RL** — новый единый фреймворк для обучения агентов с подкреплением.

🔹 Первый универсальный RL-фреймворк для обучения агентов в многошаговых задачах (без SFT).
🔹 Модульная и расширяемая архитектура: web, поиск, игры, embodied-среды и научные задачи.
🔹 Агенты достигают и даже превосходят коммерческие модели на 27 задачах.

proj: https://agentgym-rl.github.io
repo: https://github.com/woooodyy/AgentGym-RL

#RL #AI #ByteDance #AgentGym #ReinforcementLearning #Agents

Читать полностью…

Big Data AI

🛠️📊 Логирование разработки с AI-поддержкой

Dev3000 собирает полную хронологию разработки вашего веб-приложения, включая логи сервера, события браузера и автоматические скриншоты. Этот инструмент упрощает отладку, позволяя AI-ассистентам, таким как Claude, анализировать все данные в одном месте.

🚀Основные моменты:
- Хранит логи с временными метками для легкого доступа.
- Автоматически создает скриншоты при навигации и ошибках.
- Интеграция с AI для мгновенной отладки.
- Поддерживает фильтрацию и поиск по логам.
- Визуальный интерфейс для просмотра логов.

📌 GitHub: https://github.com/vercel-labs/dev3000

Читать полностью…

Big Data AI

Генерим безумные мюзиклы из чего угодно — Sora 2 теперь и в этом мастер.

🎭 Промт:

[Warhammer 40K], но в стиле бродвейского мюзикла — герои поют на сцене, яркий свет, театральные костюмы, всё на русском языке.


@bigdatai

Читать полностью…

Big Data AI

🌍 MENLO: From Preferences to Proficiency

Новый фреймворк и датасет для оценки и моделирования качества ответов LLM, максимально приближенного к "родной речи", сразу на 47 языках.

Идея вдохновлена принципами audience design - то есть адаптацией модели под разные аудитории и культурные контексты.

📄 Статья: arxiv.org/abs/2509.26601
🤗 Датасет: huggingface.co/datasets/facebook/menlo

Читать полностью…

Big Data AI

GigaChat Vision Team — ваша будущая команда! 😉

Если вы зарегистрируетесь на One Day Offer для NLP- и CV-инженеров и пройдёте все этапы отбора, то уже совсем скоро будете:

✔️ Обучать Vision, 3D/CAD и омни-модальные модели на тысячах A100/H100.
✔️ Создавать live-ассистента на edge-устройствах, а также базовые модели VLA для промышленных проектов: автоматизированных фабрик, автопилотов и роботов.
✔️ Работать с документами: Document Intelligence и разработка VLM OCR.
✔️ Развивать мультимодальную инфраструктуру: от инференса генеративных моделей до создания и авторазметки синтетических данных

Дублируем ссылку на регистрацию — до встречи 4 октября!

Читать полностью…

Big Data AI

Хочешь запускать AI-продукты на базе LLM — не на словах, а в продакшене?
Тогда учиться нужно не у теоретиков, а у тех, кто уже делает это для крупнейших компаний.

Курс «Инженер LLM» — про то, как на практике собирать рабочие архитектуры под реальные задачи, адаптировать open‑source решения и запускать продукты с ИИ, которые действительно работают.

Разработан GIGASCHOOL, совместно с крупнейшей магистратурой по искусственному интеллекту AI Talent Hab.


Преподаватели — топы индустрии:
Кристина Желтова, директор по разработке моделей, Газпромбанк;
Александр Потехин, NLP Lead, X5 Tech;
Евгений Кокуйкин, CEO HiveTrace.

Ты научишься:
➡️дообучать модели (fine-tuning, PEFT, RLHF);
➡️работать с LangChain, LangGraph и векторными базами;
➡️строить RAG‑системы, реализовывать инфопоиск и защищать LLM;
➡️собирать пайплайны, деплоить, трекать, версионировать;
➡️проектировать мультиагентные решения и ассистентов.

▪️252 часа теории и практики;
▪️диплом о профессиональной подготовке;
▪️старт 15 октября | 25 недель онлайна с заранее продуманными каникулами;
▪️36 450₽/мес (рассрочка);
▪️повышение цены — 3 октября.


Смотри программу и оставляй заявку🔗

Читать полностью…

Big Data AI

🧠 Илья Суцкевер о сходстве ИИ и человеческого мозга

Он приводит примеры:
- Дети, у которых удалили половину мозга, всё равно продолжают нормально функционировать.
- Сенсорные входы могут «переподключаться» к другим областям мозга.

Это показывает, что корковые структуры универсальны и повторно используются — как ДНК и белки.
👉 Вывод: интеллект основан на общей архитектуре, и ИИ может отражать биологические системы.

Источник: *No Priors* (YouTube)

Читать полностью…

Big Data AI

🚀 Вышел Jupyter Agent Dataset!

📊 Обучение на этом датасете значительно улучшает навыки моделей в выполнении кода и анализе данных.

🔍 Из чего он собран:
- 7 ТБ реальных Kaggle-датасетов
- 20k Jupyter-ноутбуков
- Трассы реального исполнения кода, сгенерированные с помощью Qwen3-Coder и E2B

👉 Датасет доступен здесь: https://huggingface.co/datasets/data-agents/jupyter-agent-dataset

Читать полностью…

Big Data AI

🎮 LLM-бенчмарк в стиле Among Us

Новый тест проверяет модели не на код и задачи, а на социальные навыки: доверие, обман, убеждение и координацию. Для этого их заставляют играть в Among Us в мультиагентной среде.

📊 Результаты:

- GPT-5 реже всего ошибочно исключает игроков в роли члена экипажа.

- Как импостор, модель крайне убедительна и эффективна в обмане.

- GPT-5 гибко адаптируется к роли: минимизирует вред в команде и максимизирует его как предатель.

Такой бенчмарк показывает, как ИИ справляется с социальными динамиками, недоступными для стандартных тестов.

https://www.4wallai.com/amongais

Читать полностью…

Big Data AI

🤖 Yandex AI Studio: Платформа для создания ИИ-агентов без навыков разработки

Yandex AI Studio — это платформа для быстрого создания ИИ-агентов на базе уже развернутых в облаке моделей. Она позволяет автоматизировать бизнес-процессы без глубоких знаний в программировании.

🚀 Ключевые возможности:

• Инструмент AI Search для поиска по изображениям, таблицам и документам;
• Составление мультиагентных сценариев (например, анализ спроса + планирование закупок);
• Запуск голосовых агентов на базе realtime API, генерирующих ответ в режиме реального времени;
• Быстрая интеграция с внешними сервисами по шаблону через MCP Hub;
• Готовые решения – например, Нейроюрист для ответов на юридические вопросы.

#AI #nocode #automation

Читать полностью…

Big Data AI

🧠 Qwen3-ASR Toolkit: Умный инструмент для транскрипции аудио

Qwen3-ASR Toolkit — это мощный Python-инструмент для работы с API Qwen-ASR, позволяющий обрабатывать аудио и видео любой длины. Он преодолевает ограничение в 3 минуты, умно разбивая длинные файлы и обрабатывая их параллельно, что значительно ускоряет транскрипцию.

🚀 Основные моменты:
- Обходит 3-минутное ограничение API для транскрипции.
- Умное разделение аудио с использованием детекции активности голоса.
- Параллельная обработка для быстрого получения результатов.
- Автоматическая очистка текста от артефактов ASR.
- Поддержка множества форматов медиа благодаря FFmpeg.

📌 GitHub: https://github.com/QwenLM/Qwen3-ASR-Toolkit

#python

Читать полностью…
Subscribe to a channel