complete_ai | Unsorted

Telegram-канал complete_ai - Complete AI

7150

Меня зовут Андрей Кузнецов Директор лаборатории FusionBrain в AIRI, один из фаундеров моделей Kandinsky, к.т.н., 15+ лет опыта в Computer Vision, выступаю с лекциями и пишу о событиях в AI и ML Tg: @kuznetsoff87 Linkedin: https://tinyurl.com/y96nmmdd

Subscribe to a channel

Complete AI

Вместе с коллегами из TRASSIR успешно завершили первый этап исследования возможностей мультимодальных моделей в задачах видеоаналитики📷

Основная цель проекта — создание системы, способной эффективно выявлять случаи краж товаров в торговых точках с минимизацией ошибок. Мы использовали мультимодальные модели, работающие в zero-shot-режиме, чтобы снизить количество ложных тревог и повысить точность выявления подозрительных ситуаций без специального дообучения модели.

Улучшения:
⚫️Механизмы рассуждения, позволяющие лучше распознавать сложные действия (например, "взятие+возврат" товара)
⚫️Детализация эпизодов интереса для более точного анализа коротких событий
⚫️Поддержка потокового видео с учётом длинного временного контекста

➡️Будущие проекты предусматривают использование мультимодальных моделей для оценки соблюдения стандартов общепита: анализ аудио на предмет соблюдения речевых скриптов персоналом, контроль за соблюдением санитарных норм, детекцию нарушений, связанных с условиями допродаж и чистотой помещений.

Читать полностью…

Complete AI

Эта неделя насыщена деловыми поездками, делюсь с вами.

📌Первый пункт назначения был вчера — международная конференция IEEE USBEREIT 2025 в Екатеринбурге. Целью конференции являлось объединение исследователей и практиков из различных областей науки, включая радиоэлектронику, информационные технологии, биомедицинскую инженерию и другие.

Я выступал с докладом по генеративному проектированию в области строительства и промышленного производства. Это направление активно развивается в рамках деятельности лаборатории FusionBrain и вызывает интерес как у научного сообщества, так и у представителей бизнеса. После доклада присоединился в качестве эксперта к круглому столу про применение и развитие современных технологий ИИ в образовании.

📌Следующая остановка — Казань!

Читать полностью…

Complete AI

Приглашаю вас на мое выступление на Data Fest в Сбере 30 мая

Будем говорить про генеративное проектирование в архитектуре, новые горизонты возможностей для творчества и инженерии 🤖

Подключайтесь к онлайн-трансляции в сообществе Сбера в VK или приходите на мероприятие, если вы в Москве!

Чтобы прийти очно, необходимо зарегистрироваться ➡️ вот тут

Читать полностью…

Complete AI

Поздравляю всех с великим праздником — С Днём Победы⭐️

Вечная память всем героям, которые отдали жизнь ради счастья и спокойствия будущих поколений! Мы будем нести историю из поколения в поколение🙏

Желаю всем мира и добра!🕊️

Читать полностью…

Complete AI

Коллеги из Сбера ищут человека, который будет организовывать и проводить хакатоны по искусственному интеллекту в онлайн и оффлайн форматах 👋

Кандидат будет управлять всеми этапами подготовки мероприятия — от разработки концепции и привлечения участников до контроля качества исполнения и анализа результатов.

Что предстоит:
☑️Разработка концепций и реализация хакатонов
☑️Подбор и координация команд разработчиков
☑️Юридическое сопровождение и подготовка документов
☑️Запуск рекламы
☑️Организация церемоний награждения, анализ обратной связи

Что ждут от кандидата:
☑️Опыт проектной деятельности и организации мероприятий
☑️Понимание правовых норм и опыт работы с документацией
☑️Коммуникабельность и умение вести переговоры
☑️Хорошее знание инструментов и методов управления проектами (Agile/Scrum)
☑️Английский язык для общения и понимания технических материалов
☑️Желательны базовые знания AI и ML

Присылайте резюме @vladalogunova и приходите делать крутые проекты в Сбере вместе 😼

Читать полностью…

Complete AI

Коллеги из Сбера опубликовали на Хабре кейс: «Как мы научили GigaChat слышать».

Из главного, для повышения качества распознавания перешли на end-to-end архитектуру вместо связки ASR + LLM. И если раньше голосовой запрос шёл через распознавание речи и преобразование в текст, то сейчас GigaChat Audio сразу распознаёт речь. В side-by-side сравнении на 1200 диалогах набрал 0,68 против 0,32 у прежней схемы. Вместе с этим увеличилась и длительность контекста до 170 минут аудио в одном запросе.

Новый GigaChat Audio достиг уровня GPT-4o. Субъективная оценка диалоговых возможностей на русском языке состояла из семи критериев: общее впечатление, красота, грамотность, следование system, контекстность, полезность и фактология.

Протестировать слух нейросети уже можно в веб-версии giga.chat и в боте @gigachat_bot.

Читать полностью…

Complete AI

Обращаюсь ко всем потенциальным участникам школы👨‍🎓👩‍🎓

Если вы:
📍испытываете экзистенциальные муки выбора (подаваться или нет)
📍сложности с выполнением задания (так делать или иначе)
📍любые другие сомнения относительно летней школы

Вы можете задать свой вопрос прямо внизу в комментариях и получить на него ответ👇👇👇

И помните, «не бывает глупых вопросов — бывают глупые ответы» (не в этом случае, надеюсь)😅

Читать полностью…

Complete AI

Head of FusionBrain Lab (Andrey Kuznetsov) meets co-lead of VGG group at University of Oxford (Andrea Vedaldi)

Читать полностью…

Complete AI

Head of FusionBrain Lab (Andrey Kuznetsov) meets Head of Google Research (Yossi Matias)

Читать полностью…

Complete AI

Приглашаю вас на открытую лекцию от DeepSchool, чтобы разобраться в одном из ключевых вопросов: есть ли жизнь после релиза?

После запуска модели работа не заканчивается. Начинаются новые испытания: модель деградирует, количество новых пользователей растёт, а для эффективной поддержки у команды нет лишних рук. Важно заранее предугадывать, где и что может пойти не так.

На лекции узнаете:
▶️как в реальности выглядит цикл жизни CV-модели
▶️как выстраивать поддержку: что можно автоматизировать, а что — нет
▶️как следить за качеством модели: дрифты, аутлаеры, шум, ключевые метрики
▶️какие есть подходы для автоматизации мониторинга модели
▶️и спроектируте возможное решение на примере реальной задачи

Также все участники лекции получат программу курса CV Rocket и скидки на обучение 📕

Обо всём этом расскажут:
Анастасия Старобыховская — руководитель CV-направления НЛМК ИТ
Тимур Фатыхов — основатель DeepSchool, ex Lead CV Engineer, KoronaPay

Регистрируйтесь по ссылке и подключайтесь 24 апреля, четверг, 18:00 МСК.

Читать полностью…

Complete AI

В ожидании новой модели синтеза видео…

Поделюсь новостями, как выйдет подробная информация📝

Читать полностью…

Complete AI

Продолжаем тренд. Теперь делаем анимацию😉

Промпт для Image2Video (Kling 1.6) в комментариях👇

Читать полностью…

Complete AI

Очень люблю разные визуализации риалтайм событий. Раньше в Самарском универе делали онлайн карту движения гор транспорта на модном тогда HTML5, когда Яндекс.Транспорта ещё не существовало. Тогда же появилось приложение мобильное "Прибывалка-63" и онлайн можно было посмотреть каждый автобус, трамвай и троллейбус (это к слову были 2012-2013 г.г.!). А в конце января 2025-го пришли какие-то персоны из деп транспорта и под какими-то не особо обоснованными предлогами доступ к данным закрыли и сервис с приложением перестали радовать жителей Самары...
"Мы никому не скажем, когда займёмся оптимизацией, но знаки будут")

А вспомнил я про это потому, что недавно набрёл на live карту Лондонского метро, и ностальгия посетила 👇
https://www.londonunderground.live/

Читать полностью…

Complete AI

Приглашаю принять участие в IT_ONE Cup. ML Challenge

Соберите крутого AI-ассистента для дизайнеров, системных и бизнес-аналитиков! Призовой фонд — 1,5 миллиона рублей, каждый участник сможет забрать классный мерч и получить приглашение в магистратуру ИТМО.

Окончание регистрации совсем близко — успейте зарегистрироваться до 13 апреля!

Почему стоит участвовать?
✔️ Нужен всего лишь прототип, а не готовый продукт
✔️ Попробуете свои силы в машинном обучении, обработке текста и компьютерном зрении
✔️ Узнаете, какие методы реально работают
✔️ Базовых знаний и желания экспериментировать хватит — модели с нуля учить не придётся

Что вас ждёт на IT_ONE Cup. ML Challenge?
✔️ Поработаете с современными технологиями: LLM, NLP, RAG, MCP
✔️ Создадите AI-инструмент, который упростит работу других специалистов
✔️ Сможете попасть в магистратуру ИТМО на факультет Программной инженерии и компьютерной техники. Число приглашений не ограничено – шанс будет у каждого

Какие треки есть?
1️⃣ Динамические контекстные подсказки для системного аналитика
2️⃣ AI-генератор дизайн-макетов по описанию требований
3️⃣ Система визуализации BPMN-диаграмм

Пройдите регистрацию и получите главный приз!

Читать полностью…

Complete AI

Я участвую в Программном комитете AiConf X 2025 — конференции по Data Science от Онтико, организаторов HighLoad++ и TeamLeadConf 🌟

Сейчас мы ищем сильных спикеров и доклады по темам:
🟡RecSys, поиск, таблицы
🟡Генеративный AI: генерация и распознавание текстов, музыки, изображение, видео, рerception
🟡ML Edge — оптимизация обучения и инференса, дистилляция, квантизация, hardware и т.д.
🟡Automotive, роботы
🟡Обработка данных и бенчмарки

Акцент конференции на практические форматы: мастер-классы, воркшопы, круглые столы и т.д.

Даже если ваша тема отличается от перечисленных, присылайте заявки 🙂

10 апреля в 17:00 приглашаем на бесплатную онлайн-встречу с программным коммитетом, где обсудим темы конференции, идеи и ответим на вопросы. Встреча неформальная, нужно пройти регистрацию!

Жду ваши доклады!

Читать полностью…

Complete AI

📌Второй пункт — Казань!

Вместе с Университетом Иннополис мы запустили новую лабораторию мультимодального генеративного ИИ!

Сегодня, на XVI Международном экономическом форуме «Россия — Исламский мир: KazanForum», состоялось подписание соглашения заместителем директора по развитию цифровых проектов российского ИТ-вуза Алексеем Павловым и генеральным директором Института AIRI Иваном Оселедцем.

Мне выпала честь возглавить новую лабораторию. Вместе с Директором Института ИИ Университета Иннополис Рамилем Кулеевым будем заниматься сведением ресерч инициатив лаборатории и продуктовых запросов от бизнеса с прицелом на повышение качества, а также поиском новых решений с помощью мультимодальных моделей. Задачи новой лаборатории связаны с треками лаборатории FusionBrain, AIRI, что усилит научные проекты и повысит эффективность команд.

Начало положено
✔️

Если вы студент, аспирант, постдок Иннополиса с опытом работы с языковыми, мультимодальными моделями, увлечены темой генеративного ИИ, присылайте мне
@kuznetsoff87 своё резюме!

Читать полностью…

Complete AI

Стал доступен первый российский AI-сервис для создания 3D-моделей — Kandinsky 3D 🚀

За считанные минуты сервис генерирует детализированные 3D-объекты по текстовым описаниям или входным изображениям. На выбор несколько поддерживаемых форматов: STL, OBJ, FBX, GLB и USDZ.

Kandinsky 3D также поможет оптимизировать процессы генеративного проектирования и промышленного дизайна. Нейросеть создаёт полигональные модели, совместимые с профессиональными системами автоматизированного проектирования (САПР).

Протестировать модель можно здесь, подключить API здесь.

Читать полностью…

Complete AI

⚡️Sakana AI продолжает свой путь в развитии bio inspired архитектур нейронных сетей. Свежий утренний релиз нового типа моделей - Continuous Thought Machine

Ключевой особенностью новой архитектуры - механизм синхронизации нейронов, где каждый нейрон - это набор весов или мини-нейронка со своей памятью состояний. Как результат - говорят о росте способности к рассуждениям или reasoning, что сейчас является очень важным направлением развития фундаментальных моделей.

Детально тут👇
Paper: https://pub.sakana.ai/ctm/
GitHub: https://github.com/SakanaAI/continuous-thought-machines

@complete_ai

Читать полностью…

Complete AI

2025 год. Международная конференция NAACL 2025. Место проведения — Альбукерке, США. Представление работы, когда никому из авторов не дали визу🤪

Пояснение: это некоторая виртуальная площадка как в онлайн стратегии, где ты ходишь между постерами и можешь к любому подойти, рассмотреть его и собственно поговорить с презентующим о его исследовании или просто посмотреть постер.

Так и живём😉

Читать полностью…

Complete AI

Мы с командой делали сервис по реставрации и колоризации фотографий для Бессмертного полка💪

Поэтому, если у вас есть фото ваших героев, то можете внести их вместе с краткой информацией до 6 мая на сайте👇

https://2025.polkrf.ru/

Фото дедушки получилось очень красивым!

Читать полностью…

Complete AI

Ванильный RAG не работает. Как исправить?

RAG — один из самых популярных подходов для интеграции LLM в реальные продукты. Но несмотря на популярность его внедрение часто сопровождается проблемами: система выдает недостоверные ответы, делает поверхностные выводы или вообще молчит. Причины разнообразны: эмбеддинг теряет суть запросов, поиск пропускает важные документы, генератор не справляется с обработкой контекста.

В эту среду DeepSchool проведёт открытую лекцию, на которой коллеги разберут, как в этой системе навести порядок✔️

На лекции вы узнаете:
🟢почему ванильная схема "ретривер + генератор" почти никогда не даёт нужного качества
🟢с чего начинать улучшения: эмбеддер, поиск, реранкер, генератор, данные или что-то ещё
🟢какие задачи приходится решать, чтобы RAG действительно работал
🟢как из разрозненных компонент собрать надежный RAG-продукт

На лекции также будет представлен курс LLM Pro, где вы сможете научиться создавать эффективные AI-решения. Всем участникам лекции — скидка на обучение!

📎Регистрируйтесь по ссылке и подключайтесь 30 апреля в 18:00!

Читать полностью…

Complete AI

До закрытия приёма заявок на школу по искусственному интеллекту «Лето с AIRI» в ТГУ — всего 4 дня!

Все лекции и семинары прошлого года доступны в VK Видео — загляните, чтобы почувствовать атмосферу Школы и вдохновиться на участие.

Подавайте заявки по ссылке до 29 апреля 23:59📌

Читать полностью…

Complete AI

21 апреля в AIRI мы организовали крупнейший в России семинар по генеративному проектированию ⤵️

Более 100 участников руководителей и представителей департаментов проектирования крупнейших строительных компаний и промышленных предприятий собрались на площадке AIRI. Магистральная команда AIRI и Сбера со своей стороны поделилась текущими результатами создания передовых методов для автоматизации задач проектирования в строительстве и инженерии, получив в завершении важную положительную обратную связь и новые предложения о сотрудничестве.

Основные темы дискуссии
⚫️Автоматизация процессов в строительстве и архитектуре, синтез BIM моделей, квартирография и создание дизайн проектов по текстовым описаниям
⚫️Применение генеративных моделей в промышленности при создании 3D моделей изделий
⚫️Реверс-инжиниринг и восстановление CAD-моделей

Отдельно поговорили о разработке AI-помощников для контроля качества, оптимизации расходов и онлайн-мониторинга реализации проектов на стройке. Обсудили внедрение 3D-технологий в производство — например, как восстанавливать сложные детали на базе облаков точек.

Мы также сделали фокус на прикладном применении наших решений и создании плагинов для широко используемых продуктов (Компас-3D, Autodesk Revit). Важно отметить, что команда генеративного проектирования достаточно молодая — трек стал активно развиваться с сентября 2024 года, хотя экспертиза в GenAI накоплена уже существенная. При этом сам трек в бОльшей степени ориентирован на прикладную пользу для решения реальных задач строительства и промышленности. Side эффект в виде научных публикаций, конечно, станет приятным дополнением!

Генеративное проектирование поможет сделать производство эффективнее:
📍сократить сроки реализации проектов
📍снизить риски пропуска ошибок на этапе проектирования
📍упростить выполнение ряда задач, а некоторые полностью заместить работой AI-ассистента.

Для российской экономики такие инструменты — важная часть в плане конкурентоспособности предприятий на мировой арене. На пути много вызовов, и мы к ним готовы💪

Читать полностью…

Complete AI

📍На этой неделе я решил посетить конференцию Machines can see 2025, пока большинство моих коллег поехало на ICLR. Довольно интересные дискуссии происходят, много внимания уделяется прикладным задачам, которые можно решать на базе VLM/LLM.

Крупные компании показывают свои разработки в области ускорения развертывания моделей, NVidia показывала свой фреймворк для использования LLM as a microservice, Google говорит о geospatial reasoning, квантовых вычислениях, создании помощников для задач медицины, образования, copilot для учёных исследователей. Постараюсь дальше чуть подробнее рассказать про некоторые интересные инсайты.

#MCS2025

Читать полностью…

Complete AI

Отметили четырёхлетие Института!

Все сердца AIRI сегодня — для вас ❤️

Читать полностью…

Complete AI

Не участвовал в разработке Llama 4 — можно рассмотреть резюме😅

Спасибо @data_secrets за весёлый инсайт

Читать полностью…

Complete AI

Все в тренде, а я чем хуже😅

Промпт в подарок в комментариях 👇

Читать полностью…

Complete AI

до меня долетела статья с Хабра про то, как человек тестирует LLM на общении в Тиндере на предмет того, как быстро собеседник поймет, что с ним разговаривает бот; при этом, по всей видимости этот гражданин не знает о существовании теста Тьюринга

я конечно несколько опешил от такого невежества, но с другой стороны это дало мне повод написать про свежую статью, в которой были протестированы GPT-4.5 и LLaMa 3.1 как раз в контексте теста Тьюринга; результаты представлены на картинке к посту; из интересного, ELIZA оказалась по этому тесту лучше GPT-4o; кому интересно, я про нее недавно писал

второй факт, который на мой взгляд резко переносит нас из точки "настоящее" в точку "будущее" - это 73% побед для GPT-4.5; это означает, что уже сейчас есть ИИ, который в разговоре в 3 из 4 случаев не отличить от человека; эра беспрецедентного телефонного мошенничества не за горами, а буквально уже наступила; такие дела


P.S. забавный факт, в той хабростатье тоже неожиданно лучше всех оказалась GPT-4.5; ссылка на Хабр

Читать полностью…

Complete AI

⚡️⚡️⚡️И вот снова приближается Лето с AIRI, где моя лаборатория будет представлена в трёх треках:

📍Мультимодальные модели для видео
📍Генеративные модели для параметрических данных
📍World Models (совместно с @causality_links)

Мы подготовим очень крутой материал на базе проводимых исследований, в том числе с описанием ряда прикладных продуктовых кейсов, где нам удалось апробировать полученные результаты. Поделимся процессом поиска эффективных решений и результатом выбора наилучших из них.

Летняя школа пройдёт с 30.06 по 10.07 на базе Томского государственного университета. Участникам, прошедшим отбор, понадобится самостоятельно покрыть только транспортные расходы.

Если ты бакалавр 2-4 курса, магистр, аспирант или молодой учёный, то…
👉 Регистрируйся по ссылке до 29 апреля включительно
👉 Пиши крутую заявку на участие в отборе
👉 Приезжай и получай возможность интенсивно прокачаться за лето, найти новых единомышленников и может быть даже подготовить свою первую статью на топ конференцию

❓Вопросы можно оставлять под постом

Делитесь, распространяйте
/channel/airi_research_institute/825

Читать полностью…

Complete AI

Как удаление знаков препинания и артиклей в запросе снижает точность языковых моделей до 20%⤵️

Исследователи AIRI обнаружили, что знаки препинания и артикли играют более важную роль в обработке информации языковыми моделями, чем кажется на первый взгляд. Это удалось узнать с помощью метода, который позволяет определить, какие именно данные сохраняются в связке с конкретными токенами.

В серии экспериментов исследователи использовали тексты, из которых заранее убрали элементы, кажущиеся незначительными для логики повествования: знаки препинания, артикли и стоп-слова. Для этого систему обучили анализировать последовательность токенов и восстанавливать текст. Оказалось, что больше всего информации о контексте содержится именно в стоп-словах. Затем поставили перед несколькими популярными языковыми моделями задачу — решить, какие элементы текста, с точки зрения человека, можно удалить. Проверка подтвердила, что, если убрать из формулировки технического задания такие «незначительные» символы, качество работы модели падает.

📎Код для анализа работы языковых моделей доступен по ссылке.

Читать полностью…
Subscribe to a channel