complete_ai | Unsorted

Telegram-канал complete_ai - Complete AI

7150

Меня зовут Андрей Кузнецов Директор лаборатории FusionBrain в AIRI, один из фаундеров моделей Kandinsky, к.т.н., 15+ лет опыта в Computer Vision, выступаю с лекциями и пишу о событиях в AI и ML Tg: @kuznetsoff87 Linkedin: https://tinyurl.com/y96nmmdd

Subscribe to a channel

Complete AI

🎉🎄2023 год подходит к своему завершению, и я считаю его супер успешным как для команды в целом, так и для себя лично. За год было больше 50 различных мероприятий, где я принимал участие в роли спикера, было много релизов, 5 из которых, на мой взгляд, были очень громкими:
Kandinsky 2.1, Kandinsky 2.2, Kandinsky 3.0, Kandinsky Video, OmniFusion.

Мы опубликовали больше 10 научных статей, среди которых есть и статья в Q1, и публикация в Core A* конференции. Сформировали новые направления исследований и уже получили в рамках них определённые значимые результаты, провели несколько соревнований, организовали стабильное партнёрство с зарубежными и российскими командами.

Все эти и многие другие достижения — результат упорного труда всей команды, каждого её участника. Хочу выразить благодарность каждому персонально и пожелать новых прорывных результатов в 2024 году, задел для этого уже есть достаточно большой.

Результат этого года уже можно назвать вызовом для следующего, потому что планку снижать точно нельзя, а для роста ещё есть огромный потенциал.

Всем ещё раз спасибо и всех благ в 2024м году!

P.S. Спасибо и тебе, 2023й — ты был крут🏆🔥

@complete_ai

Читать полностью…

Complete AI

⚡️Сколько раз меня спрашивали в этом году: а что если нейросеть сгенерирует «не то», а можно ли результаты генерации присвоить себе, а кто автор созданного объекта и т.д.?
Где-то говорил, что знал от коллег юристов, где-то аккуратно обходил тему… И вот наконец нашёл человека, который поможет разобраться в этих острых и наболевших вопросах ⬇️

@NeironkiIPravo - канал про развитие правовых аспектов ИИ в России и мире

🔍Канал ведет дипломированный юрист в области цифрового права, увлеченный темой цифровизации бизнеса. Если вы заинтересованы в последних тенденциях искусственного интеллекта и его правовом регулировании, то вам точно сюда надо подписаться😉

🔍Информация будет полезна как физ, так и юр лицам!

📈 Подписывайтесь на @NeironkiIPravo и получайте ответы на все вопросы, касающиеся ИИ и права!

Читать полностью…

Complete AI

🔍Довольно неплохая вышла инфографика про существующие LLM и их число параметров

Исходник
Таблица с параметрами

@complete_ai

Читать полностью…

Complete AI

Всем спасибо за поддержку🙏💪

Читать полностью…

Complete AI

Добавлю вам новогодней и Рождественской тематики из Сингапура🎄

Читать полностью…

Complete AI

✈️До конца недели я на EMNLP-2023. В этом году конференция в Сингапуре, у нас здесь будет демо стенд по Kandinsky.

Буду выкладывать интересные инсайты с конференции🇸🇬

P.S. Помню, что ещё обещал рассказать про Гуанчжоу, ну и дорога из Москвы до Сингапура тоже заслуживает отдельного внимания - всё будет😉

Если кто-то из моих подписчиков тоже здесь, буду рад пересечься!

@complete_ai

Читать полностью…

Complete AI

Гугл представил Gemini — семейство мультимодальных моделей

Есть 4 размера — Ultra, Pro, Nano-1 (1.8B) и Nano-2 (3.25B), все они обладают контекстом в 32k токенов и понимают 4 модальности: текст, звук, картинки и видео. Из технических деталей могу только добавить, что там был RLHF 🤷‍♂️

Pro версия уже встроена внутри Bard, маленькие будут внутри Pixel 8, а самая крупная Ultra появится чуть позже после прохождения всех проверок на безопасность.

P.S. По метрикам самая крупная модель капельку получше, чем GPT-4 (но не везде). Поэтому, на мой взгляд, самые интересные модели — Gemini-Nano.

Статья, блог

Читать полностью…

Complete AI

🤖Есть очень мало телеграм-каналов про нейросети, которые выбиваются из общего списка. Канал основателя AI Agents Саши Хопёрского «Всё о AI» как раз такое исключение.

Ребята уже 6 лет занимаются автоматизацией бизнеса и создают автономных агентов. В своём канале Александр без секретов рассказывает о реальных кейсах и последних инсайтах, которые помогают упростить бизнес и сэкономить время.

Ещё у ребят на канале есть бесплатный Бот @ChatGPT-4 для неотложных задач.

Советую всем подписаться на «Всё о AI» и не пропускайте ничего важного из мира эйай.

Читать полностью…

Complete AI

🔥В списке DailyPapers на Hugging Face снова наша статья про модель синтеза видео Kandinsky Video, релиз которой состоялся на днях)

https://huggingface.co/papers/2311.13073

Поддержите лайками на Hugging Face - выйдем снова в Топ-1💪

UPD: Благодаря вам, уже Топ-2🙏🙏🙏

@complete_ai

Читать полностью…

Complete AI

💪День релизов не закончился, поэтому хочу порадовать вас ещё одной новостью!

🚀Выходим за границы текста

С удовольствием анонсирую новую мультимодальную мультизадачную модель OmniFusion от команды FusionBrain AIRI. Работает одинаково хорошо как с текстом, так и с изображениями. Она понимает, анализирует, отвечает на вопросы и продолжает диалог.

🦾 Точно определяет объекты на картинке
🦾 Детектирует расположение и цвета
🦾 Считает объекты
🦾 Работает на английском и русском языках
🦾 Умеет рассуждать и решать сложные задачи даже в специфических доменах, в том числе IQ тесты

В OmniFusion мы использовали очень интересный способ объединения разных модальностей без обучения «с нуля». Правильным образом построили адаптеры над энкодерами, исследовали различные механики обучения и дообучили предобученную LLM, лежащую в основе, понимать изображения.

👀 Обучали на основе модели с 7В параметров, а по качеству почти добрались до LLaVA с 13В в основе.

Узнать больше об архитектуре можно на Хабре, а пока ловите примеры работы.

@complete_ai

Читать полностью…

Complete AI

🎥It's time for a night teaser

@complete_ai

Читать полностью…

Complete AI

📆8 декабря в Москве планируется масштабный ивент для всех, кому интересны технологии разговорного и генеративного AI 🔥

На Conversations обсудят вызовы и достижения разработки LLM, новые фреймворки, обучение трансформеров, нейросетевую обработку и модели распознавания речи, RAG-подходы, "железо" для запуска LLM и другие актуальные темы из мира нейросетей.

В числе спикеров представители команд GigaChat, YaGPT, MTS AI, ВКонтакте, Selectel, Тинькофф, Yandex Cloud, Just AI, Лаборатория Касперского, Zerocracy, Reezonly. Полный список участников можно найти на сайте. Многие спикеры мне лично хорошо знакомы, поэтому приходите - будет точно интересно!

Участвовать, кстати, можно и онлайн.

Билеты тут, а чтобы было приятнее - вот промокод на скидку 10% CNVS23aLc

@complete_ai

Читать полностью…

Complete AI

Выложили сегодня статью на архив по исследованиям анизотропии intrinsic dimensions в трансформерах. Очень интересные результаты получились в части компактности представлений эмбеддингов на внутренних слоях.

Вышел даже обзор статьи на YouTube

Читать полностью…

Complete AI

Вчера выступал на российско-китайской Открытой конференции NAUKA 0+ МГУ в г. Шеньчжень, Китай с пленарным докладом о мультимодальных архитектурах и исследованиях, которыми мы активно занимается в рамках научной группы FusionBrain.

Это мой первый опыт рабочей поездки в Азию и вот, чем хочется поделиться с вами:
1) китайцы очень по-хорошему любопытный и заинтересованный народ, жадный до новых идей и знаний, стараются донести мысль как угодно, даже с помощью электронного переводчика и жестов
2) г. Шеньчжень всего 40 лет, но выглядит он очень большим и активно застраиваются огромные многоэтажные кварталы
3) вокруг очень чисто, огромное количество парков, тёплом море, низкие цены на многие товары
4) по части блюд визуально невозможно определить, что там может быть в составе🤔
5) конференция проходит в МГУ-ППИ в Шеньчжене, который является мини-копией Московского (вики)
6) Курорты на Южно-Китайском море (Dameisha Resort!!!) - отличная альтернатива Таиланду🏖️
7) К сожалению нет возможности попасть в Гонконг по однократной академической китайской визе. После пересечения границы - обратной дороги не будет:(
8) Наличие знания английского языка никак здесь вам не поможет, так же как и наличие любой валюты кроме юаней и карт UnionPay (карту сделал в РФ в одном из банков). Идеально иметь WeChat или Alipay, но туда не так просто попасть
9) Большинство автомобилей - электромобили, поэтому порой идя по оживленной улице ты преимущественно можешь слышать сигналы клаксона, речь людей и все остальные звуки, кроме двигателей🚎
10) В номерах очень любят делать стеклянные прозрачные перегородки между комнатой и ванной🛀

На следующей неделе буду в Гуанчжоу пару дней - посмотрим, чем меня удивит Китай там🇨🇳

Читать полностью…

Complete AI

🔥Куда уж меньше?
BitNet: Scaling 1-bit Transformers for Large Language Models

Microsoft Research продолжая исследования в области эффективного обучения и инференса языковых моделей (летом они выпускали статью про новый тип архитектур для замен трансформеров - Retentive Networks) выкатили однобитную трансформерную архитектуру BitNet (веса принимают значения только -1 и +1). На ряде задач BitNet умудряется выдавать качество сопоставимое с моделями в FP16. Авторы предлагают замену слоя nn.Linear на BitLinear для обучения бинарных весов. Сами же активации входных тензоров квантуются до 8-битных значений в ходе обучения. На этапе деквантизации в слое BitLinear точность активаций восстанавливается.

Что получаем в сухом остатке:
1) квантованные веса и активации снижают вычислительные затраты на обучение
2) градиенты и состояния оптимизатора сохраняют высокую точность, чтобы обеспечить стабильность обучения
3) для ускорения сходимости в начале обучения модели с бинарными весами применяют большие значения LR (маленькие изменения не приведут к обновлению бинарных весов)
4) scaling laws работают так же как и для fp16 трансформеров!
5) идеологически этот подход можно применять и для других типов архитектур (сами авторы планируют применить его в RetNet’ах)

Статья

@complete_ai

Читать полностью…

Complete AI

⚡️Стал одним из 5 лучших исследователей года в Сбере

Напряжённый год, мало сна, много задач и выступлений, но результату персональному и команды очень рад🍾

Чуть позже хочу оформить рефлексию с результатами года, постараюсь успеть в этом году - объективно результативность выдалась мощнейшая🙏

Читать полностью…

Complete AI

⚡⚡⚡Важная новость!

Начинаю поиск middle и senior исследователей на следующие треки:
1) мультимодальные архитектуры — добавление новых модальностей для расширения возможностей языковых моделей, разработка специфических энкодеров
2) генеративный ИИ — синтез мультимедийных данных по различным условиям: текст, набор каких-либо параметров, инструктивные задачи video/image editing
3) reinforcement learning в прикладной области (RLHF, задачи робототехники и т.д.)
4) задачи компьютерного зрения — face/head swap, стилизация видео, повышение разрешения изображений/видео и др.
5) опыт обучения больших моделей с использованием технологий PyTorch Lightning, DeepSpeed и тд.

❗❗❗
1) Важно иметь опыт в указанных направлениях (1-3+ лет)
2) Идеально будет наличие публикаций в журналах Q1, конференциях A/A*
3) Наличие степени/PhD будет плюсом

💥Свои CV можно присылать мне в ЛС (@kuznetsoff87) и в ближайшее время будем начинать серию собеседований. Там же отвечу на все вопросы, ответы на самые частые вопросы выложу в этот пост в формате апдейта.

Буду благодарен за репост🙏

UPD: Найм в AIRI и Sber AI

@complete_ai

Читать полностью…

Complete AI

📽️На днях выложили записи выступлений на YaTalks 2023, делюсь с вами ссылками на своё выступление и в целом на плейлист докладов с конференции — все очень интересные и рекомендуются к просмотру холодными зимними вечерами🎄

📌Сильный ИИ - миф или уже реальность?

📌Все доклады

Читать полностью…

Complete AI

⚡️Мы снова в списке Daily Papers на Hugging Face (за 7 декабря 2023)

В этот раз с техническим отчетом по нашей новой модели text-to-image Kandinsky 3.0. Там внутрянка об архитектуре, отличия от прошлых версий, количественные и качественные результаты.

Приглашаю всех ознакомиться со статьёй и поддержать её upvote голосами на платформе по ссылке ниже🙏

📌Ссылка

Читать полностью…

Complete AI

С некоторым запозданием возвращаюсь к рассказу о поездке в Гуанчжоу. Добирался туда на скоростном поезде из Шеньчженя, поэтому путь в 140 км занял около 30 минут.

По приезде первая задача была найти такси и тут всё очень интересно: есть официальные такси, есть «бомбилы», которые дерут деньги и которых гоняют полицейские очень сурово. А в обычное такси ты должен просто отстоять в живой очереди из пассажиров - эдакий матчинг двух бесконечных очередей: люди и машины.

Заселился в 4 seasons по промо стоимости, и это было лучшее место, в котором я бывал в командировках. Чтобы повысить КПД от поездки, по приезде сразу пошли изучать достопримечательности.

Отправились в Canton Tower - телебашня высотой 604 м, в которой много разных точек обзора. Мы там взяли полный билет и прошли все доступные уровни для наблюдения) А на верхушке установлен самый высокий аттракцион для свободного падения.🎢

📋Из особенностей - передвигаться пешком практически невозможно, везде очень много скутеров, которые едут по тротуарам наравне со всеми) Ощущения безопасности нет от слова совсем. С англ языком такие же проблемы - почти никто его не понимает. В остальном - гигантский суперсовременный и красивый город!

Подводя итог: новые впечатления от еще одного города Китая. Рекомендую всем, кто планирует побывать в этой стране, заехать в этот город. Фото по написанному прилагаю😉 На этом путь по Китаю в этом году завершён) Далее - Сингапур🇸🇬

Читать полностью…

Complete AI

Наша модель OmniFusion на базе Mistral 7B справляется не хуже новой Gemini💪

Читать полностью…

Complete AI

⚡️⚡️⚡️Барабанная дробь!
А вот и первый зимний подарочек от наших команд - приложение для работы с Kandinsky доступно в AppStore👨‍💻

✅Скачивайте скорее fusionbrain.ai и пользуйтесь широким спектром возможностей генеративных моделей!

По традиции все замечания и предложения пишите в комментариях к посту, и они сразу же горяченькие попадут к разрабам!

P.S. Пока из функций только генерация изображений, но скоро довезём весь функционал веб-сервиса fusionbrain.ai

@complete_ai

Читать полностью…

Complete AI

❣️ Мы готовим для вас большой блок про ML на YaTalks 2023

YaTalks — это самая большая техническая конференция Яндекса, которая пройдёт 5 и 6 декабря в Москве, Белграде и онлайн. В этом году мы пригласили более сотни спикеров, которые прочитают доклады о разработке, управлении и карьере в IT.

Главная тема YaTalks 2023 — явления, которые меняют мир и двигают его вперёд. В первый день мы готовим много докладов про машинное обучение, уже готовы рассказать о некоторых из них:

🔘 Алексей Гусаков, технический директор в Яндекс Поиске. Расскажет, как инженеры управляют временем.

🔘 Сергей Овчаренко, руководитель группы нейросетевых технологий компьютерного зрения в Яндекс Поиске. Покажет практические аспекты обучения диффузионных моделей на примере YandexART.

🔘 Андрей Кузнецов, руководитель научной группы FusionBrain в AIRI. Обсудит, воплотился ли сильный ИИ в реальности или остался элементом научной фантастики.

При этом YaTalks — это не только доклады. Мы готовим для вас много других активностей на площадке: лайвкодинг, воркшопы, мастер-классы по резюме с HR и консультации с главными экспертами рынка. Будут стенды хедлайнеров конференции: Яндекса, Тинькофф, Авито, VK, Positive Technologies, Райффайзен Банка и других технологических компаний. Подробнее об этом мы будем рассказывать в телеграм-канале конференции — обязательно подписывайтесь на него.

Всё это — бесплатно, нужно только зарегистрироваться. Важно, что сейчас можно зарегистрироваться на посещение только одного из дней конференции YaTalks 2023 — и это не баг, а фича, чтобы больше людей смогли послушать наши доклады. Онлайн можно подключиться из любой точки земного шара в любой день.

📎 А ещё мы сделаем для вас небольшой подарок: все участники YaTalks 2023 получат доступ к курсу «Продуктовый подход» от Яндекс Практикума. Так что переходите на сайт, изучайте программу и регистрируйтесь!

Подписывайтесь 👉 @Yandex4ML

Читать полностью…

Complete AI

Представляем новую мультимодальную мультизадачную модель OmniFusion, которую мы сделали совместно с исследователями из Sber AI и SberDevices

Модель способна анализировать, описывать и отвечать на вопросы по изображениям, поддерживая непрерывный диалог с пользователем. Анализируя предоставленные пользователем изображения, OmniFusion точно распознаёт расположенные на них объекты, их количество, цвет и положение в пространстве.

OmniFusion может не просто описать картинку, но и ответить на сопутствующие вопросы, а также использовать извлечённую информацию в ходе диалога с человеком. Например, она может распознать сфотографированное блюдо и предложить рецепты его приготовления, найти ответ на логическую задачу или объяснить шутку.

Больше интересного про архитектуру:

→ Новый пост на Хабр про то, как устроена модель OmniFusion
Рассказ про модель от Андрея Кузнецова, а также доклад Ивана Оселедца на AI Journey 2023

Читать полностью…

Complete AI

Дорогу Kandinsky Video 🎬

🥇Рад представить вам нашу новую модель с новой архитектурой, которая является первой российской end-to-end нейросетью по синтезу видео по тексту - это был реальный вызов для нас!

Внутри наша модель состоит из двух этапов, которые отвечают за две важные задачи синтеза: генерация ключевых кадров (для управления сюжетной линией видео) и генерация дополнительных кадров (для плавности движений).

А теперь чуть-чуть подробнее:

📌 в качестве генератора кадров используется модель Kandinsky 3.0
📌разрешение генераций 512 пикселей
📌генерировать можно с различным соотношением сторон
📌можно выбрать частоту кадров для плановности
📌генерация занимает от 1 до 3 минут (зависит от степени плавности, которой вы хотите добиться при синтезе)

Ссылки на проект:
FusionBrain.ai
Telegram bot
сайт проекта
rudalle.ru
GitHub

Почитать подробнее про Kandinsky Video можно в новой статье на Хабре.

По вопросам сотрудничества и развития модели пишите в ЛС - с радостью обсудим все идеи🤝

@complete_ai

Читать полностью…

Complete AI

Как всё сложно…

https://www.theverge.com/2023/11/18/23967199/breaking-openai-board-in-discussions-with-sam-altman-to-return-as-ceo

Читать полностью…

Complete AI

The Shape of Learning: Intrinsic Dimensions in Transformer-Based Models

Препринт нашей новой работы! Оказалось, что языковые модели «упаковывают» свои репрезентации в очень компактное пространство с внутренней размерностью не больше 60. И при этом анизотропия на средних слоях трансформеров-декодеров стремится к единице! Получается, эмбеддинги из середины модели расположены вдоль одной линии.

Еще одно интересное наблюдение — обучение LLM делится на две фазы: расширение и последующее сжатие активаций (см. картинку). А перед взрывами лосса их размерность немного подрастает.

Статья

Читать полностью…

Complete AI

Краткий опрос

Мы тут стихийно собираем мнение о мероприятиях в айтишке. Уделите пару минут, больше не займет ❤️

Ссылка

Читать полностью…

Complete AI

🎂

Читать полностью…

Complete AI

⚡⚡⚡Научили Kandinsky 2.2 "понимать" время

Мы сегодня расширяем способности Kandinsky 2.2 и добавляем новую возможность создавать видеоролики по текстовому описанию в режиме анимации. По одному текстовому описанию генерируется 4-секундное видео, эффект анимации можно выбрать из предложенного списка: от смещений в разные стороны до сложных пролётов над сценой - всего таких режимов 16 штук.

Видео генерируются с частотой 24 кадра в секунду и разрешением 640×640 пикселей. Ожидание генерации от запуска до результат составит около 1.5 минут.

Так как новый режим ресурсозатратный, мы решили пока дать доступ самым активным пользователям Kandinsky 2.2, которые получат приглашение в ближайшее время. Ну а к концу года обязательно раскатаем для всех).

Мы также добавили интересный режим, который для себя назвали "Режиссёр". Смысл в том, что пользователь может ввести 1-3 текстовых описаний, затем выбрать для каждого свою механику анимации, а после этого модель создаст «мини-фильм».

Те пользователи, которые хотят попробовать новые возможности модели сейчас, могут оставить заявку на получение доступа в Telegram-боте.

Ну и мы следуем традиции - код выложен в open source, на Хабре больше деталей и генераций.

Добро пожаловать из мира статики в мир динамики💪
Очень жду ваш фидбэк — это для нас крайне важно!

📌Полезные ссылки:
Сайт проекта
GitHub
Telegram-бот
Хабр (coming soon...)

UPD:
Добавили галерею на rudalle.ru

@complete_ai

Читать полностью…
Subscribe to a channel