Канал про нейросети в компьютерной графике, в кино и вообще Чат: https://t.me/+16lR_Zc8oVM2ZTky
SegAnyMo: Code for Segment Any Motion in Videos
Сегментирование движущихся объектов на видео без человеческих аннотаций
Под капотом DINO и SAM2
Видео с отслеживанием точек это как раз промежуточная работа DINO
Код
#segmentation #video2mask #tracking
Тем временем в ChatGPT прикрутили редактирование картинок по маске.
Открываем в чате загруженную или сгенерированную картинку, в правом верхнем углу ищем кнопку рисования маски.
Манипуляции с картинками открыли для бесплатных пользователей. Так я и узнал, что рост Бендера с антенной чуть выше 6 футов
Думает долго, поэтому Бендера с совой не будет
#news #imageediting #inpainting
WeShopAI Virtual Try-On
Китайская виртуальная примерочная
Есть офсайт
И API
#tryon
Появились два новых демоспейса MV-Adapter для генерации текстуры 3D модели
MV-Adapter-Text2Texture - создает текстуру по входному мешу и тексту
MV-Adapter-Img2Texture - создает текстуру по входному мешу и изображению
#text2texrure #text2image #image2image #image2texture #texture
— Астанавитесь!
Альтман просит в твиттере юзеров генерить поменьше картинок. Небывалая по продолжительности нагрузка на серверы Open AI вызвана, очевидно, волной гиблификации всего и вся.
Юзеры как всегда троллят в ответ - листайте тред
#humor #news
Turtle: Learning Truncated Causal History Model for Video Restoration
Реставрация видео: удаление снега, дождя, шума, блюра (размытия).
Модель накапливает причинно-следственную историю и обрабатывает каждый текущий кадр с учетом предыдущих
Код
#videorestoration #deblur #denoise #viedo2video #restoration
MiniMax Speech-02
Возможности MiniMax Audio обновились
Создает аудиокниги и подкасты из файлов или URL-ссылок, обрабатывает до 200 тысяч символов за раз
Умеет клонировать голос
Генератор речи поддерживает 30+ языков
При выборе голоса в Speech Synthesis русский есть, но везде ли и как он работает - не проверял
Хвастаются качеством звука
#text2speech #tts #voicecloning
Free4D: Tuning-free 4D Scene Generation with Spatial-Temporal Consistency
Создает 4D-сцены на гауссианах из одного изображения, управляемый рендер в реальном времени.
Код
#image2gaussian #image2video #imageto4d #gaussian #nivelview #realtime #4d
TokenHSI: Unified Synthesis of Physical Human-Scene Interactions through Task Tokenization
унифицированная модель, которая позволяет персонажам, основанным на физике, выполнять разнообразные задачи взаимодействия человека со сценой. Для 3D персонажей и роботов
Код ждем
#HSI #humananimation
TripoSG / TripoSF
Новые модели Tripo
TripoSG 1.5B преобразует картинку в меш
TripoSF работает с более сложными топологиями/сценами, может моделировать внутренние детали объектов
Гитхаб
Веса
Демо
#imageto3d
DeepSite
Кодинг в браузере на базе DeepSeek-V3-0324
Сразу можно и хостить созданное приложение
#vibecoding #coding
Время мемов и рефлексии
#humor
Создаем свой сайт за пару кликов с помощью ИИ
Если хотите создать свой сайт, да так чтоб хорошо выглядел на любом устройстве, но у вас нет подходящих навыков — попробуйте сгенерировать его за несколько минут в конструкторе сайтов Тильда.
Как это работает?
1. Вводим тематику своего сайта. Например, сайт онлайн-школы, сайт репетитора. Для качественного результата докиньте деталей
2. Уточняем запрос. Например, цветовую палитру или цель создания страницы.
3. ИИ подбирает подходящие блоки, изображения и пишет тексты.
4. Готово! Сгенерированную страницу можно легко отредактировать. Ну или сразу публикуем. Адаптировать мобильную версию не нужно, это происходит автоматически.
Еще в Тильде ИИ может генерировать тексты для конкретных блоков. Например, расписать преимущества компании или описание услуг. Поможет отредактировать ваш текст: изменить формулировку, сделать его короче или, наоборот, длиннее.
Искусственным интеллектом можно пользоваться на бесплатном тарифе Тильды, что приятно.
Узнайте больше о возможностях ИИ и поробуйте в своем проекте 👉 https://tilda.link/1f01/?erid=2SDnjc8uDT2
#промо
Hi3DGen: High-fidelity 3D Geometry Generation from Images via Normal Bridging
Генератор 3D моделей по изображению через оценку нормалей
Файнтюн Trellis
Код ждем
Демо
#imageto3d #image2normal
Qwen2.5 Omni голос / видео
Мультимодальная обновка китайского ассистента. Теперь умеет общаться в голосовом режиме и в режиме видеочата
Поддерживает английский и китайский
Одновременно и думает и поддерживает разговор
7B параметров. Обещают выпустить и другие версии.
Попробовать
Гитхаб
HF
#assistant #voicemode #videochat
хаха купились? А вот он Бендер с совой
Маску я немного перерисовал, но голову точно не захватил. А тем не менее изменения и на голове есть. Да чего там голова, он еще и толще стал
Вывод: маска работает ненадежно
А #тестбендера на отлично
Udio Styles
Генератор музыки Udio представил функцию копирования стиля
#styletransfer #text2music #music2music #referencing #music
А мы-то поверили.
Оказывается, авторы 12% самых человечных ответов ChatGPT - подростки, работающие в нечеловеческих условиях на индийской ChatGPT-фабрике
В округе Лакшадвип расположены тысячи цехов, в каждом из которых живут и работают по 1200 подростков от 13 до 16 лет. Все чем они занимаются - отвечают на запросы пользователей под видом ChatGPT по 17 часов в сутки за зарплату 1$ в день.
Но это только при условии если работник не получил ни одного пальца вниз на свои ответы от пользователей ChatGPT. С пальцами вниз зарплата снижается
В сеть просочилось видео, снятое скрытой камерой
#news
Как с помощью нейросети собрать бесплатно 1000 подписчиков в свой телеграм канал? 🤷♀️
Нужны деньги на рекламу, а их нет, а клиенты новые нужны, что делать?
Где искать? Куда идти?
Уже сейчас ты можешь поменять ситуацию!
Подарок для тебя:
🎁 50 мест на бесплатный курс “Клиенты на Нейросетях”
Крутая возможность, за которую ты можешь ухватиться
👉 Забирай своё место здесь: /channel/+ye_XCh6hR7xhM2Yy
Что ты узнаешь на курсе:
• Как создавать Reels на 1 млн просмотров
• Как делать Reels не выходя из дома за 30 минут?
• Как набрать 1000 подписчиков в Телеграм бесплатно
• Как обойти запрет на рекламу Нельзяграм
• Как заработать первые 100 000 рублей на нейросетях
• Бонус: Фотосессия при помощи нейросети за 5 минут
🔥 Реальная стоимость курса — 25 000 рублей. Для тебя БЕСПЛАТНО!
⏳ Ссылка на 24 часа.
👉 Присоединяйся здесь:
/channel/+ye_XCh6hR7xhM2Yy
/channel/+ye_XCh6hR7xhM2Yy
/channel/+ye_XCh6hR7xhM2Yy
#промо
В чем отличие работ современных художников, выставляющихся в Москве, Пекине, Люксембурге и Анкаре?
Как новичок может постепенно превратиться в эксперта в цифровом искусстве?
Что интересного может рассказать о путешествиях, семейных приключениях, кино и многом другом бывший вице-президент российской корпорации, который переквалифицировался в арт-менеджера своей супруги?
Об этом и многом другом на канале Арт и Мир.
Подписывайтесь, здесь интересно!
Реклама Цырлин Станислав Эдуардович ИНН 772809382671
#промо
Runway Gen-4
Обновка видеогенератора
Создает картинки и видео по референсным изображениям и текстовым описаниям.
Обещает консистентность стилей, сюжетов, местоположений и прочего
Пробовать тут, доступ раскатывают постепенно
#text2video #image2video
GIMM-VFI: Generalizable Implicit Motion Modeling for Video Frame Interpolation
Интерполяция кадров, создает кадры между существующими
Код
#frameinterpolation #slowmotion
Не прошло и года с июля 2024
Опубликован код и веса (~8Гб) GenXD - генератора 3D и 4D (с движением) сцен по одному или нескольким ракурсам
Код
Веса
#videoto3d #videoto4d
CFG-Zero★: Improved Classifier-Free Guidance for Flow Matching Models
улучшенный метод генерации картинок и видео вместо обычного CFG, который направляет генерацию по неправильному пути.
Поддерживает wan2.1-14B генерацию видео по картинке, а также Flux, SD, Lumina
Уже есть в #ComfyUI нодах Kijai
Код
Демо
#text2image #image2image #image2video #text2video
VideoMind: A Chain-of-LoRA Agent for Long Video Reasoning
Пониматор видео, мультимодальный агентный фреймворк, который улучшает понимание видеое за счет имитации человекоподобных процессов, таких как разбиение задач, локализация и проверка моментов, а также синтез ответов. Этот подход решает уникальные проблемы, связанные с рассуждениями, основанными на времени
Код
Демо
HF
#vlm #reasoning
mirage-ghibli
Гиблификация быстрее и дешевле чем в ChatGPT
Лора Flux.dev
Должно работать прямо на HF но не работает
У авторов есть офсайт с анонсом ИИ-фоторамки с гиблификацией. Регаетесь в вейтлист, постите реферральную ссылку в свой канал и становитесь участником розыгрыша фоторамки стоимостью $160
#stylize #image2image #lora
DAI: Dereflection Any Image with Diffusion Priors and Diversified Data
Удаление отражений с изображений
В этой области помню только StableDelight
Код
Демо
Колаб
#reflectionremoval #image2image
Wan Video LoRAs
14 новых лор эффектов от Remade AI
#lora #image2video #wan
DiffPortrait360: Consistent Portrait Diffusion for 360 View Synthesis
Вид головы с любой стороны по одному входному портрету.
Код ждем
Демо ждем
#head #novelview
🔔Внимание!🔔
ИИ - это будущее, которое наступило сегодня
А что, если с помощью нейросетей зарабатывать 200 000₽ в месяц и более?!