Канал про нейросети в компьютерной графике, в кино и вообще Чат: https://t.me/+16lR_Zc8oVM2ZTky
Microsoft два месяца показывали рекламу, сделанную с применением ИИ, и никто не заметил подвоха (или всем пофиг)
Похоже, все кроме крупных планов девайсов было сгенерировано. Для этого понадобилось около тысячи запросов.
#news
Deep-Live-Cam
Однокликовая замена лица на видео в реальном времени.
Можно сохранить оригинальный рот, можно заменять одновременно несколько лиц.
Под капотом все те же Insightface / GPFGAN / inswapper_128 но почемуто хайпанула
Есть коммерческая версия
Код
HF репо
#faceswap #realtime
AI Runner
Локальная среда запуска нейросеток - языковых моделей, генератов текста, видео, речи.
Обещают легкую установку (Docker), свободу от зависимостей (со сладкого не слезу 🤩), систему плагинов и прочие плюшки вплоть до импорта в ваш питон-проект в виде библиотеки
#tools
За примерное поведение амнистирован
#humor
Как использовать ИИ в нашей работе и проектах. Рассказываю на своем недавнем примере и опыте за последние месяцы.
- Например делаете локацию, (я как раз делаю эпичную сцену для курса), нагенерили концепты в миджорни и чатгпт, выбрали понравившиеся, и нужно замоделить ассеты. Это уже вам экономит часы и дни поиска рефов и концептов для вдохновения.
- Вырезаете кусок с этим ассетом (пикча 1), кидаете в чатгпт, пишете чтоб сгенерил с других ракурсов и ближе и залетел внутрь (пикча 2) или сверху снизу сбоку и тд (пикча 3)
- Далее просите убрать фон, листья, состарить сильнее, грязи добавить и прочие плюшки. (пикча 4)
- После ахуевания от всего что вам выдал чат, берете это все и кидаете в magnific.ai который делает ебейший апскейл дорисовывая детали аж до 4-8к картинки ебанистического качества! (пикча 5)
- Смотрите на ахуевшие рефы в огромном разрешении и кайфуете как это все можно теперь неделями скульптить и моделить и текстурить.
- Но идем дальше, на сайте 3d.hunyuan.tencent.com генерим по этим картинкам вполне годные 3д модельки за минуту (пикча 6 и 7), и используем для драфт лэйяута сцены, собираете драфт сцену со всеми обьектами. Если все нравится, их же кидаем в збраш или номад на айпаде или блендер, я вообще в виаре в сабстенс моделлере по фану одну доделывал, и вобщем так допиливаешь детали, текстуришь в пэинтере смарт материалами так же довольно быстро запекая все АО и нормали и тд и готово!
Это именно тот правильный способ использования ИИ в наше время который ускорит вашу работу в сотни раз, в данном случае вы сокращаете себе поиск рефов, поиск текстур и концептов для вдохновения, ну и конечно же базовый меш получаете с пбр текстурами. И вместо нескольких дней поиска этого всего и создания мешей, а то и недель, делаете все за вечер. Единственный долгий этап из этих будет скульптить детали, но где то же нужно руками поработать, да и как по мне это приятный творческий этап!
Но вангую что через пару месяцев или к концу года ИИ будет моделить со всеми мелкими деталями что и моделить и скульптить не надо будет даже.
Вобщем ИИ пока боятся и отрицать точно не стоит, а скорее нужно его правильно использовать в нашем деле потому что конкуренция растет, уровень тоже и скорость создания проектов и чтобы не отставать и быть в строю или же вовсе вырваться вперед, стоит изучить все возможные способы и инструменты ускорения работы а не тупо застрять в одном софте потому что он типа кино стандарт и он охуенный. Клиентам похуй! Что в рекламе что в кино, всем нужно красиво и качественно!
Gen-4 References
Новая функция доступна в Runway платным подписанам.
Видео по референсу.
Консистентные персонажи, стиль, окружение.
#personalization #referencing #image2video #text2video
RealisDance: Equip controllable character animation with realistic hands
Оживлятор персонажей по образцу движения. Для богопротивных тиктоков должно подойти.
Но как же хорошо выглядят их видео, при том что файлам в репозитории уже по 5-7 месяцев. Я даже сомневаюсь что это мне показывают результаты, а не образцы движения
Умеет делать взаимодествие с предметами, стилизацию, необычные позы, сложные жесты и мультиперсонажку - есть примеры анимации двух персонажей
Позы и исходные картинки кодируются Wan-2.1 VAE
В коде ссылки на Open-Animate Anyone, Moore-Animate Anyone, MusePose.
Код
#image2video #humananimation #characteranimation #pose2video
F-Lite
Генератор картинок от Freepik
10B параметров
F Lite - базовая модель
F Lite-Texture - вариант F Lite, который создает лучшие текстуры и эстетику, но плохо работает с короткими промптами и менее эффективен для векторной графики (что?)
Гитхаб
Веса
Демо F Lite
Демо F Texture
ComfyUI
#text2image #ComfyUI #workflow
Сервис гугла NotebookLM для превращения любых источников в подкаст научился говорить по-русски (и еще на 50 языках)
Попробовать - притворитесь что вы не в России
#text2voice #pdf2voice #text2podcast
Perplexity атакует
Выкатили голосового ассистента на #iOS
Официальный бот в Whatsapp +1 (833) 436-3285
Бот в телеграм @askplexbot- не уверен что официальный
Прикрутили Grok 3, and o4-mini, GPT Image Generation - говорят что бесплатно и без ограничений ❗️
Perplexity предустанавливают на все новые смартфоны Motorola
#assistant #voicemode
Step1X-Edit: A Practical Framework for General Image Editing
Редактор картинок текстовыми указаниями от Stepfun AI
Для локального запуска официальной модели понадобится от 26Гб VRAM
для FP8 от 18Гб
HF
FP8
Гитхаб
#imageediting
PixVerse v4 / App 2.0
Видеогенератор PixVerse выпустил модель v4 и новую версию мобильного приложения с функциями Transition, AI Dance Templates, AI Style Live (Переход, Шаблоны танцев, ИИ-стиль)
На сайте сейчас ежедневно раздают по 60 кредитов за вход
iOS
Android
А также запустили конкурс короткометражек на Dzine (бывший Stylar) с призами
🥇$500 (2 победителя)
🥈$250 (2 победителя)
🥉$100 (2 победителя)
Для участия нужно
1) запостить видео на TikTok, Instagram, Twitter/X, Youtube, и т д с тегом #PixVerse #Dzine или #PixVerseDzine
2) заполнить форму
#mobile #ios #android #contest #text2video #video2video #stylize #motioncontrol #videoediting
Qwen 3
Alibaba выпустили две #MoE-модели (совет экспертов) и шесть Dense models (плотные модели), размером от 0.6B до 235B параметров.
Qwen3-30B-A3B, например, превосходит QwQ-32B, при количестве параметров в 10 раз меньше.
Все модели поддерживают два режима: с рассуждениями и без. Режим размышления активируется при обработке сложных задач
Поддерживает 119 языков, включая русский.
Попробовать
Гитхаб
HF
GGUF зоопарк
#assistant
В яндекс браузер прикрутили дубляж с сохранением голоса и интонаций говорящего. До сих пор все дублировалось одним механическим голосом
Пока еще работает не для всех видео, вот здесь например уже новый дубляж
#dubbing #speech2speech
3D inpainting
Для тех кто готов поколупаться с запуском ячеек в Google Colab
1. Запустите весь подготовительный код - каждая ячейка занимает около 10 минут и может завершиться сбоем во время выполнения, проследите чтобы каждая ячейка отработала.
2. Загрузите свой меш .ply и референсное изображение. Работает лучше всего, если изображение представляет собой измененный снимок экрана или визуализацию вашей модели. Тогда это с меньшей вероятностью приведет к появлению пробелов в модели.
3. Перемещайте и масштабируйте модель и область инпейнтинга.
реддит
#inpainting3d #colab #3dto3d
Phantom
Видео по референсу, ответ Bytedance (WAN) на Gen-4 References
Теперь эта функция в опенсорсе!
Веса fp16/fp32
Гитхаб
workflow
#personalization #referencing #image2video #text2video #workflow
A3D
Гибрид 3D-редактора с генератором картинок.
- контроль позы простыми болванками
- генерация 3D-модели с помощью Gen AI (Fal.ai )
- ИИ-рендер по глубине/цвету с помощью ComfyUI или Fal.ai
- драгэндроп персонажей (тестировалось с Mixamo characters)
#3dediting #contolnet #3dtoimage #rendering
Mago.Studio вышел в закрытую бету.
Напомню, это сервис стилизации видео.
В 2025, когда уже большинство сервисов умеют намного больше чем стилизовать видео
Но давайте дадим им шанс. У Mago есть онлайн интерфейс с какими-то настройками, контролнетами. И мне выдали 10К стартовых кредитов.
Если регистрировались в вейтлист, попробуйте зайти: https://app.mago.studio
Или
Записаться в бетатестеры
#video2video #styletransfer #stylization
Последние дни мало полезного постил, наказываю себя запретом на мемы
Читать полностью…Suno V4.5
Попробовавшие пищат от качества.
Вокал стал живым, от шёпота до громких эмоций, добавили новых жанров. Следование промпту.
Мелодии интереснее, а инструменты звучат как настоящие.
Продолжительность трека до 8 минут за одну генерацию.
Только для платных подписанов
Krea Enhancer
В Krea AI доступен апскейлер-улучшайзер от Topaz
работает с картинками и видео (если верить официальному твиттеру)
При выборе модели видны две модели от Topaz - Topaz и Topaz Generative
#enhance #upscale
HiDream-E1 bf16
workflow
#workflow #Comfyui #imageediting
HiDream-E1
Тренд продолжается.
Редактор картинок текстовыми указаниями на основе HiDream-I1
Демо
Попробовать на офсайте
#imageediting
VideoX-Fun
Метод, давший нам CogVideoX-Fun прикрутили к WAN2.1. Получился Wan2.1-Fun-V1.1 - Поддерживает модели 14B and 1.3B Control и Reference Image
По ссылке в заголовке пролистните вниз, там много примеров
Веса Wan2.1-Fun-V1.1
Демо
#image2video
✅ Сохраняйте мегашпаргалку с полезными нейросетями на все случаи жизни от Сергея Фролова.
Вот самое крутое:
🤩Claude 3.7 Sonnet — мастхев для программистов
🤩Skyreels AI — превращает любой текст в длинное видео
🤩Openrouter — доступ ко всем ИИ
🤩Suno AI — своя музыка с нейросетью
Подпишись и находи для себя мощные нейросети бесплатно: /channel/+_FmBdkr-XrxhZDVi
#промо
Krea Stage + GPT-4o
Говорят, GPT-4o в Krea AI помогает рендерить Stages с консистентными персонажами и окружением
#novelview #rendering #imageediting #personalization
FantasyTalking: Realistic Talking Portrait Generation via Coherent Motion Synthesis
Говорящий аватар / оживлятор портретов от Alibaba с контролем интенсивности движения. работает с разными крупностями кадра и позами, с разными типами персонажей
Сравнение с конкурентами впечатляет.
Построен на базе Wan2.1
Код
#portraitanimation #image2video #speech2video #humananimation #lipsync #talkinghead
Я наконец собрал свою работу за несколько лет. Нейросетки здесь не представлены.
Ищу работу/заказы
Если хотите сделать мне доброе дело, насыпьте комментов на ютубе, закиньте знакомым эйчарам.
За репост отдельная благодарность🤝
Enjoy!
#showreel
3DGUT: Enabling Distorted Cameras and Secondary Rays in Gaussian Splatting
Рендер сцен на гауссианах от Nvidia
В отличие от оригинального 3DGS, поддерживает фишай (очень широугольные обеъективы), корректно реконструирует сцены по видео, снятому с роллинг шаттером, позволяет воспроизводить оптические преломления и отражения
Код
#gaussian #video2scene #rendering #novelview #fisheye
MAGI-1 4.5B
На HF появились веса средней модели видеогенератора. Вероятно, запустится на КЕЧ 4090
#text2video #image2video