Канал про нейросети в компьютерной графике, в кино и вообще Чат: https://t.me/+16lR_Zc8oVM2ZTky
Время мемов и рефлексии
#humor
Пересмотрел старый фильм, навеяло
#neuronaut_art #humor
igorkurenkov">MusicGPT
Еще один генератор-редактор музыки/песен/звука
Можно делать инструментал, можно с вокалом
Делает ремиксы, умеет преобразовывать звуки, в том числе изменять голос. Ах да, есть TTS, может создать речь из вашего текста
И какой позор что их презентационное видео в твиттере залито БЕЗ ЗВУКА!
Я вам сам потыкал в ТОП 50 с сайта, наслаждайтесь
На старте дают 500 кредитов - это примерно на 10 музыкальных треков. За приглашение друзей докидывают еще по 500 кредитов. Но коммерческое использование музыки все равно только на платном тарифе
#music #text2music #text2sound #music2music #tts #text2speech
Ахаха! Белая плесень
Ладно, сделал мне копеечный пластиковый сувенир вместо технологичного робота
Король умер, да здравствует король!
Протестировал новую версию китайского 3D-генератора Hunyuan 2.5.
Итак, лягушка. Первое, на что бросается в глаза — адаптивная детализация, полигонов больше там, где они действительно нужны. Сетка отлично следует за формой — это особенно заметно по сердцу и орнаменту. Впервые на моей памяти нейронка так хорошо построила рельеф. Модель получилась симметричной, без видимых артефактов вроде дыр и пересечений. Только на лапе почему-то появилась неуместная ямка.
Текстура выглядит хуже. Задняя часть представляет собой сплошной визуальный шум, и даже спереди на сердце видны артефакты.
У предыдущих поколений image-to-3D моделей ворон либо получался неровным, либо симметричным, но с раздвоенным клювом. Просто отзеркалить фигурку по вертикальной оси нельзя, однако Hunyuan 2.5 в основном справляется: укладка перьев симметричная, при этом голова выглядит вполне естественно. Впрочем, на затылке рельеф отсутствует, а на правой лапе обнаружился лишний палец. Текстуры тоже далеки от идеала и не передают особенностей оригинальной картинки.
Фигурка Ктулху также приятно удивляет детализацией и симметричностью. Сетка немного хаотичная, но органические формы переданы реалистично. Текстура покрыта шумными деталями, однако судя по бликам, roughness map удался неплохо.
Подведем итоги. Сравнение с предыдущей серией экспериментов (8 моделей, Tripo3d, TRELLIS) говорит само за себя. Прирост в качестве значительный. Лягушку и Ктулху можно спокойно печатать на 3D-принтере без постобработки. Такими темпами вскоре придется обновлять тест, добавляя сложные формы, например, скульптуры людей.
Сейчас этот генератор доступен онлайн по адресу 3d.hunyuan.tencent.com (осторожно, интерфейс на китайском) и позволяет создавать до 20 моделей в день. А еще есть надежда на релиз в open source. По крайней мере, версия 2.0 представлена в pinokio и запускается на достаточно широком наборе конфигураций железа.
#нейронки #imageto3d #DIY
CSM Chat to 3D
А помните такой 3D генератор CSM?
Они прикрутили работу с 3D в чате.
Люди уже встраивают в свои пайплайны
#chatto3d #textto3d #imageto3d
Немножко #news
Давно заходили на Civitai.com?
Куда-то исчезли все срамные картинки с главной страницы. По поиску срамные модели еще можно найти, но они исчезают одна за другой, фурри-фетишисты обеспокоены. Да и с онлайн тренировкой моделей стало сложнее.
Согласно мнению реддитора, CivitAI не виноват.
Проблема связана с Visa и ограничениями, которые она накладывает на компании, принимающие её карты. Visa требует от компаний, работающих с искусственным интеллектом, применять цензуру, иначе они не смогут обрабатывать платежи.
Есть ряд альтернатив, которые еще не настолько популярны чтобы ощутить давление Visa
Сохраняем, пользуемся:
Tensor.art - прямой конкурент
Huggingface.com - репозиторий ИИ-разработчиков, "магазин ИИ-приложений"
Prompthero.com - этот у меня работает только с вэпээн
Pixai.art - хвалят за скорость и удобство по сравнению с Civitai
Seaart.ai - еще один неплохой конкурент
thinkdiffusion.com - генерация ИИ-арта в браузере с контролнетами
#text2image #gallery #online #tools #nsfw
Skyreels 14B V2 720P
Веса модели видеогенератора появились на официальном HF
И уже квантизованные в репозитории Kijai
#image2video
Krea AI GPT-Image-1
GPT-Image-1 прикрутили в Krea AI. Куда конкретно - не понял, возможно, в чат
Они превратились в нехилый комбайн всего за год-полтора
#imageediting
Higgsfield Turbo
Новая модель у видеогенератора Higgsfield
В полтора раза быстрее, на 30% дешевле.
Добавили 7 новых стилей движения
#text2movie #script2movie #text2image #image2video #motioncontrol #cameracontrol
GPT-Image-1
Open AI открыли в API доступ к модели, которая так ловко работает с картинками в ChatGPT
Можно выбирать разрешение и качество.
Модель доступна только после верификации организации, привязанной к аккаунту. Верификация происходит через сторонний сервис whitepersona
Playground - попробовать
Руководство к API
#api #imageediting
#оффтоп
23 апреля 1982 года — день рождения компьютера ZX Spectrum
Деды, предадимся воспоминаниям. Кто во что играл? а может не играл а что-то другое делал?
Помню, Midnight resistance я собственноручно взломал на бесконечные жизни. Как же я был хорош, как же мощны были мои лапищи в 15 лет
А текстовые игрушки со своеобразным ИИ помните? Пишешь ей текстом что должен сделать персонаж, а она пишет что происходит
У кого настроение погрузиться, вот статья на хабре
#gaming #history
Мобильное приложение видеогенератора Vidu
Вы вообще генерируете видео на мобилах?
iOS
Android
#ios #android #mobile #text2image #image2image
Присоединяйтесь к IV
THE TRENDS!
⚡️ Главное событие индустрии высоких технологий, объединяющее 11000 участников.
1️⃣- Разнообразие Тем:
Свыше 10 технологических направлений;
2️⃣- 15 иностранных спикеров эксклюзивно в Москве;
3️⃣- 1700+ компаний-участников
Мощнейший Нетворкинг обеспечен;
4️⃣ - 1500+ Инфлюенсеров
И комьюнити из Web2 и Web3 мира.
———————————————
В ПРОГРАММЕ:
🟩 PRE-PARTY (27 мая)
(Для Business и VIP-билетов)
🟩 Сцена TRENDX:
Лучшие из лучших со всего 🌍;
🟩 Сцена LEVEL UP:
Живые лекции, кейсы, питчи стартапов;
🟩 Выставка 70+ стендов:
Продукты и решения на любой вкус;
🟩 VIP-пространство:
Лучший нетворкинг в РФ, VIP бар;
🟩 AFTERPARTY (29 мая)
(Для VIP билетов)
🔥 Скидка на билеты для моих подписчиков 20%
#промо
Починили
Nvidia выпустили хотфикс, 576.15
#news #gpu
CausVid: From Slow Bidirectional to Fast Autoregressive Video Diffusion Models
Это не просто быстрый видеогенератор, это видеогенератор в реальном времени от MIT и Adobe, основанный на WAN
9.4 кадра в секунду на одном GPU (вероятнее всего, речь о H100)
Обещают взять более качественный датасет и обучить модель с лучшим качеством
Код
#text2video #image2video #realtime
Seurat: From Moving Points to Depth
Еще один трекер точек/генератор глубины для видео. Глубину предсказывает по траекториям точек, не по картинке как обычно делают остальные модели
Код ждем
Демо ждем
#trtacking #video2depth
Lyria 2
Генератор музыки от Deepmind
Все серьезно и очень продуктово.
Детализация жанровых нюансов, генерация инструментальных партий по текстовым описаниям, расширение композиций, редактирование стиля. Можно менять темп, тональность или полностью переосмыслить трек
Записаться в вейтлист
————————
Lyria RealTime
А это тот же генератор в реальном времени, есть кнопка попробовать (не для россиян)
Ну что, суно/удио бояться, батя вышел на поляну.
#music #text2music #music2music
Hummingbird-0
Ну логично, видеоаватары уже есть, должно быть нетрудно адаптировать для липсинка.
Hummingbird-0 от Tavus делает реалистичную, сохраняющую индивидуальность синхронизацию губ из любого MP3 + MP4. Дообучение не требуется
Говорят, что SOTA (самая лучшая модель)
Попробовать
#lipsync
#shootout #comparison #imageto3d #textto3d
Читать полностью…Hunyuan3D 2.5
Новая версия 3D-генератора, 10B параметров.
Авториг, многоракурсная генерация 3D, PBR текстуры
Попробовать - можно войти по имейлу
#imageto3d #textto3d
Картинки, видео и языковые модели - большая тройка направлений, которыми интересуюсь я и мои подписчики (иначе зачем бы вы на меня подписывались)
Три научных статьи в этих областях с участием Артема - и все три получили награды, две CVPR25 и одна ICLR25
Вангую, Через пару месяцев, мы будем пробовать новые более быстрые, более умные, более точные нейросетки, основанные на этих статьях. Хотя одна из них с открытым кодом, и можно посмотреть уже сейчас.
1) Дистилляция (ускорение) диффузии (большинство генераторов картинок и все видеогенераторы работаю на диффузии) в 3-4 шага
2) Как запускать генерацию картинок и видео на 80%, 60% или даже 40% компьюта с минимальными потерями в качестве
3) Ускорили Llama-3.1 405B в 9 раз, практически без потерь в качестве
Простым языком из первых рук читайте у Артема. Накидайте там поздравлений или хотя бы огоньков команде, люди делают наше будущее
эйай ньюз - подписывайтесь!
В установщике нейросетей Pinokio уже доступны:
Кастомизатор картинок UNO
Голосовая модель DIA
Видеогенератор для бедных FramePack
И многие другие инструменты
За напоминание спасибо @Dmitriy_Ru6ts0v
#image2video #tts #personalization #referencing
Spline Hana
3D генератор/редактор Spline выкатил новый холст для интерактивного дизайна. Анимация, триггеры на события, совместная работа
Под капотом движок, мгновенно рендерящий векторные элементы
Там есть комьюнити и галерея где можно поковыряться в чужих проектах
Сервис платный но видимо есть какой-то бесплатный функционал
Попробовать
Туториалы
#gaussian #3d #realtime #interactive #design
ComfyUI GPT-Image-1
#ComfyUI поддерживает GPT-Image-1 через API Nodes в бета режиме
А также завезут в Adobe Firefly / Express, Figma, Heygen и другие сервисы
Интересно, чем Gemini Image Editing хуже, почему я о нем ничего не слышу? Он же должен быть уже прикручен в каждую кофеварку
#api #imageediting
В Китае сделали НЕЙРОСЕТЬ, которая будет есть, спать и ср#ть за вас
Вы тоже в шоке от того, как быстро развивается ИИ?
Пару лет назад мы представить не могли, что сейчас по одному клику сможем получить готовую курсовую или заполненный отчет.
Но знаете ли вы, что на самом деле в ИИ нет нифига сложного? Если нет — советуем канал ML прокачка.
Автор вскрывает подкапотную ChatGpt, DeepSeek и других известных нейронок и простым языком объясняет, как и почему они работают. Уверяем, поймут даже чайники.
Подпишитесь, авось и свой ИИ сделаете: @ml_prokachka
#промо
Suna
Опенсорсный универсальный агент от Kortix AI, выполняющий задания подобно человеку
Рассуждает, планирует, выполняет.
Умеет работать в браузере, с API, документами.
В бэкенд через LiteLLM подключаются Open AI, Anthropic и другие языковые модели
Код
Попробовать в облаке (10 минут в месяц бесплатно)
#agent
DRAGON: Distributional Rewards Optimize Diffusion Generative Models
Adobe придумали метод дообучения генеративных моделей с лучшим качеством, показывают на примере генерации музыки
Кода нет, это ж Adobe
#news #music #sound
Бесплатная генерация для всех!
Захожу на Wan, а там такое
Генерируйте, говорят, бесплатно, а то, мол, у нас мощности простаивают. Но только пока простаивают, в Relax Mode
#news #text2image #text2video #image2video
Uni3C: Unifying Precisely 3D-Enhanced Camera and Human Motion Controls for Video Generation
Генератор видео по одной картинке от Alibaba.
С контролем камеры и движения человеков. Утверждают что именно контроль камеры и движение человеков у них лучше всех
Код ждем
#image2video #cameracontrol #motioncontrol