ai_sd | Unsorted

Telegram-канал ai_sd - Stable diffusion, ComfyUI, Flux

2688

Все вместе тут: обучающие ролики по Stable diffusion, ссылки на что полезное, генерации, промпты. Донат https://boosty.to/stable/donate

Subscribe to a channel

Stable diffusion, ComfyUI, Flux

Сгенерировал обои для рабочего стола Linux. Я видел похожие обои в Manjaro и они мне очень понравились. В комментариях к посту найдете архив, где все эти генерации в несжатом виде, можете перетащить одну из них в ComfyUI и вы получите все настройки.

Prompt: sea, lighthouse, autumn in close, mountains with snow picks in far, flat art, light vector

Читать полностью…

Stable diffusion, ComfyUI, Flux

https://youtu.be/F2tUaaSiU8g?si=NHZRTe9RARik5AN7
Блоггер живёт где-то за рубежом. Поэтому говорит с акцентом. А так как он иностранец, ему не нужны ваши копейки на бусти. Поэтому нету этого всего, что в последнее время у всех блоггеров: "Заплатите мне бабос, чтобы получить все схемы".

Читать полностью…

Stable diffusion, ComfyUI, Flux

Всем привет. Как вы, наверное, заметили, я стал реже постить. Связано это с тем, что мой компьютер с октября выдает синие экраны после 5 минут работы. Сейчас я ищу туториал как поставить ComfyUI на мак с api к black forest. Чтобы шла генерация за кредиты через их сайт. Если у кого есть ролик, как установить, киньте ссылку в коментариях.
А пока в качестве новости сообщаю, что есть сайт промптов к различным моделям. Из-за того, что я немного выпал, то узнал о нём только сейчас.
https://prompthero.com/flux-prompts

Читать полностью…

Stable diffusion, ComfyUI, Flux

https://youtu.be/v4Wr7_5spK0?si=NF7wFDTRLom2VmUi
Очередной продавец курсов и схем для ComfyUI. Ставлю его ролик в информационных целях.

Читать полностью…

Stable diffusion, ComfyUI, Flux

Буквально Тот-Кого-Не-Нельзя-Называть — в Твиттере заметили, что ChatGPT отказывается разговаривать о Дэвиде Майере.

Дэвид Майер де Ротшильд — британский эколог и глава благотворительных организаций. А еще наследник Ротшильдов, ага.

Заменив буквы «а» на «@» удалось уговорить ChatGPT хоть что-то рассказать — Дэвид входит в список политических и влиятельных фигур, о которых ИИ запрещено разговаривать.

Больше всего тут удивляет, что у ChatGPT есть такой список 💀

Читать полностью…

Stable diffusion, ComfyUI, Flux

https://pinokio.computer/
Для установки нейронок. Спасибо подписчику, благодаря которому я всё-таки поставил. Много слышал о нём, но игнорировал. Подписчик заметил, что там всё раньше появляется. Очень удобно, так как не требуются выполнять кучу шагов в терминале.

Читать полностью…

Stable diffusion, ComfyUI, Flux

🧑🏻‍🏫 Если нейронка может отличить картину-подделку от оригинала, водить машину и судить спортивные матчи, то почему бы ему и образованием двуногих не заняться? Рассказываем, как ИИ помогает нам стать умнее:

Duolingo и Coursera:
Вот так вот, зелёную сову никто не подозревал, но даже у неё клюв в пушку. Хоть в тёмных делах Дуо и не замешана высокоуровневая нейросеть, но сложность ваших уроков и скорость продвижения контролируется ИИ, который следит за вашими успехами. У Курсэры история похожая, но здесь алгоритм отвечает за персонализацию общего направления обучения и подборку курсов.

• ИИ-преподаватель Khanmigo:
У американского образовательного портала Khan Academy на вооружении тоже стоит собственная нейросеть, и, кстати, довольно универсальная. Работает сразу на две стороны: помогает преподавателям готовиться к занятиям, а обучающимся готов почти полностью заменить ментора по математике, программированию, гуманитарным наукам и многим другим предметам.

Socratic от Google:
Здесь всё уже гораздо серьёзнее: сервис Гугла похож на ГДЗ на стероидах — поможет вам не просто найти ответ на задание, а подробно объяснит теорию и ход решения. Фотографируем вопрос, нейронка выдаёт на гора ответ. И да, список предметов, в котором Сократик сечёт, очень широкий: от литературы до естественных наук.

• ИИ-преподаватель от Carnegie Learning:
Настолько могучий препод, что взял премию за прорыв в области искусственного интеллекта на рынке EdTech в 2024 году. Если коротко: этот препод по математике подстраивается под любой уровень знаний и любую скорость обучения. Своим студентам он даёт развёрнутую обратную связь, помогает развить сильные стороны и разобраться со слабыми.


Резюмируем: пока нейронки не заставляют перед чистовиком писать на черновик — мы ничего против них не имеем.

#ИИукралРаботу

Читать полностью…

Stable diffusion, ComfyUI, Flux

Стабили выпустило статью о том, как правильно писать промпт
https://stability.ai/learning-hub/stable-diffusion-3-5-prompt-guide?utm_medium=email&_hsenc=p2ANqtz--A0C0EPeK_YqE72Mk3xDVM9NWzEsTDyHvwk1Xu5Izbe_0TQsfzPCc__ltlrYgHWobHVZMzsM0NrDLBNv58g9_ermZfxw&_hsmi=98780518&utm_content=98780518&utm_source=hs_email

Читать полностью…

Stable diffusion, ComfyUI, Flux

Воркфлоу для Комфи, который показывает как делать инпэйнт во Флаксе. Для новичков объясню. При помощи inpaint вы можете дорисовать или поменять ненужные объекты в генерации. К примеру, вы сгенерировали животное, а у него 5 копыт, закрашиваете одно копыто и пишите в промпте, что должна быть трава. https://civitai.com/models/397069/flux-inpaint-and-outpaint-workflow

Читать полностью…

Stable diffusion, ComfyUI, Flux

Если будет скучно в Forge, загляните на вкладку Spaces. Впечатления, как будто открыл дверь в шкаф, а вместо одежды видишь поляну с двумя единорогами, Сказложопом и Наруто играющим в джуманджи с Морти Смитом. Простыми словами, здесь можно установить через Forge локально еще 9 нейронок и использовать в отдельных вкладке браузера🔥🔥🔥. Удобное и простое решение.
P.S. Для себя эту вкладку обнаружил недавно, пришлось обновить Forge, Она там давно?
#tips

Читать полностью…

Stable diffusion, ComfyUI, Flux

ComfyUI V1 Release

В течении 2 месяцев разрабы пыхтели что бы сделать наш всеми любимый комфи десктопным приложением. Теперь даже девственные умы далёкие от всяких технических приколдесов смогут прикоснутся к прекрасному!

Python и ComfyUI-Manager в комплекте, будут автоматические обновления, безопасный и подписанный код, так же теперь можно будет использовать вкладки для открытия нескольких workflows и перемещения между ними, настройка горячих клавиш, встроенный просмотр логов. При установке приложения можно будет подтянуть все модельки и настройки с своего старого комфи. Приложение будет на базе Electron и доступно на Windows / macOS / Linux.

Чё там по интерфейсу?:
1 - Верхняя панель меню: много чего засунули в верхнюю панель меню, и кудесники custom_nodes теперь могут легко прикреплять к ней пользовательские менюшки.
2 - Более легкий доступ к моделям и логам: Быстрый доступ к моделям, нодам, output файлам и логам - щелкнув правой кнопкой мыши по значку в трее.
3 - Библиотека моделей: Можно легко чекать все свои модели и перетаскивать их как Load Checkpoint прямо из библиотеки.
4 - Браузер Workflows: Можно сохранять cвои workflows в Браузере Workflows для быстрого доступа или экспортировать их в другой каталог.
5 - Автоматическая загрузка моделей: Комфи теперь позволит юзерам встраивать URL/ID моделей в workflows и автоматически загружать их. Например, если вы откроете какой нибудь workflows и у вас не будет моделей, комфи предложит вам загрузить отсутствующие модели, определенные в workflows.

Так то сей новый интерфейс уже доступен всем и его можно пощупать. Нужно лишь обновится, тыкнуть на шестерёнку напротив Queue size и включить "BETA Use new menu and workflow management."


Пока что ComfyUI V1 в закрытой бете, можно зарегистрироваться и попроситься в waitlist - обещают дать пощупать уже в ближайшие недели, ну а после они уже выпустят открытую бету и расчехляться исходным кодом.

Читать полностью…

Stable diffusion, ComfyUI, Flux

https://youtu.be/LcCicJh3ZlI?si=YcB5baFJHpFua5hX

Читать полностью…

Stable diffusion, ComfyUI, Flux

https://habr.com/ru/articles/852664/

Читать полностью…

Stable diffusion, ComfyUI, Flux

Checkpoint AGXL
Lora Space Marine

Некоторым понравился космодесантник от Flux, попытался сделать лору. Во время генерирования SDXL постоянно пытается снять с него шлем. Поэтому в негатив прописал face.

Prompt kosmodesantnik is standing on skateboard, military helmet with black visor, covered face, <lora:kosmo desantik:1.3>
Negative face

Читать полностью…

Stable diffusion, ComfyUI, Flux

Flux-dev

Prompt TGEO

Сиды у меня идут по возрастанию от 1 до 100, здесь выкладываю наиболее интересные. На понравившихся генерациях я обучаю лоры для SDXL.

Читать полностью…

Stable diffusion, ComfyUI, Flux

Всё ребята. Я в деле. Вчера потратил сутки на решение проблемы с ноутбуком. Проблема была в сломаных кодовых таблицах на жестком диске и повреждении системных файлов винды. Несмотря на исправление, синие экраны смерти окончательно добили Граб. Сутки я потратил на поиск идеального Линукса. Понравился Manjaro, но там пришлось много пакетов ставить, чтобы запустить Комфи. Я хотел, чтобы было очень просто, как на винде. И я такой вариант нашёл. Linux Mint просто идеален, я сейчас с него пишу. После установки, выбрал пропиетарные драйвера Nvidia, затем скачал pinokio, deb пакет, который встал без проблем. Затем просто выбрал Комфи и просто сел ждать, когда он поставит все зависимости. Два недостатка: Пинокио скачивает в конце модель flux, которая мне не подходит и у меня есть своя. Второй недостаток, виден на скрине. У Пинокио нет иконки, поэтому в панели задач он выглядит, как невидимая иконка. И надо знать куда нажимать. Хотя, если вы на работе, то это даже фича 😁. Что по скорости? Тоже самое, что и на винде. Но винда за год раздулась до неприличных размеров. Так что остаюсь на Минте.

Читать полностью…

Stable diffusion, ComfyUI, Flux

https://youtu.be/kY53tV2zc5Q?si=s6VZtlglTgdD6sZ1

Читать полностью…

Stable diffusion, ComfyUI, Flux

https://youtu.be/OyQcmzx6Vv8?si=hU00vpLghNTAEzNv

Читать полностью…

Stable diffusion, ComfyUI, Flux

https://youtu.be/3FGuJuhzfdM?si=gtAwcdRapkQpotD1

Читать полностью…

Stable diffusion, ComfyUI, Flux

https://youtu.be/2n5RnG4b_rY?si=3Jz2ET6abXrPI_cO

Читать полностью…

Stable diffusion, ComfyUI, Flux

Дайджест:

📹 ВИДЕО + АРТ 🎨

PostShot: появилась интеграция с UE 5.4 для редактирования в нём сплатов, исправили баги при тренировке сцен и импорте/экспорте файлов, и другие улучшения.

Runway: расширили генерацию видео до 20 сек. Плюс обновили API, добавив доступ к контролю камеры Turbo.

Neurogen: появилась оптимизированная версия дипфейкера DeepFaceLab, а также FaceFusion 3.1.

Recraft: обновили свой генератор картинок до V3 и вышли в топ text-2-image моделей, обогнав Flux, MJ, Ideogram, и всех остальных. Можно бесплатно опробовать у них на сайте. Также есть версия, которая затюнена выдавать SVG.

BFL: релизнули Flux 1.1 Pro Ulta для генерации изображений в 4MP и RAW версию с имитацией "обычных фото". Доступно только по API.

Bytedance: выпустили SeeEdit для стайлтрансфера картинки с высокой точностью.

Nvidia: дропнули Llama Mesh для генерации 3D мешей по текстовому описанию с помощью LLM, плюс чата и редактирования.

DimensionX: опенсорсное создание видео с контролем камеры на основе одного изображения. На данный момент движение есть влево и вверх. Работает в связке с CogVideoX.

MagicQuill: онлайн редактирование изображение рисованием и промтом. Напоминает Invoke.

PyramidFlow: ещё один открытый видеогенератор с поддержкой Img2Video. Теперь с кадрами на основе Flux. На выходе видео 768p длиной в 10 сек. Установка через Pinokio.

Bria: обновлённый удалятор фона RMBG-2. Хорошо работает со сложной композицией, есть пакетная обработка, и можно кормить картинки как с компа, так и по ссылкам. Установка через Pinokio.

InstantX: выкатили апскейлер изображений InstantIR. Есть восстановление с точным следованием рефу или по "своему видению" (creative restoration). Установка в Pinokio.

Также они опубликовали метод более точного следования промту в t2i без тренировки + ещё одна работа на эту тему (спс @JohnDoe171).

CogVideoX: выпустили версию v 1.5 своего генератора видео с 5B параметрами. Тесты.

Vidu: обновили видеогенератор до V 1.5. Подняли качество генераций, улучшили следование промту, добавили консистентную работу с персонажами.

Добавление текста на задний фон с его настройкой.

🎸 ЗВУК 🎸

DeepL: представили Voice режим для перевода голоса в текст для бизнес сегмента.

SI: выпустили Hertz-dev, генератор речи (TTS) работающий в audio-2-audio с маленькой задержкой. Может выдавать как слова за одно человека, так и за двоих.

Hallucinator: моделька на основе Hertz выше для продолжения слов в загруженном аудио семпле.

e2f5: появилась возможность делать генерацию речи на основе фантюнов e2f5 от других людей через выбор Custom модели для инференса. На русском не видно пока тюнов.

Веб-интерфейс для работы с разными опенсорсными TTS.

🤖 ЧАТЫ 🤖

Alibaba: рвёт и мечет и после своего опенсорсного кодера, выпустили Turbo — языковую модель (LLM) с контекстом 1 млн токенов. Можно скормить книг 10, или 150 часов транскрибации речи, или 30к строк кода. Демо. API дешевле GPT-4o-mini.

Llama 3.2-11B, умеющая из коробки чатиться по визуалу, вышла в тираж и доступна в Ollama через OpenWebUI. Нужно минимум 8ГБ VRAM.

Mistral: выпустили Pixtral Large, визуальную языковую модель (VLM) для чата по визуалу, которая на бенчах лучше других открытых и закрытых, но размером 124B и её не погонять дома в отличие от Ламы 3.2-11B. Онлайн демо.

MinerU: конвертер PDF файлов в текст с markdown форматированием или JSON.

Google: выкатили Gemini-Exp-1114 и он попал в топ лидерборда LLM. Можно погонять на арене.

OpenAI: дропнули приложение ChatGPT на Windows.

Anthropic: с помощью Computer Use можно дать Claude выполнять задания на компе через API. Плюс тулза от сообщества для этого на Win/Mac... Microsoft Recall ты ли это?

AnyChat: в онлайн чат, где есть последние модели Qwen, Claude итд, добавили DeepSeek v2.5. Некоторые можно потестить бесплатно.

Cinnamon: выпустили Kotaemon, фреймворк, который пользователи могут использовать для чата по докам, а разрабы как шаблон для RAG.

💬 Делайте выжимки из доков и чатьтесь по ним с помощью Claude

Читать полностью…

Stable diffusion, ComfyUI, Flux

Нашел призанятнейший сайтец, на котором можно создавать игры с помощью нейронки не написав самостоятельно вообще ни строчки кода. Просто выбираем шаблон и говорим нейронке, что мы хотим получить, а она поэтапно с этим помогает. Скрафтил это примерно за пару часов с нескольких попыток (нейронка порой люто тупит, хотя и понимает запросы на русском). Сайт позволяет генерировать ассеты графона прямо на нем, но я предпочел сгенерить их в другом месте и притащить туда уже готовые. Сгенерил всю графику, музыку и звуки.

Вашему вниманию представляю мини-игру Sailor Moon Pineapple Maze
Цель игры - заработать как можно очков. Очки зарабатываются при совершении шагов, сборе ананасов, убийстве монстров и прохождении уровня. Изначально дается 75 шагов. Битва с монстром отнимает шаги. Сбор ананасов добавляет. Убил всех монстров? Получи бонус! Собрал все ананасы? Еще бонус! Чтобы перейти на следующий уровень необходимо собрать все ананасы и пройти в дверь (и получить за это еще бонус естественно). А как далеко вы сможете зайти? делитесь скринами ваших результатов в комментариях! Также пробуйте тоже создавать свои игры и делитесь ссылками на них.

Управление мышь/стрелочки/wasd

Попробовать игру (а также опробовать сам сайт и сотворить свою) можно тут: https://play.rosebud.ai/games/5e96ef6c-6739-4676-84ba-86ab5df772ee

Читать полностью…

Stable diffusion, ComfyUI, Flux

Подборка бесплатных онлайн нейронок для работы с фото.

PuLID for FLUX. При помощи данного инструмента вы можете сгенерировать как нейросетевое фото, так и арт с вашим лицом или лицом любого человека. Работает на базе Flux, по этому качество генераций весьма достойное.
Попробовать PuLID for FLUX

Expression Editor. Позволяет менять выражение лица и мимику на фото. Также можно поменять положение головы, направление взгляда. Работает достаточно быстро, но из минусов - кропает картинку до квадрата.
Попробовать Expression Editor

IC-Light V2. Данный инструмент позволяет сделать релайт фотографии - поменять освещение в кадре. Важный момент - также меняется фон, а также нормально работает только с изображениями в портретной ориентации.
Попробовать IC-Light V2

Diffusers Image Outpaint. Позволяет дорисовать фон на изображении, тем самым расширяя его.
Попробовать Diffusers Image Outpaint

Neurogen - подпишись, тут рассказывают про нейросети

Читать полностью…

Stable diffusion, ComfyUI, Flux

SD 3.5 Medium вышла

https://huggingface.co/stabilityai/stable-diffusion-3.5-medium

И что тут можно сказать? я слегка так пощупал, ну.. и не сказать что бы в восторге, ну и не сказать что прям вот совсем говно.

Из того что я прощупал - в текст может, но иногда бывают проблемы даже при юзании Т5. (хотя может с сидом не повезло)
В целом если же на sd3.5 Turbo вполне можно обходится без Т5 и даже так она вполне сносно могёт в текст, то тут без Т5 прям порою грустно в целом.

Касаемо анатомии так же всё плохо как и на старших моделях, в обнажёнку - может, но ультра всрато, хотя это считайте не баг а фича. C- Cтабилити так сказать. Из хорошего что можно отметить, вполне сносно могёт в арт и подобное.

По скорости - ну для меня на моей 1660S тут всё грустно, но у вас бояр должно летать, в примере ВФ от стабилити они юзают 40 шагов, CFG 5.5, семплер dpmpp_2m и планировщик sgm_uniform, я же тестил в разрешении 768х1024, на 20 шагах, CFG 5.5, euler_a, sgm_uniform, и по времени эти 20 шагов у меня заняли 1 минуту и 40 секунд, SD 3.5 turbo при 4 шагах, euler, simple у меня генерится 30 секунд. (справедливости ради на тех же настройках что и турбо, Medium у меня отрабатывает за 9 секунд) поэтому когда зовезут оптимизашки всякие по типу хайпер лор и т.п, будет и на моей улице праздник, хотя а надо ли оно когда есть турбо?

P.S что бы щупать модельку в комфи, комфи нужно обновить, vae уже вшит в модельку

Читать полностью…

Stable diffusion, ComfyUI, Flux

Ну так это ведь стабилити, когда у них базовые модели выходили хорошие?

Стабилити ни разу не выпустили по настоящему хорошую модель, которую можно было бы прям брать и юзать, абсолютно все их модели - говно, и это незыблемый факт.

Базовая 1.5 - ужасна. Если бы не комьюнити, то врятли кто-либо юзал бы её сейчас.

2.0/2.1 базовые - тоже были плохи, а из-за того что ещё и сисечки вырезали, никому они были не нужны, комьюнити не подхватило, модели - умерли так и не родившись.

SDXL - базовая - мыльное мыло и без сисечек, опять же без комьюнити она может быть и не повторила бы судьбу 2.0/2.1, но все бы больше предпочли юзать допиленную 1.5, и юзали бы SDXL чисто для референсов

Посему когда стабилити что-то выпускает, на это всегда нужно смотреть как на говно, но с пометочкой что из этого люди могут сделать конфетку, как сделали с 1.5, Sdxl, Pony так вообще отдельный разговор, но вот с sd3 они прям вот жидко оподливилсь, т.е ладно бы если бы модель была просто говном, ничего нового, но она изначально вышла сломанной, её сломали ещё на этапе обучения, и никакими файнтюнами это было уже не исправить, ну а вот SD3.5 , как минимум не сломанная, и даже худо бедно я поглядел может в сисечки, конечно очень плохо, но даже это уже хорошо, есть за что зацепится при файнтюне, т.е в датасете как минимум была обнажёнка, и с этим можно уже работать

Читать полностью…

Stable diffusion, ComfyUI, Flux

https://youtu.be/DJ5OCYH7Lf4?si=CnLcguicpsJvDl3U

Читать полностью…

Stable diffusion, ComfyUI, Flux

Попробовал SD 3.5. Кратко - всё плохо.
Поподробней. Не знаю, что я делаю неправильно, но кажется еще хуже, чем в третьей версии. На больших разрешениях вообще все ломается. Там где Flux Schnell легко справляется, а именно прекрасно генерирует природу под формат рабочего стола, то sd 3.5 просто рассыпается в дребезги. В общем прикладываю генерации, сами судите.

Читать полностью…

Stable diffusion, ComfyUI, Flux

https://youtu.be/Si2ifZqiGLo?si=aCkX1hQ5f1QyOd2g

Читать полностью…

Stable diffusion, ComfyUI, Flux

Checkpoint AGXL
Lora Coatman

В предыдущем посте есть старый человек в меховом пальто. Я обучил лору для SDXL. Комбинируя промпт, я смог поменять цвет и текстуру пальто, а использовав плагин reactor наложил лицо известной фотомодели.

Prompt A female model stands, New York City street in background, wearing a long, thick white zebra fur coat that reaches their ankles, huge boobs under coat, leather (pants:1.1), black gloves, and brown lace-up boots, hinting at recent rain <lora:coatman:1>, cinematic light

Читать полностью…

Stable diffusion, ComfyUI, Flux

Flux-dev

Prompt Trinity

Генерирует в основном на религиозную тематику.

Читать полностью…
Subscribe to a channel