Все вместе тут: обучающие ролики по Stable diffusion, ссылки на что полезное, генерации, промпты. Донат https://boosty.to/stable/donate
Сгенерировал обои для рабочего стола Linux. Я видел похожие обои в Manjaro и они мне очень понравились. В комментариях к посту найдете архив, где все эти генерации в несжатом виде, можете перетащить одну из них в ComfyUI и вы получите все настройки.
Prompt: sea, lighthouse, autumn in close, mountains with snow picks in far, flat art, light vector
https://youtu.be/F2tUaaSiU8g?si=NHZRTe9RARik5AN7
Блоггер живёт где-то за рубежом. Поэтому говорит с акцентом. А так как он иностранец, ему не нужны ваши копейки на бусти. Поэтому нету этого всего, что в последнее время у всех блоггеров: "Заплатите мне бабос, чтобы получить все схемы".
Всем привет. Как вы, наверное, заметили, я стал реже постить. Связано это с тем, что мой компьютер с октября выдает синие экраны после 5 минут работы. Сейчас я ищу туториал как поставить ComfyUI на мак с api к black forest. Чтобы шла генерация за кредиты через их сайт. Если у кого есть ролик, как установить, киньте ссылку в коментариях.
А пока в качестве новости сообщаю, что есть сайт промптов к различным моделям. Из-за того, что я немного выпал, то узнал о нём только сейчас.
https://prompthero.com/flux-prompts
https://youtu.be/v4Wr7_5spK0?si=NF7wFDTRLom2VmUi
Очередной продавец курсов и схем для ComfyUI. Ставлю его ролик в информационных целях.
Буквально Тот-Кого-Не-Нельзя-Называть — в Твиттере заметили, что ChatGPT отказывается разговаривать о Дэвиде Майере.
Дэвид Майер де Ротшильд — британский эколог и глава благотворительных организаций. А еще наследник Ротшильдов, ага.
Заменив буквы «а» на «@» удалось уговорить ChatGPT хоть что-то рассказать — Дэвид входит в список политических и влиятельных фигур, о которых ИИ запрещено разговаривать.
Больше всего тут удивляет, что у ChatGPT есть такой список 💀
https://pinokio.computer/
Для установки нейронок. Спасибо подписчику, благодаря которому я всё-таки поставил. Много слышал о нём, но игнорировал. Подписчик заметил, что там всё раньше появляется. Очень удобно, так как не требуются выполнять кучу шагов в терминале.
🧑🏻🏫 Если нейронка может отличить картину-подделку от оригинала, водить машину и судить спортивные матчи, то почему бы ему и образованием двуногих не заняться? Рассказываем, как ИИ помогает нам стать умнее:
• Duolingo и Coursera:
Вот так вот, зелёную сову никто не подозревал, но даже у неё клюв в пушку. Хоть в тёмных делах Дуо и не замешана высокоуровневая нейросеть, но сложность ваших уроков и скорость продвижения контролируется ИИ, который следит за вашими успехами. У Курсэры история похожая, но здесь алгоритм отвечает за персонализацию общего направления обучения и подборку курсов.
• ИИ-преподаватель Khanmigo:
У американского образовательного портала Khan Academy на вооружении тоже стоит собственная нейросеть, и, кстати, довольно универсальная. Работает сразу на две стороны: помогает преподавателям готовиться к занятиям, а обучающимся готов почти полностью заменить ментора по математике, программированию, гуманитарным наукам и многим другим предметам.
• Socratic от Google:
Здесь всё уже гораздо серьёзнее: сервис Гугла похож на ГДЗ на стероидах — поможет вам не просто найти ответ на задание, а подробно объяснит теорию и ход решения. Фотографируем вопрос, нейронка выдаёт на гора ответ. И да, список предметов, в котором Сократик сечёт, очень широкий: от литературы до естественных наук.
• ИИ-преподаватель от Carnegie Learning:
Настолько могучий препод, что взял премию за прорыв в области искусственного интеллекта на рынке EdTech в 2024 году. Если коротко: этот препод по математике подстраивается под любой уровень знаний и любую скорость обучения. Своим студентам он даёт развёрнутую обратную связь, помогает развить сильные стороны и разобраться со слабыми.
Стабили выпустило статью о том, как правильно писать промпт
https://stability.ai/learning-hub/stable-diffusion-3-5-prompt-guide?utm_medium=email&_hsenc=p2ANqtz--A0C0EPeK_YqE72Mk3xDVM9NWzEsTDyHvwk1Xu5Izbe_0TQsfzPCc__ltlrYgHWobHVZMzsM0NrDLBNv58g9_ermZfxw&_hsmi=98780518&utm_content=98780518&utm_source=hs_email
Воркфлоу для Комфи, который показывает как делать инпэйнт во Флаксе. Для новичков объясню. При помощи inpaint вы можете дорисовать или поменять ненужные объекты в генерации. К примеру, вы сгенерировали животное, а у него 5 копыт, закрашиваете одно копыто и пишите в промпте, что должна быть трава. https://civitai.com/models/397069/flux-inpaint-and-outpaint-workflow
Читать полностью…Если будет скучно в Forge, загляните на вкладку Spaces. Впечатления, как будто открыл дверь в шкаф, а вместо одежды видишь поляну с двумя единорогами, Сказложопом и Наруто играющим в джуманджи с Морти Смитом. Простыми словами, здесь можно установить через Forge локально еще 9 нейронок и использовать в отдельных вкладке браузера🔥🔥🔥. Удобное и простое решение.
P.S. Для себя эту вкладку обнаружил недавно, пришлось обновить Forge, Она там давно?
#tips
ComfyUI V1 Release
В течении 2 месяцев разрабы пыхтели что бы сделать наш всеми любимый комфи десктопным приложением. Теперь даже девственные умы далёкие от всяких технических приколдесов смогут прикоснутся к прекрасному!
Python и ComfyUI-Manager в комплекте, будут автоматические обновления, безопасный и подписанный код, так же теперь можно будет использовать вкладки для открытия нескольких workflows и перемещения между ними, настройка горячих клавиш, встроенный просмотр логов. При установке приложения можно будет подтянуть все модельки и настройки с своего старого комфи. Приложение будет на базе Electron и доступно на Windows / macOS / Linux.
Чё там по интерфейсу?:
1 - Верхняя панель меню: много чего засунули в верхнюю панель меню, и кудесники custom_nodes теперь могут легко прикреплять к ней пользовательские менюшки.
2 - Более легкий доступ к моделям и логам: Быстрый доступ к моделям, нодам, output файлам и логам - щелкнув правой кнопкой мыши по значку в трее.
3 - Библиотека моделей: Можно легко чекать все свои модели и перетаскивать их как Load Checkpoint прямо из библиотеки.
4 - Браузер Workflows: Можно сохранять cвои workflows в Браузере Workflows для быстрого доступа или экспортировать их в другой каталог.
5 - Автоматическая загрузка моделей: Комфи теперь позволит юзерам встраивать URL/ID моделей в workflows и автоматически загружать их. Например, если вы откроете какой нибудь workflows и у вас не будет моделей, комфи предложит вам загрузить отсутствующие модели, определенные в workflows.
Так то сей новый интерфейс уже доступен всем и его можно пощупать. Нужно лишь обновится, тыкнуть на шестерёнку напротив Queue size и включить "BETA Use new menu and workflow management."
https://youtu.be/LcCicJh3ZlI?si=YcB5baFJHpFua5hX
Читать полностью…https://habr.com/ru/articles/852664/
Читать полностью…Checkpoint AGXL
Lora Space Marine
Некоторым понравился космодесантник от Flux, попытался сделать лору. Во время генерирования SDXL постоянно пытается снять с него шлем. Поэтому в негатив прописал face.
Prompt kosmodesantnik is standing on skateboard, military helmet with black visor, covered face, <lora:kosmo desantik:1.3>
Negative face
Flux-dev
Prompt TGEO
Сиды у меня идут по возрастанию от 1 до 100, здесь выкладываю наиболее интересные. На понравившихся генерациях я обучаю лоры для SDXL.
Всё ребята. Я в деле. Вчера потратил сутки на решение проблемы с ноутбуком. Проблема была в сломаных кодовых таблицах на жестком диске и повреждении системных файлов винды. Несмотря на исправление, синие экраны смерти окончательно добили Граб. Сутки я потратил на поиск идеального Линукса. Понравился Manjaro, но там пришлось много пакетов ставить, чтобы запустить Комфи. Я хотел, чтобы было очень просто, как на винде. И я такой вариант нашёл. Linux Mint просто идеален, я сейчас с него пишу. После установки, выбрал пропиетарные драйвера Nvidia, затем скачал pinokio, deb пакет, который встал без проблем. Затем просто выбрал Комфи и просто сел ждать, когда он поставит все зависимости. Два недостатка: Пинокио скачивает в конце модель flux, которая мне не подходит и у меня есть своя. Второй недостаток, виден на скрине. У Пинокио нет иконки, поэтому в панели задач он выглядит, как невидимая иконка. И надо знать куда нажимать. Хотя, если вы на работе, то это даже фича 😁. Что по скорости? Тоже самое, что и на винде. Но винда за год раздулась до неприличных размеров. Так что остаюсь на Минте.
Читать полностью…https://youtu.be/kY53tV2zc5Q?si=s6VZtlglTgdD6sZ1
Читать полностью…https://youtu.be/OyQcmzx6Vv8?si=hU00vpLghNTAEzNv
Читать полностью…https://youtu.be/3FGuJuhzfdM?si=gtAwcdRapkQpotD1
Читать полностью…https://youtu.be/2n5RnG4b_rY?si=3Jz2ET6abXrPI_cO
Читать полностью…Дайджест:
📹 ВИДЕО + АРТ 🎨
PostShot: появилась интеграция с UE 5.4 для редактирования в нём сплатов, исправили баги при тренировке сцен и импорте/экспорте файлов, и другие улучшения.
Runway: расширили генерацию видео до 20 сек. Плюс обновили API, добавив доступ к контролю камеры Turbo.
Neurogen: появилась оптимизированная версия дипфейкера DeepFaceLab, а также FaceFusion 3.1.
Recraft: обновили свой генератор картинок до V3 и вышли в топ text-2-image моделей, обогнав Flux, MJ, Ideogram, и всех остальных. Можно бесплатно опробовать у них на сайте. Также есть версия, которая затюнена выдавать SVG.
BFL: релизнули Flux 1.1 Pro Ulta для генерации изображений в 4MP и RAW версию с имитацией "обычных фото". Доступно только по API.
Bytedance: выпустили SeeEdit для стайлтрансфера картинки с высокой точностью.
Nvidia: дропнули Llama Mesh для генерации 3D мешей по текстовому описанию с помощью LLM, плюс чата и редактирования.
DimensionX: опенсорсное создание видео с контролем камеры на основе одного изображения. На данный момент движение есть влево и вверх. Работает в связке с CogVideoX.
MagicQuill: онлайн редактирование изображение рисованием и промтом. Напоминает Invoke.
PyramidFlow: ещё один открытый видеогенератор с поддержкой Img2Video. Теперь с кадрами на основе Flux. На выходе видео 768p длиной в 10 сек. Установка через Pinokio.
Bria: обновлённый удалятор фона RMBG-2. Хорошо работает со сложной композицией, есть пакетная обработка, и можно кормить картинки как с компа, так и по ссылкам. Установка через Pinokio.
InstantX: выкатили апскейлер изображений InstantIR. Есть восстановление с точным следованием рефу или по "своему видению" (creative restoration). Установка в Pinokio.
Также они опубликовали метод более точного следования промту в t2i без тренировки + ещё одна работа на эту тему (спс @JohnDoe171).
CogVideoX: выпустили версию v 1.5 своего генератора видео с 5B параметрами. Тесты.
Vidu: обновили видеогенератор до V 1.5. Подняли качество генераций, улучшили следование промту, добавили консистентную работу с персонажами.
Добавление текста на задний фон с его настройкой.
🎸 ЗВУК 🎸
DeepL: представили Voice режим для перевода голоса в текст для бизнес сегмента.
SI: выпустили Hertz-dev, генератор речи (TTS) работающий в audio-2-audio с маленькой задержкой. Может выдавать как слова за одно человека, так и за двоих.
Hallucinator: моделька на основе Hertz выше для продолжения слов в загруженном аудио семпле.
e2f5: появилась возможность делать генерацию речи на основе фантюнов e2f5 от других людей через выбор Custom модели для инференса. На русском не видно пока тюнов.
Веб-интерфейс для работы с разными опенсорсными TTS.
🤖 ЧАТЫ 🤖
Alibaba: рвёт и мечет и после своего опенсорсного кодера, выпустили Turbo — языковую модель (LLM) с контекстом 1 млн токенов. Можно скормить книг 10, или 150 часов транскрибации речи, или 30к строк кода. Демо. API дешевле GPT-4o-mini.
Llama 3.2-11B, умеющая из коробки чатиться по визуалу, вышла в тираж и доступна в Ollama через OpenWebUI. Нужно минимум 8ГБ VRAM.
Mistral: выпустили Pixtral Large, визуальную языковую модель (VLM) для чата по визуалу, которая на бенчах лучше других открытых и закрытых, но размером 124B и её не погонять дома в отличие от Ламы 3.2-11B. Онлайн демо.
MinerU: конвертер PDF файлов в текст с markdown форматированием или JSON.
Google: выкатили Gemini-Exp-1114 и он попал в топ лидерборда LLM. Можно погонять на арене.
OpenAI: дропнули приложение ChatGPT на Windows.
Anthropic: с помощью Computer Use можно дать Claude выполнять задания на компе через API. Плюс тулза от сообщества для этого на Win/Mac... Microsoft Recall ты ли это?
AnyChat: в онлайн чат, где есть последние модели Qwen, Claude итд, добавили DeepSeek v2.5. Некоторые можно потестить бесплатно.
Cinnamon: выпустили Kotaemon, фреймворк, который пользователи могут использовать для чата по докам, а разрабы как шаблон для RAG.
💬 Делайте выжимки из доков и чатьтесь по ним с помощью Claude
Нашел призанятнейший сайтец, на котором можно создавать игры с помощью нейронки не написав самостоятельно вообще ни строчки кода. Просто выбираем шаблон и говорим нейронке, что мы хотим получить, а она поэтапно с этим помогает. Скрафтил это примерно за пару часов с нескольких попыток (нейронка порой люто тупит, хотя и понимает запросы на русском). Сайт позволяет генерировать ассеты графона прямо на нем, но я предпочел сгенерить их в другом месте и притащить туда уже готовые. Сгенерил всю графику, музыку и звуки.
Вашему вниманию представляю мини-игру Sailor Moon Pineapple Maze
Цель игры - заработать как можно очков. Очки зарабатываются при совершении шагов, сборе ананасов, убийстве монстров и прохождении уровня. Изначально дается 75 шагов. Битва с монстром отнимает шаги. Сбор ананасов добавляет. Убил всех монстров? Получи бонус! Собрал все ананасы? Еще бонус! Чтобы перейти на следующий уровень необходимо собрать все ананасы и пройти в дверь (и получить за это еще бонус естественно). А как далеко вы сможете зайти? делитесь скринами ваших результатов в комментариях! Также пробуйте тоже создавать свои игры и делитесь ссылками на них.
Управление мышь/стрелочки/wasd
Попробовать игру (а также опробовать сам сайт и сотворить свою) можно тут: https://play.rosebud.ai/games/5e96ef6c-6739-4676-84ba-86ab5df772ee
Подборка бесплатных онлайн нейронок для работы с фото.
PuLID for FLUX. При помощи данного инструмента вы можете сгенерировать как нейросетевое фото, так и арт с вашим лицом или лицом любого человека. Работает на базе Flux, по этому качество генераций весьма достойное.
Попробовать PuLID for FLUX
Expression Editor. Позволяет менять выражение лица и мимику на фото. Также можно поменять положение головы, направление взгляда. Работает достаточно быстро, но из минусов - кропает картинку до квадрата.
Попробовать Expression Editor
IC-Light V2. Данный инструмент позволяет сделать релайт фотографии - поменять освещение в кадре. Важный момент - также меняется фон, а также нормально работает только с изображениями в портретной ориентации.
Попробовать IC-Light V2
Diffusers Image Outpaint. Позволяет дорисовать фон на изображении, тем самым расширяя его.
Попробовать Diffusers Image Outpaint
Neurogen - подпишись, тут рассказывают про нейросети
SD 3.5 Medium вышла
https://huggingface.co/stabilityai/stable-diffusion-3.5-medium
И что тут можно сказать? я слегка так пощупал, ну.. и не сказать что бы в восторге, ну и не сказать что прям вот совсем говно.
Из того что я прощупал - в текст может, но иногда бывают проблемы даже при юзании Т5. (хотя может с сидом не повезло)
В целом если же на sd3.5 Turbo вполне можно обходится без Т5 и даже так она вполне сносно могёт в текст, то тут без Т5 прям порою грустно в целом.
Касаемо анатомии так же всё плохо как и на старших моделях, в обнажёнку - может, но ультра всрато, хотя это считайте не баг а фича. C- Cтабилити так сказать. Из хорошего что можно отметить, вполне сносно могёт в арт и подобное.
По скорости - ну для меня на моей 1660S тут всё грустно, но у вас бояр должно летать, в примере ВФ от стабилити они юзают 40 шагов, CFG 5.5, семплер dpmpp_2m и планировщик sgm_uniform, я же тестил в разрешении 768х1024, на 20 шагах, CFG 5.5, euler_a, sgm_uniform, и по времени эти 20 шагов у меня заняли 1 минуту и 40 секунд, SD 3.5 turbo при 4 шагах, euler, simple у меня генерится 30 секунд. (справедливости ради на тех же настройках что и турбо, Medium у меня отрабатывает за 9 секунд) поэтому когда зовезут оптимизашки всякие по типу хайпер лор и т.п, будет и на моей улице праздник, хотя а надо ли оно когда есть турбо?
P.S что бы щупать модельку в комфи, комфи нужно обновить, vae уже вшит в модельку
Ну так это ведь стабилити, когда у них базовые модели выходили хорошие?
Стабилити ни разу не выпустили по настоящему хорошую модель, которую можно было бы прям брать и юзать, абсолютно все их модели - говно, и это незыблемый факт.
Базовая 1.5 - ужасна. Если бы не комьюнити, то врятли кто-либо юзал бы её сейчас.
2.0/2.1 базовые - тоже были плохи, а из-за того что ещё и сисечки вырезали, никому они были не нужны, комьюнити не подхватило, модели - умерли так и не родившись.
SDXL - базовая - мыльное мыло и без сисечек, опять же без комьюнити она может быть и не повторила бы судьбу 2.0/2.1, но все бы больше предпочли юзать допиленную 1.5, и юзали бы SDXL чисто для референсов
Посему когда стабилити что-то выпускает, на это всегда нужно смотреть как на говно, но с пометочкой что из этого люди могут сделать конфетку, как сделали с 1.5, Sdxl, Pony так вообще отдельный разговор, но вот с sd3 они прям вот жидко оподливилсь, т.е ладно бы если бы модель была просто говном, ничего нового, но она изначально вышла сломанной, её сломали ещё на этапе обучения, и никакими файнтюнами это было уже не исправить, ну а вот SD3.5 , как минимум не сломанная, и даже худо бедно я поглядел может в сисечки, конечно очень плохо, но даже это уже хорошо, есть за что зацепится при файнтюне, т.е в датасете как минимум была обнажёнка, и с этим можно уже работать
https://youtu.be/DJ5OCYH7Lf4?si=CnLcguicpsJvDl3U
Читать полностью…Попробовал SD 3.5. Кратко - всё плохо.
Поподробней. Не знаю, что я делаю неправильно, но кажется еще хуже, чем в третьей версии. На больших разрешениях вообще все ломается. Там где Flux Schnell легко справляется, а именно прекрасно генерирует природу под формат рабочего стола, то sd 3.5 просто рассыпается в дребезги. В общем прикладываю генерации, сами судите.
https://youtu.be/Si2ifZqiGLo?si=aCkX1hQ5f1QyOd2g
Читать полностью…Checkpoint AGXL
Lora Coatman
В предыдущем посте есть старый человек в меховом пальто. Я обучил лору для SDXL. Комбинируя промпт, я смог поменять цвет и текстуру пальто, а использовав плагин reactor наложил лицо известной фотомодели.
Prompt A female model stands, New York City street in background, wearing a long, thick white zebra fur coat that reaches their ankles, huge boobs under coat, leather (pants:1.1), black gloves, and brown lace-up boots, hinting at recent rain <lora:coatman:1>, cinematic light
Flux-dev
Prompt Trinity
Генерирует в основном на религиозную тематику.