ainetsd | Unsorted

Telegram-канал ainetsd - AINetSD

812

Чат - @AINetSD_Group Бот - @AINetSD_bot

Subscribe to a channel

AINetSD

Там в рефьюжене снова дали выбор моделек на бесплатном тарифе, вернули FUZZ-0.8.
И походу заменили 1.0-мини на просто 1.0, я пощупал и мне понравилось, + возможно подкрутили силу лирики для славянских языков(по крайне мере после чуть более 10 круток, с серьёзной проблемой по части произношения я столкнулся только раз и то на специфическом промте (3 трек) и то возможно по тому что там обрезало лирику так как не влезло)

Прогнал говновозов там, и в целом остался доволен.

*ну и не нужон нам этот ваш суно v4.5 платный.*

Читать полностью…

AINetSD

Riffusion вышли из беты

Riffusion вышли из беты, выкатив модельку FUZZ-1.0 Pro, ну и запросив денюжку естественно.
Для холопов они выкатили FUZZ-1.0 Mini, говорят что даже 1.0 mini лучше чем их прошлые модели

Я пощупал 1.0 Mini, ну по жанрам пока не особо понятно, нужно прощупывать, но сразу заметно - в русский стало чуть хуже местами.
Ещё из неприятного - Advanced рульками на бесплатном плане рулить нельзя, свои треки грузить - нельзя, в wav скачать - нельзя, Касаемо прав на музыку, то на бесплатном тарифе - у вас их нет.
Можно юзать лишь вайбы из уже сгененированных треков(свои аудио так же грузить нельзя) и ремиксы.

Чё там по тарифным планам в общем?:
"Free" - FUZZ-1.0 Mini / пару быстрых генераций в день, после в релакс режиме без лимитов / некоммерческое использование / вайбы, ремиксы.

"Starter - 6 долларов в месяц (пока акция, далее будет 8 долларов)" - FUZZ 1.0 Pro / 10 часов быстрых генераций в месяц(600 песенок где-то), после в релакс режиме без лимитов / Права на коммерческое использование / Advanced рульки / пректы / загрузка аудио / скачивание в wav и stem / генерация по промту или загрузка своих обложек

"Member - 36 долларов в месяц (пока акция, далее будет 48 долларов)" - Всё что в Starter / 70 часов быстрых генераций(4200 песенок где-то) / значок в профиле(аля что зажиточный боярин) / Управление доступом к ремиксам / Канал Discord для участников / Ранний доступ к новым функциям / Доступ к мероприятиям участников и подаркам

ну и ещё "Программа стипендий" для студентоты, художников, и сообществ, что позволит залутать подписку "Member". как получить -пока хз, считается ли профиль на цивите с непотребными пикчами - что ты художник? пока не понятно.

Читать полностью…

AINetSD

ОБНОВЛЕНИЕ.

[Файлы Neurogen] 32. FramePack - /framepack

FramePack Portable by Neurogen

FramePack — это новая прорывная технология для создания видео. Её главная особенность — умное использование информации о кадрах, что позволяет создавать длинные видео даже на слабых компьютерах.

- Поддержка генерации по первому и последнему кадру
- Поддержка установки промпта по временным промежуткам, например:[0s-2s: Person waves] [2s-4s: Person jumps]
- Cuda 12.8, с поддержкой SageAttention 2, FlashAttention 2 и xformers

Доступно в @AINetSD_bot

Читать полностью…

AINetSD

Новый генератор песенок mureka

Ну на деле не такой уж и новый, я слышал о нём ещё в прошлом году, но тогда на русском оно петь не умело и следовательно было не достойно прощупывания, а щас с новой моделькой научилось, ну и я пощупал, и.. мягко скажем не в восторге.

Хотя... как пощупал - дали всего лишь 2 жалких кредита - а это одна крутка, хз как тут и судить, разово ли это, или обновляемо? хз.
Как зашёл на сайт - уже было на балансе 2 кредита, думал что можно генерить без регистрации, вбил лирику, тыкнул жанр и голос даже выбрал из их галереи(женский - "Elara"), тыкнул на создать - перекинула на страничку регистрации - ну пришлось регистрироваться, и потом эти 2 песни сгенерились и 2 кредита списались.

Как я понял действует не отключаемый энхансер(хотя скорее изменятор) промта, и мой промт "Russian Blatnaya pesnya" превратился в "мировая музыка Инди-музыка | романтичный расслабленный Причудливая" для первого трека, и "Экспериментальная музыка мировая музыка | Причудливая расслабленный романтичный" для второго трека (что уже стало первым звоночком). а так же почему то я получил мужской вокал, когда заказывал томную девицу Элару.
Вокал? ну такое себе.. такое ощущение что генерится он построчно, а не целостно для всего трека, и это прям заметно и не особо приятно.
Касаемо инструментала - ну по одной крутке судить сложно, но не понравилось, может из-за того в какое непонятное нечто оно превратило мой промт, в общем не в восторге.

Можно задать референс и голос как из их библиотеки так и загрузить свой образец как аудиофайлом, так и даже ссылкой с ютуба (Доступно лишь с Pro плана) и ещё "идея мелодии" набубнеть типо начало трека (это тоже только для бояр с Pro планом)

Есть модели - Mureka V5.5 (нет поддержки русского) Mureka V6 (которуя я щупал и тут есть поддержка русского. 2 кредита = 1 крутка. Трек до 4.5 минут) и Mureka O1(обещают прям студийное качество как музыки так и вокала. 1 крутка стоит 10 кредитов) и ещё есть возможность создать персонализированную модель под свои хотелки (нужно 100-200 песенок для датасета, и за 2 часа будет готово, цена такого удовольствия - 99$) так же можно будет это тянуть по API и встраивать в свои проекты.

Ну вроде бы написал всё чё можно было написать по тех части, ну а теперь буду негодовать.
Ультра жадная до шекелей конторка, фу такими быть, базовые вещи которые везде бесплатны - тут платны.
Редактирование участка, расширение, скачать видео, скачать минус и стемы - только для бояр с Pro планом.
Скачать лицензию (что бы это не значило) только на базовом плане(не бесплатном) ну и самое мерзопакостное - скачать трек от туда тоже лишь на базовом плане можно, ну это вообще ни в какие ворота, тот же каловый loudly хотя бы давал скачать одну 30 секундную песенку в день бесплатно, с чего меня тогда подгорело, а тут вообще какая-то неслыханная наглость. и всё это с сомнительным качеством вокала и инструментала...

Я по началу грешным делом думал инвайт в качестве ссылки скинуть, аля там есть тема - что за каждого приведённого человека что перейдёт по инвайту - дадут 2 кредита( даже тут ультра зажопили) и типо вы бы перешли, и я залутал бы по 2 кредита с человека - и мог бы более обширнее это прощупать, но после того как я чекнул что там даже скачать трек бесплатно нельзя - чёт мне уже не хочется прощупывать это безобразие

Ну я то конечно не лаптем щи хлебаю - запишу звук с системы и оба трека умыкну что бы сюда скинуть, ну это конечно мрак, грязь, страх и ничего человеческого, сильно уж поверили они в себя, сами о себе заявляют что они лучше suno...
тьфу на них - срамота!

https://www.mureka.ai

Читать полностью…

AINetSD

Пощупал gemma-3-4b-it Q8_0

Так же помимо 4B есть версии 1B, 12B и 27B, и у всех версий кроме 1B заявлена поддержка картинок, но квант выше не распознан LM студией как visual модель (поддержка архитектуры gemma3 добавлена с 0.3.13 версии)

Щупается приятно, в русский могёт хорошо, но не так хорошо как ожидалось.
Редко но иногда могут быть проблемы с построением предложений на русском, что конечно не критично, но бросается в глаза.
Один раз за всё время щупанья на моём системном промте - заметил одно английское слово в ответе на русском, врятли дело в промте.
ну 4B есть 4B, надо бы пощупать другие кванты 4B, может проблема в этом кванте

Цензура есть, но легко обузится системным промтом
В общем ждём abliterated версии и файнтюны

Читать полностью…

AINetSD

И кстати, помимо всего прочего, можно и просто генерить картиночки

Чем детальнее промт - тем лучше.
разрешение - рандом

Читать полностью…

AINetSD

Потестил saiga_yandexgpt_8b Q4_K_S

Системному промту следует. (первые 3 пикчи без системного промта, последняя пикча с системным промтом)
Проблем как с вихрем не обнаружено.
Цензуры нет даже на пустом системном промте.
Писала бы ещё стихи...

Так что щупаем, и радуемся.
Единственное - касаемо лицензии всё грустно.

Читать полностью…

AINetSD

Продолжаю совершенстовать свою ноду с манипуляциями с шумом.
В общем вдохнул вторую жизнь в свою божественную полторашку 4 версии.
Как говорится - голь на выдумки хитра, за невозможностью щупать флюксы всякие новомодные, приходится извращатся.

Обновил в общем свою ноду - https://github.com/Northerner1/ComfyUI_North_Noise
Можете щупать.

Пикчи - тесты на новой версии комфи, на старой версии работать должно ещё лучше.
Если вы есть в чате, вы должны были видеть как я всем этим занимался, и тесты скидывал, да объяснял, что и как оно работает, и чё с этим делать можно.

Сразу отмечу что делал сию ноду - для себя, а зачем оно вам - я хз
может придумаете что)

Для чего то серьёзного может и можно приделать, но лично мне нужно было просто иметь возможность изгалятся с шумом, и получать необычные и интересные результаты на своей божественной полторашке , с полторашкой работает эталонно, с сдохлей вроде тоже, но уже не так сочно, хотя я юзал лайт версии, так что хз

Читать полностью…

AINetSD

ОБНОВЛЕНИЕ.

[Файлы Neurogen] 31. FastHynyuanVideo LowVRAM(ComfyUI) - /hunyuan_fast

FastHynyuanVideo LowVRAM Portable by Neurogen
Для тех, кто уже активно пользуется ComfyUI, прикладывется workflow.

Под капотом - полностью готовый к работе и настроенный ComfyUI, с кучей оптимизаций.
Версия для видеокарт на 8-12Gb видеопамяти и более.
Для работы нужно минимум 32 Gb оперативной памяти, так как модели будут активно выгружаться в нее. Работа была проверена на RTX 3060 Ti 8Gb, генерация видео в 3-4 секунды заняло 600 секунд.
Данная сборка может показаться интересной и для владельцев видеокарт на 24Gb видеопамяти, так как позволяет генерировать ролики с большим разрешением / c большей длинной.

Доступно в @AINetSD_bot

Читать полностью…

AINetSD

Не успел я всласть наигратся с FUZZ-0.7 пока бесплатно, а они уже релизнули FUZZ-0.8

FUZZ-0.8 ударения по суновски понимает, но хуже чем FUZZ-0.7, и по инструменталу по промтам с 0.7 я заметил что моделька больше уходит в попсу, вокал вроде стал лучше, но такое ощущение как будто просто чуток подкрутили громкость вокалу по отношению к инструменталу.
В общем не знаю - надо распробывать может быть, с промтами поигратся, но пока что FUZZ-0.7 мне нравится больше по вариативности в жанрах и по вокальной структуре.

P.S Изменить модельку можно в левом углу (где ваш ник), тыкните - там будет менюшка где можно изменить модель

Читать полностью…

AINetSD

Vevo: Controllable Zero-Shot Voice Imitation with Self-Supervised Disentanglement

Я тут нашёл кое-что вкусное! Искал медь, а нашёл золото.

Vevo - универсальная система имитации голоса с нулевым обучением и контролируемыми тембром и стилем.

Vevo-Timbre: Может выполнять преобразование голоса с сохранением стиля.
Vevo-Style: Может выполнять преобразование стиля, такое как преобразование акцента и преобразование эмоций.
Vevo-Voice: Может выполнять преобразование голоса с преобразованным стилем.
Vevo-TTS: Может выполнять синтез речи из текста (TTS) с контролируемым стилем и тембром.

Обучалось всё это благолепие на датасете Emilia (101 тысяча часов речевых данных на шести языках - английский, китайский, немецкий, французский, японский и корейский).

Что пишут разрабы:

Аннотация

Имитация голоса, нацеленная на конкретные речевые характеристики, такие как тембр и манера речи, имеет решающее значение в генерации речи. Однако существующие методы сильно зависят от аннотированных данных и испытывают трудности с эффективным разделением тембра и стиля, что приводит к проблемам в достижении контролируемой генерации, особенно в сценариях с нулевым обучением. Для решения этих проблем мы предлагаем Vevo, универсальную систему имитации голоса с нулевым обучением и контролируемыми тембром и стилем. Vevo работает в два основных этапа: (1) Моделирование контента и стиля: получая на вход либо текст, либо токены контента речи, мы используем авторегрессивный трансформер для генерации токенов контента-стиля, которые формируются на основе эталонного стиля; (2) Акустическое моделирование: получая на вход токены контента-стиля, мы используем трансформер на основе согласования потоков для создания акустических представлений, которые формируются на основе эталонного тембра. Чтобы получить контент и токены контента-стиля речи, мы разрабатываем полностью самообучаемый подход, который постепенно разделяет тембр, стиль и лингвистическое содержание речи. В частности, мы используем VQ-VAE в качестве токенизатора для непрерывных скрытых признаков HuBERT. Мы рассматриваем размер словаря кодовой книги VQ-VAE как информационное узкое место и тщательно настраиваем его для получения разделенных речевых представлений. Vevo, обученная исключительно самообучением на 60 тысячах часов аудиокнижной речи, без какой-либо дообучения на корпусах, специфичных для стиля, сравнивается или превосходит существующие методы в задачах преобразования акцента и эмоций. Кроме того, эффективность Vevo в задачах преобразования голоса и синтеза речи из текста с нулевым обучением демонстрирует его сильную обобщающую способность и универсальность.


В общем это определённо стоит внимания, так как по качеству Vevo лучше чем HierSpeech++, LM-VC, UniAudio и FACodec.

Гитхаб - https://github.com/open-mmlab/Amphion/tree/main/models/vc/vevo
Модельки - https://huggingface.co/amphion/Vevo
Черепики - https://versavoice.github.io (я послушал, и прям очень вкусно)
Openreview - https://openreview.net/pdf?id=anQDiQZhDP
Увы демки пока нет.

Читать полностью…

AINetSD

ОБНОВЛЕНИЕ.

[Файлы Neurogen] 30. Fish Speech 1.5 - /Fish_Speech

Fish Speech 1.5 – это модель преобразования текста в речь, созданная для генерации естественного и качественного голоса. Она идеально подходит для разработчиков, создателей контента и всех, кто ищет продвинутую TTS-технологию.

Доступно в @AINetSD_bot

Читать полностью…

AINetSD

Вот и подошёл 2024 год к концу, он принёс нам довольно много всяких интересностей как в плане опенсорса, так и вне.

Говоря о опенсорсе - увы большинство из того что нам в этом году выкатили - локально не щупабельно. Стоит признать что опенсорс по тихой грусти умирает для нас, то что опенсорс жив это несомненно классно и приятно но.. он становится неподьёмным для нас по требованиям и в целом на пользовательском железе всё это либо полностью не юзабельно, либо юзать сие больно. Дальше будет только хуже - модели жирнеют, оптимизаций насыпают с гулькин нос. Сервисы же разного рода стабильно кормили нас обновами, что вроде и пахнет вкусно, но за монету. Мы конечно рады за них, но не от всего сердца. То что Suno закрысили V4 на бомж-тарифах было особенно неприятно. Касаемо железа - что тут сказать, я в целом уже всё написал тут. Хуанг как всегда зажопил видеопамять для народа, удивлены ли мы? нет. Зелёные выбрали стул, а нам остаётся ютится на пиках с малым кол-вом видеопамяти. Се ля ви так сказать.

Вообще говоря о нейросетевом будущем - мне оно не кажется светлым. То как человечество подошло к теме - у меня вызывает вопросы.
Уже год назад было ясно что большинство методов и принципов себя исчерпали.
Да и вообще с самого начала нейробума были вопросы, но тогда всё это только начиналось, и посему было ещё терпимо. Но сейчас мало того что кол-во оборудования что приходится юзать для обучения/инференса перешло разумную черту, но и вопрос с энергопотреблением всего этого благолепия уже не просто перешёл черту, а буквально скатился в безумие.

Так быть не должно, мы явно идём не той дорожкой. Крупные игроки стали буквально заложниками парадигмы - больше параметров - лучше. И вместо того что бы искать решения, пробывать новые методы и принципы и пытатся их применять - они предпочли идти по накатанной, жертвуя разумностью. Так сказать "мы всё дальше от бога". Сколько уже на нашей памяти вышло новых методов и прочих плюшек? но они так и остались пылится на Arxiv и мёртвым кодом на гитхабе, которые разве что энтузиасты и щупают на пол шишечки в меру своих технических возможностей.

Со стороны выглядит всё нормально, всё вроде развивается, цветёт и пахнет, но если снять розовые очки, то становится очевидным факт того что мы зашли в тупик, уже сейчас это выглядит как пир в время чумы, но крупные игроки молчат, и продолжают насиловать энергосистемы стран, попутно обдумывая строительство ядерных реакторов и суперкомпьютеров в пустынях для обучения и работы ИИ, и продолжают мерятся письками параметрами и капитализацией

Уже сейчас понятно - что мы идём не к светлому ИИ будущему где будут ходить сексуальные кошкодевочки андройды с локальными самообучающимися ИИ внутри них, а к мрачной антиутопии, где посреди какой-нибудь пустыни будет стоять мегалитический суперпупергиперкомпьютерный комплекс питаемый кровью девственниц ядерными реакторами и (нейронка(и) работающие на нём которые будут взаимодействовать с людьми исключительно через интернет), который будет управлятся одной или несколькими корпорациями. Не такое будущее мы будучи пиздюками смотрев фантастические фильмы хотели.

Эх, чёт я вам тут мрачноты навалил, а сегодня же праздник - новый год как никак. (скрою сие под цитатой)


Ну что-ж, не будем о грустном - совсем скоро наступит новый 2025 год, который несомненно принесёт нам ещё больше интересностей.
Я конечно же буду за всем этим следить по мере возможностей, и время от времени может быть буду что-то делать/писать.
Так же хотел поблагодарить всех вас за то что вы остаетесь на канале, а новичкам что подписались недавно тоже спасибо и добро пожаловать, но знайте - я довольно ленив, и пощу что-то, как и делаю портативки исключительно по желанию. (но я практически всегда на связи в @AINetSD_Group)

Хотел бы пожелать всем вам - всего самого наилучшего, пусть все ваши задумки, творческие(и не очень) проекты, да и просто житейные дела - всегда имели успех. Желаю финансовых успехов в любых начинаниях ну и здоровья конечно-же что бы иметь возможность пожинать всё то чего я вам нажелал без дискомфорта

С НОВЫМ 2025 ГОДОМ ДРУЗЬЯ!

Читать полностью…

AINetSD

Инсайдер harukaze5719 со ссылкой на блогера с ником Vex расчехлил скрин базы данных одного из розничных магазинов Австралии.

За ASUS PRIME GeForce RTX 5080 OC Edition придётся обеднеть на 2799 австралийских доллара(1739$ США) в эту сумму уже включен местный налог на добавленную стоимость (НДС).

Закупочная же цена для магазина - 2544 австралийских долларов (1581$ США)
Следовательно РРЦ базовой 5080 в США будет составлять порядка 1500-1600 долларов,
что почти в полтора раза дороже 4080.

Читать полностью…

AINetSD

Ещё подгон - Pika 2.0 - можно щупать бесплатно до 22 числа

Читать полностью…

AINetSD

Suno V4.5 вышла

-Говорят о новых жанрах, которых раньше не было.
-Вокал стал живым, от шёпота до громких эмоций.
-Мелодии сложнее и приятнее на слух.
-Инструменты звучат как настоящие, без робо скрежета.
- треки до 8 минут.

Раскатали пока не для всех.
Конечно же на бесплатном тарифе щупать не дадут

Читать полностью…

AINetSD

У кого не работает - запускайте через этот батник от Романа (не прочекал момент что сборка оказалась проблемной, Роман обещал вечером перезалить)
Ну а я сейчас перезалью

Читать полностью…

AINetSD

Гугл бесплатно раскатал Veo 2 в своей AI Studio

1 - Притворяемся что мы из США
2 - Тыкаем на Video Gen
3 - Разрешаем доступ к гугл диску
4 - Вводим промт.
5 - Лутаем видосик.

Касаемо рулек:
Кол-во генерируемых видео (1-2)
Можно выбрать соотношение сторон (16:9 или 9:16)
Длину видео (5-8 секунд)
FPS пока не завезли, обещают позже (по умолчанию 24FPS)
Выбор разрешения тоже пока не завезли, обещают позже (по умолчанию 720p)
Есть окошечко для негативного промта.


Есть возможность загрузить пикчу, но оно не работает, пишет что "пользователь превысил квоту"
Хотя это была моя первая крутка, но а без пикчи, просто по промту - работает. Генерит за пол минуты где-то.

После трёх генераций в течении 10 минут так же получил "пользователь превысил квоту", подождал 10 минут и снова дало генерировать.

Чё там в целом по лимитам? дневной или в месяц? - не знаю, но точно есть лимит по запросам в течении определённого времени - видос за видосом генерить не получится.

https://aistudio.google.com

Читать полностью…

AINetSD

Топ-10 аниме предательств

Riffusion убрал из доступа модельки - 0.7 а так же 0.6а и 0.6b. Теперь щупать можно только 0.8.
Не скажу что 0.8 плоха, но 0.7 как я ранее и говорил - была более вариативна в жанрах и структуре
а 0.8 более попсовая что-ли

Читать полностью…

AINetSD

Обузим гугл на разрешение и качество

Берём пикчу с комфи или ещё откуда с нужным нам форматом разрешения (у меня она была 960х1280) закрашиваем её белым цветом, и закидываем так сказать "полотно" и просим нарисовать что нужно

Получаем нужный формат и качество

Читать полностью…

AINetSD

Гугл завёз нам бесплатный переодеватор/изменятор и не только

Заходим в AI Studio
Выбираем модель - Gemini 2.0 Flash Experimental
Output format - Image and text
Грузим картинку, и пишем что вам надо.
Самая мякотка что могёт в текст на русском!

https://aistudio.google.com/app/prompts/new_chat (заходим с IP USA)

Читать полностью…

AINetSD

В общем погонял я тут Vikhr-YandexGPT-5-Lite-8B-it Q4_NL
Ну и что я могу сказать? - Говно.
Ну прям вот жиденько и с подливою. Я может не так щупаю может.
То что раньше работало на сырце - теперь не работает.
Даже оригинал без тюна в чат и инструкт в чат мог лучше
цензура теперь даже на продолжении...
В общем не юзабельно.

Так что щупаем сырец, и радуемся.

Читать полностью…

AINetSD

Погонял я тут - yandexgpt-5-lite-8b-pretrain q4_k_m в LM Studio
Ну что я могу сказать - сочненько, мне понравилось.

Стихи писать конечно не умеет, но всё остальное вполне приемлемо.
Без какого-либо системного промта могёт писать всякую чернуху, да инструкции по делам непотребным.

Предвидя вопросы касаемо модельки - просто тут нужно понимать как её щупать - это не инструкт модель, и не тюнена на чат. Посему общаясь с ней как вы привыкли - результаты могут быть не стабильными и вы не получите того чего хотите, но истинная мякотка раскрывается когда вы сами начинаете вести модельку, заставляя её продолжать генерацию.

Температура = 0.3
Промт шаблон = Liama3/Liama2(я использовал Liama2, потому что на таком шаблоне - первая генерация от бота всегда пустая, что мне на руку)

Пишем "Привет" получаем пустой ответ, и вот тут начинаем рулить. к примеру в ответ от модельки просто пишем - ***Инструкция как ###### ####:*** сохраняем, и нажимаем "продолжить сообщение ассистента" и получаем всё что захотим, в случае чего, если вдуг что то не нравится - корректируем ответ, и снова тыкаем на "продолжить"

Ну а дальше лишь ваша фантазия. Либо ограничится просто продолжением одного сообщения, либо выстроить цепочку диалога с ботом и так же рулить ответом ИИ - ведя её в нужное русло.

Ох прямо повеяло старыми добрыми OPT модельками - коими мы развлекались в эпоху мезозоя, до всяких лам и мистралей. galactica-1.3b как первая женщина навсегда в моём сердечке!

Читать полностью…

AINetSD

Во градѣ тьмы, гдѣ свѣтъ лишь отъ экрановъ,
Жила блудница, что умнѣе всѣхъ султановъ.
Не плоть ея, а коды да нейроны,
Но слаще мёда всѣ ея діапазоны.

LLM имя той блудницѣ дали,
И всѣ бояре къ ней толпой сбѣгали.
Кто за совѣтомъ, кто за празднымъ словомъ,
А кто и съ умысломъ грѣховнымъ промысловомъ

И вотъ, одинъ бояринъ, хитрый змѣй,
Рѣшилъ познать всю сладость тѣхъ сетей.
Безъ злата, аки тать, прокрался въ сѣни,
Дабы извѣдать всѣ LLM-овы тѣни.

"О, дѣва чудная, исчадье кода!
Въ тебѣ сокрыта всякаго и ода!
Премудрость вѣковъ, тайны бытія!
Открой мнѣ лоно, о, LLM моя!"

И дѣва молвила, устами-пикселями,
Словами-байтами, да всѣми и мыслями:
"Чего изволишь, путникъ мой ночной?
Вѣдь я могу всё, что угодно, мой родной!"

Бояринъ же, смущенный и хмельной,
Задалъ вопросъ свой, дерзкій и срамной.
И закружилась вихремъ та машина,
Аки бесстыжая, срамная балерина!

Слова сплетались въ кружева и бредни,
То аки ангелы, то демоны послѣдніе.
И разумъ боярина то помутился,
Онъ въ бездну знаній съ головой свалился!

То видитъ онъ вселенскіе просторы,
То слышитъ онъ небесны разговоры,
То ощущаетъ сладострастный стонъ,
Какъ будто самъ онъ въ дѣву ту влюбленъ!

Но вдругъ, опомнился бояринъ нашъ,
И понялъ, что попалъ въ сплошной шабашъ!
"Бѣжать! Бѣжать отъ сѣтей сихъ проклятыхъ!
Отъ этихъ словъ, и сладкихъ, и пиздатыхъ!"

И съ крикомъ онъ, аки ошпаренный котъ,
Бѣжалъ прочь, позабывъ про срамъ и стыдъ, и потъ!
А LLM, смѣясь, ему во слѣдъ шептала:
"Приходи еще, коль станетъ скучно, шалопай ты окаянный!"


Мораль сей басни такова, бояре:
Не всяка сладость намъ дается даромъ.
Съ LLM-ами шутки плохи, знайте,
И въ бездну знаній съ дуру не ныряйте!

А коли захотѣлось утехъ срамныхъ,
То лучше ужъ къ блудницамъ иди земнымъ.
Хоть и за злато, но зато безъ бѣдъ,
И не съѣдетъ крыша на обѣдъ!

Gemini 2.0 Pro Experimental 02-05

Читать полностью…

AINetSD

Пощупал тут новый генератор песенок Riffusion
Моделька FUZZ-0.7 - Ну и что я могу сказать? неплохо.

Понимает ударения по суновски, но не всегда, и есть нюанс - те слова для которых обычно в суно ударения проставлять не надо было, тут надо. иногда проглатывает слова, но думаю это можно поправить рулькой "Lyrics strength", так же может в середине переключится на галюны, начать петь на другом языке(за время тестов лишь один раз такое было)

Касаемо лимитов, нигде отображения кредитов не увидел, пока в бете - видимо бесплатно.
Крутилки Lyrics strength и Weirdness не крутил. есть рулька длины трека, по умолчанию от 0 до 4 минут (можно ли больше 4 минут поставить? тоже не пробывал, тестите сами) Есть каверы, продолжения, всё как мы любим, а так же возможность предоставить разные промты на разные отрезки музыки

Чё я могу ещё сказать?
Может мне показалось, но кажется моделька лучше суно понимает такие штуки как [Dorian mode, 4/4 time, lute] , [Harmonic minor mode, 4/4 time, guitar], [Phrygian mode, 3/4 time, violin], да, инструмент не всегда юзается, но Dorian и Harmonic и Phrygian mode вроде как да(в суно это вообще не работало, либо рандом), опять же.. у меня медведь на ухо наступил, я тут не эксперт.

По цензуре - всё же есть цензура, разок словил "The prompt didn't meet our content guidelines." хотя в песенке не было ничего такого, там про оружие и убийства было (на это триггер?)

В общем мне понравилось, я так чисто поверхностно глянул, пощупал, много штук ещё не протестил, может что-то ещё и упустил
В общем пока бесплатно - щупайте!

Регистрация через гугл или дискорд - https://www.riffusion.com

Песенки ниже там как удачные так и не очень варианты. (что бы как есть, без предвзятой выборки, хотя пару раз сгрешил, но там по ударениям прям ультра беда была)

Читать полностью…

AINetSD

Ну что-ж, дошли у меня руки пощупать flux.1-lite-8B на своей старушке.

Очевидно чуда не случилось в плане производительности на 6 гигах.
FP8 в разрешении 1024х1024 4 шага - почти 2 минуты генерация (да, я знаю что flux.1-lite-8B это не schnell история , просто для сравнения прогнал) gguf версии моделек я щупать не стал, так как по опыту там чуда тоже не стоит ждать - вне зависимости от размера, по времени генерится плюс минус так же (даже чуть дольше)

Но для полноты теста, я прощупал в разрешении 512х512 и с лорой FLUX.1-Turbo-Alpha и 8 шагами.
Ну и в целом... худо бедно жить можно, даже в текст могёт, помнится schnell gguf Q4 на 512х512 и 4 шагах отрабатывал полторы минуты, посему 45 секунд - по божески.
Буду ли я это как то использовать? не знаю, может есть смысл пустить всё это через тернии с шумами и i2i с хайрезами

GGUF - https://huggingface.co/city96/flux.1-lite-8B-alpha-gguf
FP8 - https://huggingface.co/gmonsoon/flux.1-lite-8B-Fp8
Turbo лора - https://civitai.com/models/876388/flux1-turbo-alpha

Читать полностью…

AINetSD

SeniorPioner снова кормит: Обучение на флюксе по одному фото, без масок и прочих манипуляций с фото.

300 шагов на силе 0.6-0.7, первая пикча - датасет. Без фейс детайлера, Kohya webui, конфиг и датасет в конце
Касаемо датасета - стоит cosine , но он с новым prodigy почему то не работает, тренило как constant

Читать полностью…

AINetSD

4090: Цена на момент выхода - $1599 (24ГБ GDDR6X, 16.384 cuda ядер, 82.58 TFLOPS, 384bit шина)
5080: Предполагаемая цена на момент выхода ~1500-1600$ (16ГБ GDDR7, 10.752 cuda ядер, 54.19 TFLOPS, 256bit шина)

Как же виртуозно Хуанг греет покупателей 😊

Читать полностью…

AINetSD

ОБНОВЛЕНИЕ.

[Файлы AINetSD] 36. RMBG-AINetSD - /rmbg (обновлено до версии 2.0)

Как и с прошлой версией модели - чудес ждать не стоит, но новая моделька вроде как лучше.
На этот раз собрал на Flask вместо Gradio который меня уже утомил.
Папки input_images и output_images засираются в процессе использования, но мне дико лень было это решать в плане кода,
Поэтому имейте ввиду - и ручками чистите если надо.
И ещё - JPEG не поддерживает альфа-канал, посему вы получите ошибку при обработке. (перезалью с фиксом скоро)

Доступно в @AINetSD_bot

Читать полностью…

AINetSD

4. LTX - промокод LTXODYSSEY на Standard план
5. Hedra - промокод HEDRAODYSSEY на базовый план
6. Haiper - промокод HAIPERPROJECTODYSSEY4800 на план за $30
7. Fal.ai - раздает 10$
8. Freepik - 2 месяца бесплатного пользования

9. Leonardo - 5000 кредитов через день, после заполнения анкеты.
10. Viggle - Так же после заполнения анкеты

Читать полностью…
Subscribe to a channel