Канал про нейросети в компьютерной графике, в кино и вообще Чат: https://t.me/+16lR_Zc8oVM2ZTky
LLM Arena: Бенчмарк LLM моделей на русском языке
Арена русскоязычных моделей.
А вот на днях еще и запустили приложение в тг
#arena #leaderboard #llm
AccVideo: Accelerating Video Diffusion Model with Synthetic Dataset
Очередной метод ускорения видеогенерации.
Быстрее Hunyuan в 8.5 раз
Код
HF
#distillation #text2video
🤖 Золотая коллекция авторских каналов про нейросети, сохраняйте!
Собрал для вас редкие и полезные каналы про нейронки:
Tips AI | IT & AI — пишет про интересные сервисы AI и IT технологий! Всегда актуальное, проверенное и немного с юмором.
НейроProfit — авторский канал с проверенными инструментами для бизнеса, учебы и работы. Конкретика, кейсы и пошаговые инструкции – все, чтобы вы смогли использовать ИИ эффективно уже сегодня.
Бурый — коллекционер нейросетей, тестит всё на себе и делится лучшими бесплатными нейронками.
Сергей Булаев AI 🤖 - создание полезного контента и продуктов с помощью ИИ. Открываем эру миллиардных компаний из трёх человек.
Силиконовый Мешок — Авторский канал нейроиспытателя Артема Субботина про искусственный интеллект приносящий прибыль.
#промо
AvatarArtist: Open-Domain 4D Avatarization
Создает 4D аватар по одному портрету
От авторов Follow-Your-Emoji
Код
Демо ждем
#image2avatar #head
Step-Video-TI2V
Открыт доступ к генератору видео по картинке/тексту от Stepfun, в том числе онлайн на сайте. Авторизация по российскому номеру телефона работает
Попробовать
Веса
#image2video
⚡️Наконец-то эти боты нашлись!
Полностью рабочие и бесплатные
ChatGPT и Midjorney
появились в этом канале.
/channel/+A_0OrVyzD2k0M2Iy
Чем они вам будут полезны?
— Напишут вам тексты на любую тему
— Ответят на ваши любые вопросы.
— Создадут любую картинку по вашему запросу
— Решат любую задачу
И это только самая малая часть того, что умеют данные боты 🤖
После подписки, ваша жизнь значительно облегчиться: /channel/+A_0OrVyzD2k0M2Iy
#промо
Новости автоматизации
Имейте ввиду, что устанавливать MCP из непроверенных источников небезопасно
image-gen MCP
ИИ прикручивают к ИИ. На сей раз агента прикрутили к интерфейсу генерации картинок Forge / AUTOMATIC-1111
————————————
AbletonMCP
MCP к музыкальной станции Ableton
————————————
Народ массово сооружает свои MCP к Cursor просто потому что это легко
————————————
https://mcpify.ai
Онлайн сервис для создания своего MCP
————————————
Галереи MCP серверов
https://github.com/punkpeye/awesome-mcp-servers/
https://portkey.ai/mcp-servers
https://mcp.so
https://mcp.composio.dev
https://glama.ai/mcp/servers
————————————
https://modelcontextprotocol.io/introduction
Введение в MCP
#agent #text2music #text2image #imageediting #musicediting #mcp #coding #text2agent
Языковые модели подминают под себя задачи с обработкой изображений. Скоро флюкс и МЖ станут не нужны. Чем ответят авторы картиночных нейросеток?
Читать полностью…Gemini 2.5 Pro
Мультимодальная рассуждалка. Но пока без генерации картинок.
По нескольким бенчам всех превзошел, взлетел наверх арены.
Контекст миллион токенов, обещают два.
Сегодня гугл всех побил. Надолго ли?
Пробовать в AI Studio
#assistant #reasoning #coding
У генератора музыки Riffusion обновки и весьма интересные
- Можно загрузить свой трек для препарирования и переделки
- Swap Sound - заменяем инструментальные партии/жанры, вокал остается
- Swap Vocal - заменяем вокал, оставляя инструменты
- Get Stems - делим композицию на партии и скачиваем
- Trim - обрезаем, оставляя нужный кусок, и работаем от него
- Ghostwriter - пишет тексты
#text2music #music2music #audio2music
Осталось 8 мест на бесплатный 3-х дневный онлайн-курс по деньгам на нейросетях.
После я закрываю набор. Дальше курс будет стоить дорого.
Вот как проходит рабочий день моих выпускников:
- заварили кофе, открыли ноутбук;
- сделали запросы своему обученному ИИ-агенту;
- через 15 минут получили готовый результат, равный 20 часам плотной работы.
Новички получают внушительную прибавку к з/п, фрилансеры наконец освобождаются от рутины, а бизнесмены не видят отбоя от клиентов, внедряя эту технологию.
Раскрою тебе секрет.
98% пользователей нейросетей не умеют правильно ими пользоваться и пишут запросы типа “нарисуй картинку”, “напиши текст” – и получают “так себе” результаты, которые невозможно потом использовать.
В прямом эфире я покажу тебе, как настроить себе мощного ИИ-агента и получить в распоряжение профессионального копирайтера, smm-щика, маркетолога и сценариста, которые будут работать на тебя 24/7:
— генерировать бесконечный поток идей для постов, Reels, Stories и прогревов (а самое главное — классно их писать);
— получать больше клиентов, денег и свободного времени;
— даже снимать и монтировать видео без участия автора!
Ты сможешь спокойно заниматься общением с клиентами и личными делами, а всю утомительную рутину возьмут на себя специально обученные нейросети.
Освоить всю мощь нейросетей поможет мой 3-х дневный онлайн-курс, пока бесплатный 👉 https://vk.cc/cK9IeL
На уроках будет очень много практики: от создания своего цифрового клона до шаблонов по поиску и переговорам с клиентами, в общем, полный комплект знаний для того, чтобы раскрыть весь потенциал нейросетей на максимум!
#промо
Grok Edit Image
Вслед за Gemini, в Grok добавили функцию редактирования картинок текстовыми указаниями
Идем в Grok, ищем кнопку Edit Image
#assistant #mlm #vlm #imageediting #text2image
OWL: Optimized Workforce Learning for General Multi-Agent Assistance in Real-World Task Automation
Бесплатная альтернатива агента-автоматизатора MANUS
#agent
MotionStreamer: Streaming Motion Generation via Diffusion-based Autoregressive Model in Causal Latent Space
Очередной генератор анимации движений человека по тексту. Этот умеет анимировать на лету, в режиме потока
Код ждем
#humananimation #realtime #text2animation
M3: 3D-Spatial Multimodel Memory
Рендер статичных 3D сцен на гауссианах с памятью. Не спрашивайте, я сам не понял
Код
Демо ждем
#gaussian #rendering
Self-Supervised Learning of Motion Concepts by Optimizing Counterfactuals
Ура, новый трекер группы точек от Стэнфорда.
Несмотря на то что все они неточные, они мне уже пригождались там где все планарные и точечные трекеры оказывались бессильны
Код
Колаб
#tracking #opticalflow
Immersity 4.0
Leia Inc выпустили обновку.
Immersity это онлайн сервис, где можно немного подвигать картинку натянув карту глубины, бывший Leiapix. Так вот, теперь оно работает лучше. Но на бесплатном тарифе вам не отдадут карту глубины. А что отдадут будет с вотермаркой
Еще умеет делать из обычного видео 3D видео для XR девайсов, опять же через карту глубины. На бесплатном тарифе:
3D Motion
3D Image
3D Video Simple
#image2depth #image2video #monoculardepth #parallax
FirePlace: Geometric Refinements of LLM Common Sense Reasoning for 3D Object Placement
Разработка DeepMind. Осмысленное размещение языковыми моделями объектов в 3D сцене с учётом геометрии и констрейнов
А я думал, Клод с MCP уже намного больше может
Кода нет
#mlm #assistant #3d
Inference-Time Scaling for Flow Models via Stochastic Generation and Rollover Budget Forcing
Решает проблему генерации заданного количества объектов и их расположения в кадре для Flux и подобных моделей
Код ждем
#text2image
Ideogram 3.0
Обновка за обновкой.
3 версия генератора картинок Ideogram хвастается модными Canvas, remix, удержанием стиля, заменой фона, реализмом, точностью генерации текста, пакетной генерацией и т д.
стабильно превосходит другие модели преобразования текста в изображение
Теперь официально, Grok в телеграм @GrokAI
Только для премиум юзеров
#news #bot #assistant
Aether: Geometric-Aware Unified World Modeling
Видеогенератор с пониманием пространственной геометрии с тремя ключевыми способностями:
- Динамическая реконструкция в формате 4D
- Прогнозирование видео на основе действия
- Визуальное планирование на основе цели
Умеет восстанавливать динамические облака точек по видео, оценивая глубину и ракурс.
Код ждем
Демо ждем
#video2video #novelview #cameracontrol #motioncontrol
4o Image Generation
Говорят, GPT-4o теперь подобно Gemini и Grok умеет редактировать картинки и даже генерить видео через Sora, подписка не нужна. Дают 3 видео в сутки.
Мне сначала сказал вот, готово, а картинку не отдал. Теперь совсем отказывается, говорит не умею
Видео
#imageediting
G-Assist
Игровой помощник Nvidia уже доступен в NVIDIA App.
Анализирует игры, подсказывает настройки, билды для боссов и героев, помогает с итембилдами, переключает громкость в Spotify. Поддерживает локальную модель без интернета и API Gemini. Понимает текст и голос
Обновляем NVIDIA App, открываем в приложении главную страницу, пролистываем до "Интересное" ("Discover"), ищем там Project G-Assist, устанавливаем
#gaming #news #assistant
Аттракцион невиданной щедрости от Deemos
Они выложили в твиттере API ключ полного доступа к своему 3D генератору Rodin
API Key:
vibecoding
DeepSeek-V3-0324
Обновка занозы в багажнике OpenAI, лицензия MIT
Что-то там быстрее, умнее, дешевле
Умелец уже запустил локально на M3 Mac Studio с 512 ГБ памяти
Попробовать тут
#assistant #reasoning
VCtrl: Enabling Versatile Controls for Video Diffusion Models
Унифицированный контролнет для видеогенераторов, не требует дообучения. На примерах показаны Canny / Pose / Mask
Код
#controlnet #video2video #motioncontrol #text2video
Finegrain Light Switcher (Lite Version)
Включить свет на картинке, демка от finegrain.ai
#relighting
Zero-1-to-A: Zero-Shot One image to Animatable Head Avatars Using Video Diffusion
Криповый аватар головы по одному портрету
Код будет здесь
#image2avatar #head #talkinghead
Заработал демоспейс персонализатора Infinite You (InfU)
Демо
#personalization #referencing #text2image