cgevent | Unsorted

Telegram-канал cgevent - Метаверсище и ИИще

37805

Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие. Для связи: @SergeyTsyptsyn

Subscribe to a channel

Метаверсище и ИИще

Вот так я провожу свои дни.

Открываешь коменты, а там 500 запросов на добавление в чат.
И начинаются они вот так.

Я щас удалю все, если вы кожаный и адекватный, добавляйтесь заново, постараюсь отличить вас от ботов и магов. Хотя это непросто по вашим аватаркам.

Если совсем уж замуж невтерпеж, пишите в личку.

@cgevent

Читать полностью…

Метаверсище и ИИще

Ну, за танцоров.

В Китае празднуют победу ДипСика Новый год.

Я, как ни странно, ровно дышу к теме робатов. Никогда не мог понять стремления делать их антропоморфными - более неуклюжей, медленной и негибкой твари, чем кожаный еще поискать надо. Одна из гипотез - антропоморфных удобно тренировать на видеоданных про кожаных и для кожаных.

Ну и пока ни один робат-пылесос не задавил хозяина, а представьте двух-метровую махину "кухонный помощник Optimus", который упал на любимую псину или жену\мужа? Адвокаты быстро прикроют лавочку-индустрию таких помогаторов по дому.

Но вот смотрите, где они точно не навредят, так это в шоу бизнесе. Пусть радуют народ. Кормить, поить, репетировать - не надо. Требуется 1000 танцоров? - алло, гараж, склад номер 2 откройте. Какой автобус? Сами дойдут!

В принципе и в зал их тоже можно посадить, вон они как лихо хлопают, а в конце (кто досмотрит) даже чепчики бросают.

Хореографией займется GenAI - давно уже постил, что по входной музыке научили генерить движения для болванов в Блендоре на основе простой мокап базы.

В цирке тоже пригодятся. Пятерное сальто назад без страховки.

И тут я задумался про синхронное плавание (которое не очень почитаю за спорт) - и такие картинки у меня в голове...

@cgevent

Читать полностью…

Метаверсище и ИИще

Видеогенерация в Qwen Chat занимает чуть меньше времени, чем бесконечность. Еле дождался.

Надо, конечно, колдовать с промптами...

@cgevent

Читать полностью…

Метаверсище и ИИще

THIS IS NOT A TOOL TO BOOK FLIGHTS!!!

Ух, я нашел чувака в твитторе, которого, как и меня, страшно бесит, что все рассуждения про Оператор начинаются с заказа столиков в ресторане и билетов на самолет.

Что он делает:
Говорит Оператору пойти на сайт Google AI Studio (цинично раз)
Просит Оператора попросить Гемини написать инструкции\техзад. по созданию сайта (цинично два)
Оператор идет на Replit и делает сайт.

В идеале, если бы сайт был по заказу этих гребаных столиков.

THIS IS NOT A TOOL TO BOOK FLIGHTS!!!
THIS IS AN INTELLIGENT AGENT THAT CAN DO COGNITIVE WORK FOR HUMANS IN THE INFORMATION LAYER OF HUMANITY THAT WE CALL THE WEB.

Бро!

@cgevent

Читать полностью…

Метаверсище и ИИще

Итак, более полная информация из блогпостов:
— Computer-Using Agent (CUA) объединяет возможности обработки изображений GPT-4o и рассуждения модели посредством обучения с подкреплением (Reinforcement Learning); CUA обучен взаимодействовать с графическими пользовательскими интерфейсами — кнопками, меню и текстовыми полями, которые люди видят на экране. Использование RL, как и в случае o1/o3, означает, что как только OpenAI наладят процесс сбора данных для закидывания в обучающий процесс — прогресс попрёт.
— Компания несколько раз пишет, что это research preview, который может ошибаться и не работать, он не надёжен. И в то же время они очень ждут обратной связи на то, что и где не работает, чтобы в ближайших итерациях это исправить. В настройках можно включить опцию тренировки на ваших запросах и сессиях — я это обязательно сделаю, чтобы именно мои задачи начали решаться лучше.
— Если CUA сталкивается с трудностями или совершает ошибки, то оно может выбраться из ямы за счёт рассуждений и самокоррекции. Если это не удастся — система возвращает управление пользователю с запросом на конкретные действия.
— Оператор обучен заранее просить пользователя взять на себя выполнение задач, требующих захода в систему по данным учётной записи, ввода платежных данных или решения CAPTCHA (да-да, теперь мы решаем капчу за машин).
— Пользователи могут удалить все данные о просмотренных сайтах и выйти из всех аккаунтов одним щелчком мыши в разделе «Конфиденциальность» в настройках. Прошлые запросы к Operator также можно быстро удалить. Отсюда следует, что в Operator будут храниться ваши учётные и платежные данные (ну, как в обычном браузере, то есть сессия делится между разными запросами), и что не нужно логиниться каждый раз или добавлять свою карточку.
— OpenAI делает большой упор на безопасность системы и устойчивость к атакам. Весь процесс мониторится отдельной моделью, которая может вызвать остановку выполнения, если что-то не так. Кроме этого, некоторые подозрительные ситуации будут отправляться на ручную проверку, по результатам которой атаку/проблему можно пометить и быстро добавить в мониторинг (в течение нескольких часов).
— На агентских бенчмарках, как писал выше, результаты везде лучше всех других, включая Anthropic Computer Use. Про бенчмарки напишу отдельные посты на выходных, чтобы понять, что мы оцениваем.
— Что интересно, так это примеры, выложенные в блоге. Очень рекомендую с ними ознакомиться, чтобы понять, как формировать свои запросы (там есть примеры неудачных запросов, когда одна и та же задача то решается в 10/10 раз, то 3/10 если не так попросить или что-то не уточнить). В этих примерах по 150-450 шагов (!) выполнения задач. Правда каждый шаг очень маленький — сюда входят даже скриншоты страницы и нажатия кнопки Enter для отправки запроса.
— Чем больше шагов, тем больше качество (что показывает способность модели к выходу из тупиков). OpenAI гордо пишут «We observed test-time scaling», а там где scaling, там и приросты не за горами.
— Один из примеров запросов, который мне понравился и наподобие которого я буду закидывать сам: «Help me export charts, graph or other images from docx files received in email "Lecture Document" in Notes folder and upload these png files to the figures/ folder in Google Drive for later use (use numbers to name them)»

Выходя за рамки специализированных API-интерфейсов, удобных для работы с агентами, CUA может адаптироваться к любой доступной компьютерной среде, по-настоящему охватывая длинный хвост вариантов использования, которые остаются вне досягаемости большинства ИИ-моделей на данный момент.

Читать полностью…

Метаверсище и ИИще

Code Maestro

Недавно писал, про ИИ в UE.

Но там пока только доступ к чат-боту с доками и покрытая мраком генерация ассетов.

А сейчас принес ответочку для Unity (и в перспективе для UE).

Называется все это Code Maestro и выглядит это просто убойно.

Идея простая, взять кодогенерацию, но в конкретной нише и запилить ИИ-агентов, которые будут знать специфику (в данном случае геймдева) конкретной ниши и, как следствие, сильно превосходить кодогенераторы "общего назначения", типа Курсора и Копилота.

Я связался с авторами, и Макс говорит, что они не успевают онбордить новых пользователей, а лучший отзыв от одного из senior dev после полного освоения состоит в том, что он готов платить до 1000$/мес так как он бы смог работать с той же эффективностью на 2,5-3х работах))

Поглядите видос в шапке, а также другие видео на сайте. Он очень познавательный, особенно про правила хорошего тона. Впечатляет то, что кодогенерация заточена именно под геймдев (в виде плагина в Rider IDE) и знает узкую специфику, а не просто кодовую базу из интернета. И делает очень хороший код. И самое главное Сode Маestro анализирует целиком весь проект, и знает досконально весь его контекст. Включая все ассеты и связи.

Кому интересно, срочно записывайтесь в ранний доступ тут, проект уже работает.

@cgevent

Читать полностью…

Метаверсище и ИИще

Сорри, но я снова про видеогенераторы, ибо они все взбесились.

VIDU 2 хвастается новыми фишками:

- Ускоренное создание видео: Видео создается всего за 10 секунд.
- Повышенная согласованность: От первого до последнего кадра
- Низкая цена: Всего 0,7 цента за секунду (хмм)
- Внимание: в непиковом режиме неограниченное количество бесплатных генерация в непиковые часы.

Правда как попасть в непиковые часы непонятно.

И снова я вам принес не демо ролик из их твиттора, а аниме-пример.

Я не большой эксперт в аниме, но похоже совместимость персонажа там достигается попроще (главное глазищщи и подбородок) и снова подумалось, что вот эти вот филеры в аниме уже можно заполнять генеративом. А уж с такой музикой Suno точно справится.

В общем раньше бывало "а облака возьмем со стоков". А теперь: "аниме путешествие за город сгенерим в Vidu"

@cgevent

Читать полностью…

Метаверсище и ИИще

Вот это СМЕКАЛОЧКА!

Из-за того, что Открытый чемпионат Австралии по теннису не владеет всеми правами на трансляцию в ютуб, организаторы нашли оригинальное решение. Они используют технологию, которая в реальном времени отслеживает движения игроков и мяча на корте, а после создают анимированную версию матчей, напоминающую стиль игры Wii Sports и уже ее пускают в эфир.

тут можно почитать подробнее

Читать полностью…

Метаверсище и ИИще

Кстати, почему я не люблю МакКинзи

Повторю пост, которому 2.5 года.

К 2030 году мы будем заниматься киберпанком два-три раза в день.

Примерно так выглядят многочисленные прогнозы и отчеты по рынку "метаверсов", которые публикуют многочисленные агентства. Не устояли от искушения хайпануть даже уважаемые МакКинзи.
Они пишут, что рынок Метаверса достигнет 5 триллионов долларов(!) к 2030. Дословно.

Это больше подавляющей части известных вам рынков.
Вместо того, чтобы просто написать, что рынок всего, что связано с интернетом достигнет 5 триллионов долларов к 2030, солидные люди употребляют термин, которому НЕТ определения.

Я вот могу написать отчет, что монетизация эгрегоров вырастет к 2030 году в 64 раза.
Ведь это удобно. Если нет определения метаверса, то потом можно лихо подогнать свои же прогнозы под реальные цифры - "мы же говорили, ведь метаверс это же еще и реклама, трафик, гемблинг и адалт. Не говоря про DeFi, Dao и P2E".
И вот уже подобные отчеты строчат NewZoo и другие, а HTC выпускает Метаверс-телефон.

https://www.mckinsey.com/~/media/mckinsey/business%20functions/marketing%20and%20sales/our%20insights/value%20creation%20in%20the%20metaverse/Value-creation-in-the-metaverse.pdf

https://newzoo.com/insights/trend-reports/newzoo-report-on-metaverse-blockchain-gaming-nft-2022

Хде метаверс, МакКинзи? Где мои бабки?

@cgevent

Читать полностью…

Метаверсище и ИИще

Держите вдогонку тянущийся экран от Самсунга.

Я помню, что когда проводил первые ивенты, мечтал об экранах, которые можно свернуть в трубочку и засунуть в HDMI.
Пришел, повесил, подключил.
Без всяких проекторов, настроек, кабелей по 25 метров.

Не знаю для чего нужны именно тянущиеся экраны, кроме совы и глобуса, но я впечатлен.

@cgevent

Читать полностью…

Метаверсище и ИИще

Тут народ беспокоицца, что нейродед приподпропал.

Есть такое. Ну просто надо же иногда отдыхать.

На итоге, я превратился в полную нейросвинью на отдыхе - держите ИИ видео, которое отлично иллюстрирует мой синайский новый год: я целыми днями жру вкусную fusion еду (в Дахабе открылось 100500 новых точек с полной дичью), чешу пузо на солнце, левым глазом читаю новости, но вида не подаю. Играю в волейбол на теплом песочке, а вчера был южак и мы даже катнули на больших досках у берега в тряпочный серфинг на отмели. Вода в акабском заливе - плюс 22. Грех жаловаться.

А еще нейросвинья умудрилась прилететь в Гизу вместо Каира, ВиззЭйр теперь летает в Каир, но о том, что аэропорт прибытия - Гиза(Сфинкс), вы узнаете только выйдя наружу. Имейте в виду.

В общем, вот вам пока 3 минуты ИИ-чесания пуза. А я пойду посмотрю, куда мир укатился, пока я играл в покер и волейбол.

@cgevent

Читать полностью…

Метаверсище и ИИще

Мне понравилась сентенция из сети:

AI Code is the new NoCode
.

Вот вам сборище кодогенераторов, включая экзотику типа 15.

0. Cline
1. Cursor
2. Bolt
3. v0
4. Windsurf
5. Replit Agent
6. Loveable
7. DevinAI
8. Pear AI
9. Github Copilot inside Vscode
10. Github Spark
11. IDX by Google
12. webfraw .ai
13. UIzard
14. Amazon Q Developer
15. ChatGPT inside Mac app
16. Softgen AI
17. onuro.ai
18. Databutton
19. Wrapifai
20. Tempo labs

Что у вас стоит?

@cgevent

Читать полностью…

Метаверсище и ИИще

Японский метаверс. Now!

Полная копия Токио.
На сайте Пойнт клауды и CityJSON.

Выглядит как полный цифровой близнец, особенно с информацией про автобусы.

Качать и смотреть отсюда:
https://info.tokyo-digitaltwin.metro.tokyo.lg.jp/3dmodel/

Пошуруйте по сайту, интересный

@cgevent

Читать полностью…

Метаверсище и ИИще

Псевдобесплатные генерации всего

Есть такой проект Одиссей.

Они активно собирают коммьюнити через конкурсы и жирные призы.
$750,000+ in free trials from top AI sponsors (available starting December 16th)
Часть призов конечно кредитами и токенами - $70,000+ in cash prizes and unlock $750,000 in free tools starting December 16th.

Сейчас идет набор в Сезон 2. В жюри там Оливио и другие влоггеры.
https://www.projectodyssey.ai/
Вы можете прислать видео для следующих категорий:
Narrative
Music Video
Marketing & Advertisement
Trailers ??
Rendering & VFX !!
Social Media
Open-Format

До 16 января 2025

17 февраля - итоги и победители.

Но новость скорее не об этом.

Под это дело многие хостеры и просто апипродаваны объявляют бесплатный доступ к генератором видео.

Например, для опенсорсных Мочи и Хуньянь на рунподе:
https://openv.ai/ - домен огонь, но мой антивирус ругаецца, см ниже)

Или кредиты вот тут:
https://x.com/higgsfield_ai

Или кредиты еще много где.

В общем можете податься, и ну генерить псевдобесплатно.

Пока писал пост, похоже, что их подломили, сайт повалился.

Но твиттор жив: https://x.com/Project0dyssey/status/1866214554503623067

@cgevent

Читать полностью…

Метаверсище и ИИще

В твиттере вирусится видео, где Нетфликc как бы использует ИИ для дубляжа и одновременного липсинка.

Я вам предлагаю почитать хороший материал про то, как вообще нетфликс использует ИИ.

И там есть вот такой текст:

После успеха таких интерактивных сериалов, как "Бандерснэтч", Netflix, возможно, начнет изучать интерактивные истории с использованием ИИ, позволяя зрителям самим выбирать сюжет, который может включать дубляж с ИИ в зависимости от языковых предпочтений зрителя.

Использование искусственного интеллекта Netflix может стать мощным инструментом для предсказания потенциального успеха контента еще до его выхода - идея, которая не так уж далека от реальности, если учесть, что гигант потокового вещания уже использует аналитику.

Deepdub - это сервис, который использует Нетфликс для дубляжа.
https://deepdub.ai/post/how-netflix-leverages-ai-unveiling-the-tech-behind-the-stream

@cgevent

Читать полностью…

Метаверсище и ИИще

RiffDiffusion - песка почти нет, звучит чуть суховато, но надо колдовать в промптом, интересная стереобаза, кстати.

intense folk, blues, new orleans, soulful blues, soul, New Orleans voodoo, Cinematic soulful blues, R&B, ethereal chants, raspy male blues singer, vocal powerhouse, haunting cello, gospel backing choir, mystical percussion, upright bass, resonator guitar

На сайте все подряд, а вот в твитторе RiffDiffusion прям пользовательские черрипики
https://x.com/riffusionai/status/1884984944382099649

"Мы делаем этот инструмент бесплатным до тех пор, пока живы наши графические процессоры."

Звучит как план!!

@cgevent

Читать полностью…

Метаверсище и ИИще

OpenAI потихоньку переобувается GosuslugiAI.

Сегодня мы объявляем о выпуске ChatGPT Gov, новой адаптированной версии ChatGPT, предназначенной для предоставления государственным учреждениям США дополнительного доступа к пограничным моделям OpenAI.

Агентства могут развернуть ChatGPT Gov в своем собственном коммерческом облаке Microsoft Azure или в облаке Azure Government поверх сервиса OpenAI Microsoft Azure (открывается в новом окне). Самостоятельное размещение ChatGPT Gov позволяет агентствам легче управлять собственными требованиями к безопасности, конфиденциальности и соответствию нормативным требованиям.

https://openai.com/global-affairs/introducing-chatgpt-gov/

@cgevent

Читать полностью…

Метаверсище и ИИще

Вы будете смеяться, но у нас новый генератор видео (и картинок).

И это не китайские интерны, это .. китайские слоняры!

Алибаба сделала свой Qwen Chat и теперь там не только тексты, но и генерация картинок (как в chatGPT, Mistral LeChat, Gemini), более того, там же есть генерация видосов!

Бесплатно (лимиты пока не знаю), логин Гуглом возможен, генерит видео в 5 секунд.

Более того, там несколько моделей, среди которых опенсорсная Qwen2.5-1M с контекстом в Один Миллион токенов.

Мне все это отчаянно нравится - если каждый чат будет иметь теперь картинко- и видео-гегератор, я только за!

Ждём ответок от остальных.

https://chat.qwenlm.ai/

Пойду помучаю с телефона, не дают в выходные подетокситься.

@cgevent

Читать полностью…

Метаверсище и ИИще

OpenAI: AGI близко, Оператор скоро заменит кожаных бездельников.

Кожаные: дайте два! мы будем генерить в два раза больше мемов (за 2х200 долларов в месяц)!

Сэм: доктор, у меня суицидальные мысли.

@cgevent

Читать полностью…

Метаверсище и ИИще

Ну, за Холивуд.

FilmAgent: A Multi-Agent Framework for End-to-End Film Automation in Virtual 3D Spaces

Еще 7 лет назад(!) у Диснея была работа Cardinal AI. Я помню, что еще на Ивентах показывал лихие ролики, где по сценарию генерился сториборд и раскадровка. Тогда, правда, не было генерации ассетов, и модельки брались из внутренней базы и просто расставлялись на основе семантического анализа текста.

Прошло 7 лет.

И вот, в препродакшене уже орудуют ИИ-агенты.
Я процитирую, это слишком амбициозно:

"FilmAgent - новая мультиагентная система совместной работы на основе LLM, предназначенная для автоматизации и оптимизации процесса производства фильмов. FilmAgent моделирует ключевые роли съемочной группы - режиссеров, сценаристов, актеров и кинематографистов - и симулирует эффективные человеческие рабочие процессы. Процесс разделен на три этапа: планирование, написание сценария и киносъемка. На каждом этапе команда (агентов) съемочных групп обеспечивает итеративную обратную связь, таким образом проверяя промежуточные результаты и сокращая количество ошибок."


Короче, вместо того, чтобы усадить chatGPT и попросить его написать сценарий, они сделали рой агентов, которые пишут, критикуют, улучшают, причем не только сценарий, но и отыгрывание ролей и ракурсы камеры.

А потом берут Юнити и визуализируют это!!!

В принципе остается подать это в video2video и кино готово!

Я порылся в репозитарии - там, конечно, все совсем из китайских палок и говна и сишарпа, но можно подставлять свои llm и tts.

Кстати, на гитхабе примеры работы ИИ-скрипт-докторов, до и после. Поглядите, забавно.

Но мне нравится сам процесс. Симулировать агентами, тот бардак, который творится на площадке или пьянство при написании сценариев - бесценно. Все, как у людей.

https://filmagent.github.io/

@cgevent

Читать полностью…

Метаверсище и ИИще

Еще немного рубрики крутые подписчики.

Мне нравятся такие эксперименты. В принципе это похоже на классическое кожаное обучение - берем чью-то работу в 3Д или в концепте и просто воспроизводим ее.

Тут еще интереснее, @Ambition_AI сделали с нуля копию существующего и снятого на камеру рекламного ролика с помощью видеогенерации. Хороший способ проверить, можно ли генерить рекламу с помощью ИИ и посчитать расходы.

За референс взяли ролик авиасейлс "самурай". По нему сгенерировали общую сцену (промпт по визуалу из оригинального ролика), затем с помощью ранвея и его контроля камеры достали второй ракурс, который подходит на шот из ролика. Апскейл во флюксе и магнифике, перегоны и связка редукс + филл позволили добиться аутентичности персонажа и чуть чуть уйти от "ИИшности" лица. Анимация шотов в Клинг 1.6.

Такие упражнения полезны тем, что ты вынужден решать задачу попадания в рамки тех задания, а не просто восторженно или угрюмо наблюдать, куда вывезет непредсказуемая креативность видеогенератора.

Те, кто смотрят сериалы с переводом, быстро узнАют ролик. Чтобы сэкономить вам время в поисках статистического попугая, намекну, что ИИ лихо скреативил маски, которые 4 года назад мы надевали в самолетах. Все помнит, засранец. А мы-то уже и забыли.

@cgevent

Читать полностью…

Метаверсище и ИИще

К вопросу о том, где мы были полтора года назад

Сравнение Runway GEN2 и Google Veo 2.

Добавить тут нечего. Кроме вопроса: где бы будем в конце 2026?

Скрал у Саши

@cgevent

Читать полностью…

Метаверсище и ИИще

Ого, кто-то прикрутил ИИ к Unreal Engine.

Создание ассетов и сцен промптами.
Редактирование сцен промптами.
Blueprint assistant с рекомендациями, оптимизациями и даже natural language graph creation

Ludus.Blueprint is our AI-powered Blueprint assistant that helps with node suggestions, optimization recommendations, and natural language graph creation. Ludus.Chat enables text-to-scene conversion, allowing you to create and modify scenes using natural language commands.

На бесплатном плане только чат с документацией.

Enterprise customers get additional access to project-specific customizations and self-hosted solutions.

А еще у них планируется ассистент кода - Allow AI do the heavy lifting in your code development with our AI finetuned for Unreal Engine's C++ standard. Project-aware code generation, autocomplete, and multi-file editing. Available as an in-engine plugin and in your favorite IDE!

На первый взгляд выглядит как Cursor для UE5. Ну или UE для чайников.

Но никаких подробностей про LLM внутри я не нашел.

Странный проект.

https://ludusengine.com/

@cgevent

Читать полностью…

Метаверсище и ИИще

Tripo3D: обновили интерфейс своего 3D генератора и сделали его более удобным.

Теперь можно контролировать количество полигонов (Face Limit) в настройках генерации, для баланса между качеством и скоростью.

На вход можно подавать как текст (который можно улучшить), так и одну картинку или множество изображений.

Сайт — сгенерите первую модель получите 300 кредитов. Или вот код: USR9E6

Читать полностью…

Метаверсище и ИИще

Эпический фейл с лыжной маской.
Производство Apple Vision Pro замораживается.

Apple снизила производство Vision Pro прошлым летом, после того как накопила большой запас, которого, по ее мнению, должно было хватить до конца года. Теперь выясняется, что ни фига не продалось и эппле имеет достаточно единиц на складе, чтобы удовлетворить спрос на устройство в течение оставшегося срока службы до 2025 года.

По данным Марка Гурмана из Bloomberg, Apple продала менее 500 000 единиц Vision Pro с момента запуска. Хотя многие вернули устройство, столкнувшись с головной болью, проблемами со зрением, болью в шее и укачиванием, даже те, кто оставил его, по сообщениям, используют его не так часто, как ожидала Apple, в основном из-за отсутствия привлекательных приложений и игр - читай "киллер фичи".

Расходимся, метаверс от эппле не взлетел.

https://www.techspot.com/news/106170-apple-may-have-ended-production-vision-pro-headset.html

@cgevent

Читать полностью…

Метаверсище и ИИще

Вытащу из коментов рождественский троллинг.

Похоже, что это не регулярный опрос в конце года, а жесточайший троллинг от Альтмана в твитторе.

А троллит он Логана Килпатрика, Lead product for Google AI Studio.

Который написал вот такой твит в 00:45 25 декабря.
what would you like the Google AI Studio / Gemini team to build/fix in 2025?

Через три часа Альтман твитторнул:
what would you like openai to build/fix in 2025?

А мы-то подумали, что ему реально интересно...

@cgevent

Читать полностью…

Метаверсище и ИИще

Вот тут интереснейший твитторный тред от Сэма Альтмана.

Он спрашивает, "что мы можем улучшить в 2025"..

Во-первых, по его (излишне вежливым) ответам можно кое-что понять из планов.

Во-вторых, ему конечно, наваляли за Sora по самый твиттор.

Но он, на чистом глазу пишет: "тонны улучшений грядут в Sora".

Ждём-с.

https://x.com/sama/status/1871730475909419115

А вот когда его спрашивают про новый Dalle, он уклончиво пишет - hope to..

@cgevent

Читать полностью…

Метаверсище и ИИще

Нашел нормальный штатовский впн и поигрался с Сорой наконец под рождественский шумок.

У меня два промпта для тестов - дифчонки на пляже и ZZ-Top.

На ZZ-Top ругатся, я говорит переписала твой стыдный промпт, там контрафакт.

По качеству генераций - очень мало мыла, и наверное резче, чем у многих. Но по композиции, движению и построению кадра - не впечатлен. С анимацией персонажа - не задалось. Она шарахается от image2video. А уже если людей углядит, верещит как сумасшедшая.

Задумка со сторибордом - хорошая. Иметь таймлан в видеогенерациях - это must have я считаю.
Но реализация хромает. Сыро.

Пока Клинг и Минимакс - two loves

В общем жду доступа к Veo 2.

Кстати, все, что вы видите на сайте - это 480р, даже если вы выбирали 720. Так что не доверяйте глазам, а скачивайте.
Если скачивать, через правую кнопку+inspect - то скачивается сильно пожатый ролик в 480p, независимо от выбранного разрешения, а если через меню, то там похоже что-то типа апскейла или улучшайзинга идет - задержка довольно приличная.

Two men playing electric guitars with intense energy on stage, styled with long beards, sunglasses, and hats reminiscent of ZZ Top. They are in a rock concert setting with vibrant lighting and smoke effects in the background, emphasizing a powerful and dynamic performance. The atmosphere is energetic, with the guitarists wearing classic rock attire, surrounded by amplifiers and stage equipment, capturing the essence of classic rock music and ZZ Top's iconic look


@cgevent

Читать полностью…

Метаверсище и ИИще

Принёс вам видео из загнивающего твиттора. Просто посмотрите какая годнота! Чувак использует новый Gemini как персонального наставника по программированию расшарив нейронке свой экран. Все это голосом и с минимальной задержкой.

Будущее уже тут.

Попробовать так же можно тут (нужен гуглоаккаунт и айпишник США)

Читать полностью…

Метаверсище и ИИще

Мы тут часто дискутируем о новых интерфейсах AI, ведь если не только перепечатывать новости, но и генерить самому, появляется ощущение, каким должен быть AI-майндсет, чтобы генераторы перестали быть технологиями, а превращались в продукты.
Знакомые из AI Mindset запускают футуристичную лабораторию, где вместо чтения про AI вы начнете его реально использовать.

🤖 AI Mindset Lab — это 4 недели интенсивной практики, в которых вы свяжете знакомые инструменты в полноценные рабочие решения. Вот несколько примеров того, что создали участники предыдущей лабы:

ассистент для рефлексии: дневник настроения с голосовым вводом и анализом эмоциональных паттернов. stack: ChatGPT, SuperWhisper
smart meeting assistant: автоматическая транскрипция звонков и генерация саммари с отправкой в Telegram. stack: Zoom, Zapier, Whisper
умный поиск по базе знаний: интеллектуальный поиск и рефлексия на базе заметок из своей базы знаний. stack: Obsidian, Windserf, Cursor
ассистент для творческих задач: генерация идей, создание музыкальных аранжировок, генерация изображений и видео. stack: Midjourney, Suno, RunwayML и др.
языковой тренер: адаптивная система обучения с генерацией персональных упражнений. stack: Claude, local LLMs, Gemini
market research AI: автоматический сбор и анализ данных о рынке и конкурентах. stack: GPT, Perplexity, Consensus

Никакой воды и теории — только живая практика, реальные кейсы и взаимодействие в сообществе единомышленников. Вы научитесь не только использовать инструменты, но и мыслить как AI-исследователь.

🗓 старт: 21 января
📰 формат: 2-3 онлайн-встречи в неделю + практика

[подробнее о лаборатории]

по коду mindset скидка 10% до конца года

P.S. для тех, кто хочет глубже погрузиться в тему управления знаниями с AI, есть расширенный поток с фокусом на создание "второго мозга" в Obsidian + AI – AI Mindset [knowledge]

почитать о других проектах ребят можно на их канале @ai_mind_set

Читать полностью…
Subscribe to a channel