Telegram-канал cgevent - Метаверсище и ИИще: Unsorted

Метаверсище и ИИще

22 July 2025 15:57

А давайте поговорим за JSON-промпты для видеогенераторов.

Я пошерстил интернетик - нигде нет строгих научных обоснований, что именно JSON-промпты добавляют какую-то ценность или способствуют лучшему пониманию их, промптов.

Пока все похоже на модную шумиху в твитторе, где народ уже инфо-продает ядреную науку написания JSON-промптов для видео.

У меня несколько диванных мыслей.

Хорошо бы знать, на чем обучались видео-модели. Сторонники JSON-промптов клянутся, что в разметке было много кода, поэтому JSON-промпты так хороши. Неочевидно. В разметке было много текста, а вот какой он был - интернет не дает ответа.
(Кто ж откроет свои источники заскрапливания видео по всему интернету).

Всякие гайды от производителей моделей говорят, что надо структурно описывать промпт. Сцена, окружение, персонажи, ну и так далее. Никто не говорит о пользе JSON-промптов, а только о пользе структуры в описании.

Поэтому вполне вероятно, что JSON-промпты - это просто лишние токены-скобочки и запятые.

Другое дело, что написание именно JSON-промптов заставляет кожаного задуматься над структурой промпта, разложить на части, декомпозировать на подзадачи. И, возможно, именно это "обдумывание" и делает промпты лучше по содержанию (а не разметка сама по себе).

Ну и последнее, я давно тут приподвзвывал, что видео - это вам не картиночки, и что описать текстом N сущностей в кадре, у каждой из которых может быть свое время (своя жизнь), это вам не еще одно измерение плюсом к X,Y у картинки. Это плюс N измерений. И что промпты будут величиной с дом.

Ну и похоже кожаные запустили процесс вспять. Сначала они ушли от кода к естественному языку описания промптов. А теперь изобретают языки разметки промптов, ибо мозгов не хватает держать структуру длинного текста в голове.

Если мозгов не хватает, просто попросите ИИ написать вам промпты, проходили уже год назад. Он, ИИ, и в JSON и в маркдаун и в псевдо API вам напишет структурный текст. А вы уж дальше сами.

Кто-нибудь читал о реальной пользе JSON-промптов, кроме структурирования мозгов и улучшенной читаемости и редактируемости?

@cgevent