Новое sora-видео – я листая ленту даже не сразу понял, что это генерация ☕️
Теперь OpenAI каждый день openai/">постит в тикток кстати
Наткнулся на любопытное научное исследование из 2016 — в нем ученые решили проверить 200-летнюю теорию о юморе Шопенгауэра, пересказать эту теорию своими словами можно так: юмор это нарушение устоявшихся паттернов, чем неожиданнее то, что вы видите, слышите или возникшая мысль — тем вам смешнее (идеальное описание мемов).
В научной работе исследователи решили проверить не весь юмор, а конкретно «выдуманные слова» — то что часто смешит детей и тех кто учит другие языки (привет голландскому от говорящим на английском).
Теория была такая:
Если юмор, это неожиданное нарушение паттернов, то в выдуманных словах можно найти математическую последовательность которая будет гарантировать, что слова будут восприниматься как смешные.
Они придумали некую метрику которую назвали «энтропия Шеннона» — когда слово содержит звуки какие вы ожидаете услышать, у него низкая энтропия и наоборот. Таким методом они нагенерировали кучу слов которые в английском не существуют и пошли тестировать на людях.
Оказалось что, для англоязычных людей слова вроде:
retsits, tessina, heashes, anceste и тп, самые смешные, (весь список можете посмотреть в документе на странице 15).
Поскольку, не носителям языка сложно понять, что в тех словах смешного, я повторил эксперимент: выдрал с Claude 2.1 правила придумывания таких слов, и уже с GPT4 написал их по этим правилам, вот смешные (не путать с кринжом) слова на русском:
жыглыб
взбрыкшмыг
тщэвлоп
гыбздюль
швюрглеп
фюдлыквам
чмырьблюк
жвакрыпт
крыжмопль
плезгяфт
Arc браузер на iOS завез эту фичу о которой я недавно писал в канал – просто уменьшаете страницу до размера плитки и появляется короткая суммаризация страницы, довольно клево придумали (саммари пишется на языке системы)
Скачать на iOS тут
Сотрудник гугла вчера сказал, что они починят исторические генерации. Но пока проблема шире чем исторические картинки: Gemini отказывается делать гламурные картинки с белыми – это не разовый случай, их много
Погламурничали много веков и хватит, чертовы колонизаторы – и подумаешь что есть всякие там славяне и тп, белые же – значит привилегированные 🤔
Рецепт к шитшоу от гугла:
1) Злишь вообще всех издеваясь над историей
2) Злишь белых обращая слишком много акцента на цвет кожи, там где это не уместно
3) …
4) Profit
“Любая достаточно развитая технология неотличима от магии” (Артур Кларк)
Это — телефонный разговор с роботом на другом конце. Поражает скорость инференса всего этого на лету (800мс задержка до проигрывания ответа) и качество эмоций. Можно попробовать самому на их сайте (это действительно работает).
Приятно, что хорошая инженерия всё ещё может быть ключевой основой хорошего продукта.
Я почитал комментарии в соц сетях про Sora и если коротко — люди в ужасе.
На моей памяти уже третий раз за два года люди в ужасе от технологий — сначала в ужасе были художники, потому писатели, теперь люди работающие с видео.
И мне кажется «ужас в обществе» как явление, до этого века было сильно реже, общества успевали адаптироваться, к новому темпу мы явно не привыкли:
Печатный станок изобрели в 15 веке — люди того времени были напуганы, что теперь еретики будут печать свои неправильные тексты и это нанесет удар по церкви;
Паровой двигатель изобрели в начале 18 века — это был главный двигатель индустриальной революции, многие выступали против изобретения парового двигателя, потому что он «отнимает рабочие места»;
В 19 веке люди постоянно жили в страхе от этого вашего технологического прогресса что аж появились луддиты — сначала изобрели первую фотокамеру, люди были напуганы тем, что это нарушит приватность. Позже появился телеграф, который мог быть использован для спекулятивной торговли на рынках ценных бумаг и сильно изменил рынок доставки почты. Потом Эдисон придумал свою лампочку и куча людей стало выступать против электричества потому что «оно убивает», я даже в канал постил плакаты того времени. И конечно же железные дороги и автомобили — все это вызвало огромную критику из-за аварий, потерю рабочих мест, отказа от лошадей в транспорте (как вообще они посмели). Изобретение кинематографа вызвало огромную критику со стороны любителей театра. Также было с граммофонами — реальная музыка только в концертном зале, пропагандировали плакаты того времени.
В 20 веке не хватит никакого поста, но все равно многие изобретения которые попадали «в народ» и меняли рабочие места, случались не каждый год, они случались в 5-10 лет — открытие пластика, ядерной энергетики, ГМО, интернета, ТВ, телефонов — все это случалось как бы мягко, хоть и было страшно, у общества было время подстроится.
Этот век — это что-то новое, теперь открытия которые могут поменять жизнь каждого, оставить кого-то без работы, происходят по нескольку раз в год и это не оставляет никакого времени на адаптацию тем людям кто не понимают как технологический прогресс устроен, поэтому — многие в ужасе.
Короче мне кажется нам всем сильно повезло жить в это время, несмотря на все минусы типа войны и ренессанса диктатур, с точки зрения прогресса это самое удивительное время за всю историю.
И это еще AGI не изобрели, который просто каждый день начнет что-то открывать 🔄
Тихо мирно, без объявлений, GPT-4 Turbo дообучили на данных до декабря 2023-го года.
Проверить документацию можете сами тут.
Для меня самое интересное, что модель теперь (по идее) должна знать все свежие статьи по LLM, уметь писать промпты, знает разные трюки для оптимизации. Интересно было бы попробовать поиграться с этим, жаль пока времени нет.
Странно, что об этом никто нигде не пиcал, хотя модель как будто бы должна была выйти в январе, с месяц назад. В веб-архиве так и не смог загрузить копию, чтоб проверить.
Собрал новую порцию генераций SORA, я бы конечно многое отдал чтобы в бету напроситься 😢 хочу свой кино Сэм памани
Обратите внимание на руку парня на пляже
И еще про симуляцию миров:
Вот так SORA пытается воспроизвести вселенную Minecraft обучившись только на видео геймплея – и так сработает с любой игрой
Наконец-то можно будет поиграть в DOS версию «Поле чудес» в 3D
Лол, пока писал этот пост вышла техническая статья разбора SORA от OpenAI с заголовком:
«Модели генерации видео как симуляторы миров»
https://openai.com/research/video-generation-models-as-world-simulators
Если бы я родился 100 лет назад и увидел бы это видео, то я бы стал «адвентистом второго пришествия пластикового стула», серьезно вам говорю, представьте каково будет «уфологам» в эпоху генеративных видео.
Даже ошибки модели SORA интересно рассматривать
Просто посмотрите на это качество, о-ф-и-г-е-т-ь
У многих txt2video стартаперов FaceId сегодня не работает
Кажется, Шейхи пытаются задобрить Яна ЛеКуна— его фото вчера красовалось на 828-метровой башне Бурдж-Халифа в Дубае. Сейчас в заливе пытаются сделать большую ставку на развитие AI и привлечение высококлассных учёных в свои институты и компании. Кстати, такая реклама могла стоить от $100к.
Ян ЛеКун как-то отказался читать лекцию в Саудовской Аравии из-за своего атеизма. Но ребята не теряют надежды.
@ai_newz
CEO Nvidia говорит, что детей можно уже не учить программированию, так как за написание кода будет отвечать АИ и в будущем все будут программировать промптингом
Я, пожалуй, согласен – GPT4 уже закрывает все мои бытовые потребности по написанию кода, еще года 4 и системам автоматического написания кода можно будет доверять какие-то крупные части рабочих проектов, где таск из Jira попадает в работу сразу же после описания фичи / бага
Промпт инженеринг пока выглядит как самый ценный скилл во всем этом АИ-хаосе. Ну и по настоящему все эти АИ штуки раскрываются только если вы уже эксперт в какой-то теме, так что спрос на системно мыслящих программистов промпт инженеров никуда не денется
Давно мы про Midjourney v6 не вспомнили – мне вот интересно какая именно картинка приведет к регуляции и каким-то более серьезным вотермаркам ☕️ эта или будет прям конкретная которая скандал вызовет
Читать полностью…Давно про игры не писал:
Не знаю как у вас, но для меня игра этого года уже понятна – попаданцы в средневековье ☕️
Steam ссылка
Гугл, кажется, немного переборщил с инклюзивностью в своей версии чатгпт Gemini, точнее в фиче генерации картинок ☕️
Я думаю, люди которые это сделали, не очень понимают, что они больше вредят обществу, чем помогают – наша история баесная, но она какая есть, другой нет, любые попытки ее подменить и сделать «справедливой» вызывают гнев и отторжение у многих
В самой концепции инклюзивности я вижу много пользы, особенно для малых народов, но такая реализация тупо раздражает и долгосрочно вредит самому понятию «инклюзивность» – люди просто будут думать, что это какая-то тупая фигня когда рандомишь цвета кожи и гендеры в результатах, без вникания в детали
Sora: генерит ультрареалистичные видео
Will Smith: hold my beer
Норм все у мужика с самоиронией 😺
Новая подборка генераций видео SORA – в том видео где много разных сегментов и фокус со снегом, это не нарезка, это SORA может с одной генерации сразу сделать такую нарезку с кучи «ракурсов» ☕️
Читать полностью…Забавный случай из Канады:
>Местная авиакомпания запустила чатбота поддержки на сайте, который выдал клиенту неправильную информацию по политике возврата билета
>Чел купил билет и попытался его вернуть по условиям чатбота, авиакомпания отказалась
>Чел написал жалобу местному регулятору и начались слушания, где авиакомпания месяцами утверждала «что информация выданная чатботом может быть неточной и вообще это другое юрлицо» и «бот же выдал ссылку на страницу с политикой возврата, пользователь сам должен был проверить информацию на корректность и почитать ссылку» (🤔)
>По результату слушаний Air Canada заставили частично погасить челу возврат билета, примерно половину от стоимости всего билета в ~1200$)
Защита в стиле «Чатбот это самостоятельная сущность за которую мы не несем ответственность» не прошла, кто бы мог подумать. Это уже не первый такой случай в мире, где чатбот компании отвечает какой-то нонсенс, и регулятор дальше заставляет компанию исполнять «придуманные» условия – мне кажется это клевым, так как компания экономит на персонале такими чатботами, будут лучше понимать как языковые модели работают 😂
Закончу сегодняшние восторги по SORA двумя примерами img2vid из статьи выше – на входе ей подали картинки, а на выходе получили анимированные сцены ☕️
Так что скоро все наши любимые картинки и мемы оживут, не может не радовать
Пришла философская мысль на тему того, что гигантские модели способны сжимать целые вселенные в файл модели:
Это, конечно, не та Матрица которую мы видели в кино – но вполне себе вселенная которая существует в момент инференса модели и в тех сценах которые мы наблюдаем, в этой симуляции есть законы мира, какой-то лор и герои, и в теории, эта вселенная может существовать настолько долго, насколько люди в OpenAI держат генерацию видео включенной.
Это не значит, что в SORA возник «виртуальный мир», но представим что на дворе 2034 год и в мультимодальных генеративных моделях, помимо генерации видео есть генерация звука и сюжета. Я почему-то уверен, что если вы попросите такую модель сгенерировать офисного сотрудника – то в офисе будет какая-то жизнь, разговоры, а на экранах будут программы, которые возможно будет посмотреть и скорее всего люди в фоне будут делать что-то осмысленное (для желающих копнуть глубже эту мысль, можно почитать про Сложность Колмогорова
).
В этом же конечная цель, симулировать миры настолько качественно – насколько возможно, не строя их руками, как в геймдеве, а именно «обучая» на основе данных реального/выдуманных миров.
И как вы сами видите – скорость развития технологий только набирает обороты, так что вероятно та серия из «Черного зеркала» про местный Netflix станет вполне реальной.
Иронично будет если окажется, что мы все живем в симуляции, и в этой симуляции возник OpenAI который смог построить новые стимуляции и сервак где крутится наш мир начнет тормозить или что-то в таком духе ☕️
Видео сделано по запросу: Исторические кадры Калифорнии времен золотой лихорадки
OpenAI только что выпустили SORA— text2video модель
Генерация видео по текстовому описанию наступила!
Сегодня обещают статью
Промпт: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.
🟣https://openai.com/sora#research
Я не очень люблю маркетинг, но что я понял занимаясь бизнесом: построить успешный продукт без маркетинга разного типа – невозможно, есть редкие исключения, но это все же исключения.
С момента релиза GPT4 я пытаюсь в нашей компании автоматизировать все до чего доберутся руки (и все что этично: резюме читают люди, не роботы и тп) – поэтому я попробовал собрать автоматизацию генераций идей для двух важных бизнес направлений:
1) Креативная визуальная реклама
2) Гроухаки для роста бизнеса (это когда вы не богатый, но хитрый и ищите способы развивать продукт не заливая его бесконечными тратами на рекламу)
В этот раз я пошел чуть дальше чем просто «длинный промпт». Для каждого из GPT я собрал под сотню успешных, всемирно известных реклам или гроухак-кейсов, суммаризировал их в виде датасета и уже на основе этого датасета GPT пишет ответы.
У меня пока смешанные чувства про результаты: с одной стороны если сидеть и нажимать «перегенерировать» то можно неплохо набрасывать идеи, с другой стороны некоторые идеи все еще банальны, несмотря на датасет и большой промпт где я уже кричу капсом на GPT4, чтобы она не была банальной.
GPT и датасеты описаны на английском, но я специально прописал чтобы они отвечали на языке в котором к ним обращается юзер.
Ссылки:
Creative Ad Maker GPT
Growth Hacking Expert
Если кто-то удачно применит их в бизнесе, поделитесь пожалуйста 😐