Очередной вечной GTA-классики: img2img + Stable Diffusion + Controlnet, в этот раз особенно хорошо вышло
Автор
У 🌐 Kurzgesagt вышел классный ролик, в стиле lo-fi house длинной в час.
В ролике интересный концепт про историю планеты:
Каждую секунду видео проходит полтора миллиона лет, суммарно ролик покрывает 4.5 миллиарда лет, параллельно показывают как земля могла выглядеть в то время.
Приятно послушать в фоне, рекомендую:
https://youtu.be/S7TUe5w6RHo?si=lFYg8rcEcj7pEII3
Если помните, я делал похожий эксперимент недавно.
P.S. Больше не буду жаловаться на дожди, потому что на земле был период когда дожди шли миллионы лет не переставая ☕️
Чуть обновил гпт-апп, он теперь и мемы переводит на английский (другие языки Dalle 3 рисовать толком не может) и стиль не теряет ☕️
Читать полностью…Видеочат Omegle закрылся после 14 лет работы. Его автор пишет на сайте, что он создал проект, когда ему было 18 лет, а сейчас ему уже за 30 и он устал от бесконечной модерации и запросов спецслужб, плюс у него закончились деньги.
Напомним, что Omegle это сайт про разговор с анонимным незнакомцем - ты нажимал на кнопку (обязательно было наличие веб-камеры) и тебя переадресовывало на рандомного человека. Чаще всего там был какой-нибудь голый мужик, который дрочил на твоё изображение, но иногда были и адекватные люди. Omegle был таким аналогом ChatRoulette до его появления и часто попадал в разные мемы.
Автор чата пишет:
"В последние годы кажется, что весь мир стал более раздражительным. Возможно, это связано с пандемией или политическими разногласиями. Люди стали быстрее нападать и медленнее признавать человечность друг друга. Одним из аспектов этого стал постоянный шквал атак на сервисы для общения, в том числе и на Omegle".
Также он добавляет:
"Когда они говорят, что Omegle не должен существовать, они на самом деле говорят, что вы не должны иметь права пользоваться им; что вы не должны иметь права знакомиться со случайными новыми людьми в Интернете. Эта идея противоречит идеалам, которыми я дорожу - в частности, основополагающему принципу свободного общения. Когда вводятся ограничения для предотвращения преступлений, бремя этих ограничений не должно быть направлено на невинных или потенциальных жертв таких преступлений".
В любом случае, теперь Omegle закрыт из за финансовых и психологических проблем автора.
Ну, не чокаясь.
@zavtracast
Забавное с презентации OpenAI: если дообучить модель на сообщениях из Slack стартапа, то ассистент может отказаться что-то делать сейчас и ответит что сделает это завтра ☕️
Читать полностью…Новая модель:
— контекст длиннее. 128K токенов (365 страниц обычной книги)
— модель более аккуратна при работе с длинным текстом, не теряет то, что было в серединке
— фича для разрабов: можно заставить модель писать ответы в JSON-формате
— можно вызывать несколько функций за раз
— можно указать seed генерации, чтобы получать воспроизводимость
— скоро добавят logprobs в API
— Retrieval прямо из коробки, можно загружать документы на платформу и они будут подтягиватсья (F стартапам chatWithPDF)
— Теперь модель знает события не до сентября 2021го, а апреля 2023го
— Эта новая модель принимает картинки на вход через API
— DALLE-3 + text-to-speech (6 голосов) сегодня появятся в API
— Для GPT-4 появится файнтюнинг сегодня (но на узкую выборку пользователей)
— Custom Models: программа плотной работыт инженеров OpenAI с вашей компанией, чтобы помочь адаптировать тренировку под ваши проблемы
ЦЕНА НА GPT-4-TURBO (Sam говорит, что эта модель ещё и умнее GPT-4) уменьшена в 3 раза для промпта и в 2 раза для генерации!
Обещают скоро ещё больше ускорить GPT-4 Turbo
Свершилось, txt2img нейронку добавили в Paint под Windows 11 ☕️
Масс адаптация прошла успешно
Вышло новое исследование по промпт-инжинеригу LLM:
Если языковую модель попросить что-то сделать и добавить эмоциональной окраски, например, «моя карьера зависит от твоего ответа» или «тебе лучше бы быть уверенным в ответе», то генерации модели становятся статистически значимо лучше (для gpt4 на пару %, но в целом, по разным моделям, ответы лучше на ~10%).
Я обновил свой личный главный промпт для GPT4 этим хаком, теперь он выглядит так:Let’s combine our _ command and clear thinking to quickly and accurately decipher the answer in the step-by-step approach. This is very important to my career.
решаете, например программирование и тп.
Где _ индустрия задачи которую вы
Пользуйтесь ☕️
Тут в Twitter умелец запилил игру «Angry Pumpkins 🎃» по мотивам классической Angry Birds, но к Хэллоуину. Фишка в том, что всю работу делали генеративные модели. GPT-4 писала код, а Midjourney / DALLE рисовали графику. Всего 600 строк кода, а там даже редактор уровня есть — можно отстроить своё гнездо и попытаться его разбомбить!
Комментарий автора проекта:
— Должен признаться, я искренне потрясен. Я верю, что мы живем в исторический момент, который до сих пор видели только в научно-фантастических фильмах. Это эпоха новых рабочих процессов, позволяющих создавать что угодно, используя только естественный язык, и это изменит мир, каким мы его знаем.
Мой комментарий:
Я не смог быстро понять, есть ли у автора опыт в программировании, но как мне кажется это не важно. У наших детей будет GPT-N+1, которая будет куда реже делать ошибки, и схватывать смысл слов на лету. Можно будет уже со средней школы начать экспериментировать не только с наколеночными играми, но и полноценными оригинальными проектами. В ближайшее время нейронки не заменят игроделов, но позволят новым людям вкатываться куда быстрее, да ещё и на дизайне/арте экономить 👀
Играть тут (работает только в браузере компьютера, без смартфонов)
Прочитать детальный гайд от автора тут (внутри промпты для генерации графики)
Наткнулся на любопытную карту – если терраформировать Марс, и на нем будет 71% поверхности воды (также как и на земле), то получится такая карта Марса
Читать полностью…Наткнулся на клевый сервис который позволяет найти кусок видео на ютубе по какому-то слову, пригодится для изучения иностранных языков и работы над произношением (ну или просто свою фамилию поискать 🌚).
Поддерживает кучу языков, и бесплатный:
https://youglish.com/
На последней презентации Apple показала как будут выглядеть ААА-игры на новых iPhone 15+, то есть полноценные компьютерные игры на телефоне.
И вот час назад вышла первая такая игра под iOS – Resident Evil Village (на ПК игра вышла в 2021)
Я скачал и записал пару моментов (из-за записи экрана FPS падает, но если прекратить то играбельно)
И это прямо вау – полноценная консольная графика, осталось вывести на AppleTV и подключить геймпад, и ничем не отличить от консоле-гейминга.
Без геймпада играть не очень удобно, но можно – появляется просто наэкранные кнопки
На всякий случай проверил: Работает без интернета, так что будет чем в самолете заняться – подпрыгивать на месте от страха
Помните батискаф который этим лет затонул с людьми на борту?
Наткнулся на видео, где показано как быстро (в теории) люди скончались – по идее быстрее чем мозг успел бы среагировать болью.
При этом, даже нашли человеческие останки 4 месяца спустя и передали на анализ в лабораторию
Слева "Мячик с мордочкой" на который были способны лучшие нейронки в 2018 году (biggan)
Справа, то на что способны они сейчас – мне будет нехватать крипи-мордашек
Все больше видео с полей про КиберТрак появляется. Вот, например, внедорожник решили испытать вне дороги.
@zavtracast
OpenAI выкатил GPT's и я собрал небольшой апп на для режима img2img в Dalle 3:
Заливаете картинку в апп и он вам возвращает пересозданную, удобно чтобы старые фотошопы "оживлять" или просто пере-придумывать существующее картинки.
Ссылка:
https://chat.openai.com/g/g-SIE5101qP-img2img
(Первая картинка – оригинал, вторая – новая, сделанная Dalle 3)
Не могу перестать играться с Dalle 3: вот вам новое, ночное, нейро-фото-биеннале.
Прошлое тут. Часть I
Власть в РФ:
– Давай, программировай, уважаемый
Та же власть:
– Но голого путина не программировай
😂😂😂
Серьезно, разработчики в обход всех проблем из-за 5d-геостратега пытаются что-то делать в ML индустрии, и их при этом еще и набутыливать пытаются – лол, удачи с ресечем в такой атмосфере
Чувак скормил каждый кадр футбольной трансляции gpt4-vision и попросил сгенерировать повествование.
Кажется, с ростом мощностей (когда все это в риалтайме крутить можно будет) спортивные дикторы тоже пойдут на рынок луком торговать
OpenAI DevDay - ждем новых анонсов по моделям и API
Через 16 минут OpenAI будет проводить свою первую конференцию для девелоперов. Ходит много слухов о том, что будут представлять. Возможно появится GPT4-TURBO - более быстрая и дешевая версия GPT4. А так же ожидается куча новостей по поводу плагинов, интеграции ChatGPT с разными приложениями и маркетплейс чатботов на базе ChatGPT.
Некоторые даже сравнивают эту конфу с тем моментом, когда Джобс анонсировал первый Iphone. Я, честно, не верю, что это будет что-то настолько же большое, но посмотреть интересно.
Смотрим стрим на YouTube
@ai_newz
Наткнулся тут на новые автоматы для содовой которые CocaCola устанавливает в кинотеатрах в Амстере – там можно теперь заказать фанту, без сахара и БЕЗ пузырьков, то есть это просто желтая холодная водичка ☕️
Они так чай изобретут через пару лет, просто подогреть воду и готово
Интересное наблюдение:
В информационной войне между Палестиной и Израилем начали применять txt2img.
Выше, скриншот с Adobe Firefly, на второй – эта же первая картинка у кучи медиа-сайтов, на третьей – посчитайте количество пальцев у ребенка, там вообще мрачная сцена изображена и под ~100k просмотров в твиттере.
Не думаю, что с этим что-то можно сделать: локальные модели вообще не ограничить, даже законами – так что, считаем пальцы, рассматриваем детали фото, и проверяем источники фотографий, только так можно не поверить в фейк в 2023 году 🥲
Ну, и видимо ждем новой регуляции, после какого-то крупного происшествия из-за фейков.
🌐 YT | 🌐 Spotify | 🎵 Apple Music
The Beatles опять в чартах: вышла последняя «новая» песня «Now and Then», спасибо AI.
Песня завершает серию работ, написанных Ленноном, которые Йоко Оно передала Полу Маккартни в 1994 году. Две предыдущие песни из этих записей, «Free As a Bird» и «Real Love», стали хитами в Великобритании.
«Now and Then» изначально была заброшена из-за трудностей с обработкой вокала Джона Леннона из демо-кассеты, но теперь песню выпустили с использованием AI улучшений.
Маккартни и Ринго Старр записали новые части для песни, в то время как Джордж Харрисон участвует гитарными партиями из сессии 1995 года. Эта настоящая песня записанная сквозь время 🫶
Вместе с песней сделали фильм о создании, и видеоклип, срежиссированный Питером Джексоном (должен скоро выйти)
Текст песни про глубокие чувства и привязанность к любимому человеку. Автор (Леннон) признается в своей любви и зависимости от другого человека, говоря, что все его успехи и счастье связаны именно с этим человеком.
В припеве выражается ностальгия и желание вновь быть вместе, несмотря на возможные разлуки. Автор не хочет терять свою любовь, но также не хочет путать ее или причинять страдания.
Если коротко: песня про любовь, тоску по отсутствующему объекту обожания и желание вновь обрести счастье вместе.
Очень символично для последней песни The Beatles
Запускать новый продукт в 2023:
— Расписал новый продукт с GPT4 и то какие задачи он будет решать
— Провел юзер интервью с GPT4, где модель прикинулась домохозяйкой из Техаса (потому что потенциально ЦА)
— Скормил это же интервью в Dalle 3 чтобы сделать лого проекта, с промптом в стиле: «Logo fusing minimalism with innovation, intended for startups, colored in white on black
». Сижу теперь выбираю лого нажимая «Regenerate»
— Скормил GTP4V интерфейсы, и попросил оценить их понятность для «не технической аудитории»
и тп и тд.
Я как менеджер по продукту не понимаю что я буду делать в ~2027, дейлики проводить?
@Denis
Что особенно мне нравится в нашей индустрии, так это баги: ну где еще вам утром пользователь напишет про баг, что один из наших продуктов (Uncrop) дорисовал животных которые делают природу? ☕️
Читать полностью…Любопытное продолжение идеи адблокеров:
С развитием больших языковых моделей теперь можно довольно неплохо анализировать содержание контента на разные показатели, например, на:
— попытки объективизации какой-либо группы;
— потенциальные попытки распространения дезинформации;
— clickbait;
— политически ангажированный контент;
— религиозный контент.
И тп и тд.
Кто-то запилил Chrome плагин, который анализирует контент части страницы на соответствие этим правилам (или тем, которые пользователю не нравятся), и этот контент удаляется если определится.
Я не сторонник жизни в пузыре (хотя сам бы и NFT скрыл), но мне интересно появится ли такой llm-adblock когда-нибудь как стандартная фича браузеров вроде firefox, мне кажется — вполне реально.
Ссылка:
https://github.com/devxpy/anti-chatgpt
На скрине пример отключения политики – лично я бы это правило никогда бы не активировал, мне интересна политическая жизнь мира (даже если потом хочется плакать сидя на полу в холодном душе)
Недавно вышла любопытная работа про закрытую модель TimeGPT. В пейпере шла речь, про то, как разработчики попробовали применить архитектуру трансформеров к «предсказанию серий данных». Если совсем по простому — то обучили «ChatGPT» на разных исторических данных: торгов, курсов, показателей счетчиков и т.п.
Доступ к модели закрытый, но я связался с авторами и напросился на закрытую бету — ничего лучше чем протестировать модель на курсе рубля к доллару я не придумал, так что в посте пара прогнозов (которые, конечно, нельзя считать финансовыми рекомендациями — нейронные сети любят и галлюцинировать и выдумывать, да и я не финансист совершенно, моей задачей был тест TimeGPT-1).
Датасет делал по их документации, и учел в нем денежный объем (M2) и ключевую ставку по годам с 2013-го года.
В итоге получил два прогноза:
→ Умеренный — это если текущий денежный объем и ключевая ставка не будет меняться весь следующий год (я тупо скопировал их за прошлый месяц и до конца года)
→ Учтенный — прогноз, где учтены показатели M2 и ключевой ставки, но тоже спрогнозированы они той же моделью, отдельными запросами.
В итоге:
— В январе 2025 года за 1$ США будут просить или 105.76 рублей или 157.58 рублей, по мнению TimeGPT-1
— В январе 2025 года ключевая ставка ЦБ будет или ~10% или ~17.5%, по мнению TimeGPT-1
🥰🛍
Естественно, модель не может учитывать всякие там внешние факторы, но я оценил как она сама на март 2024 назначила значительной скачок курса.
P.S. Пока готовил датасеты проклял все, этот тест занял у меня вечеров 5, лучше бы ей не галлюцинировать. Курсы взяты на начало каждого нового месяца.
P.P.S. Модель также можно файнтюнить прямо у них (работает быстро), но мне кажется в этой задаче это не нужно