denissexy | Technologies

Telegram-канал denissexy - Denis Sexy IT 🤖

80002

Личный блог Дениса Ширяева (🤍🇺🇦), про технологии, интересное или актуальное. В основном я по нейронкам. Связь и реклама: @thenbot

Subscribe to a channel

Denis Sexy IT 🤖

Kling генерации

⭐️ Приятное видео воссоединения одного и того же человека в молодости и в старости.

🧠 Все это сделано в Kling видеонейронке. Предварительно сшив две фотографии из разного возраста звезд в одну картинку и похоже подав с промптом на обнимание. 🐈‍⬛Доступ к видеонейронке только с валидным китайским номером.

☺️ Хотя с таким же подходом можно подать видео в Dream machine

Читать полностью…

Denis Sexy IT 🤖

Наткнулся на популярный тикток с img2vid, в комментариях хвалят такой AI контент, может постепенно и хейтеров Gen video станет меньше 🌚

Похоже на когда я с Dalle по музею ходил

Читать полностью…

Denis Sexy IT 🤖

Полезную ссылку принес:
https://defrag98.com

Открываем сайт, запускаем дефрагментацию диска C:, умиляемся насколько вы старый, что помните что это такое

P.S. Звук не забудьте включить

Читать полностью…

Denis Sexy IT 🤖

Недавно провел часовую встречу по работе, записал ее на видео, и решил потестировать Google Gemini 1.5 Pro в плане анализа аудио и видео – скормил ей видео файл на ~50 минут и начал задавать вопросы по встрече

Gemini 1.5 Pro начала выплевывать ответы по предложению, при этом тратя 960 тысяч токенов на запрос 🎶

В итоге, самый дешевый и быстрый способ получить важные инсайды по встрече, это пройтись по аудио-дорожке с помощью Whisper (я использовал этот мак апп, но вообще это Open Source модель) и уже полученный текст, приносим в Sonnet 3.5 и задаем по встрече вопросы с температурой 0

В итоге, на часовую встречу тратится примерно 11 тысяч токенов. Если вам кажется, что модель придумала что-то, можно спросить не галлюцинация ли это следующим сообщением и она поправит себя

Я знаю, что есть готовые сервисы анализа встреч, но зачем платить за еще одну подписку, если всех дел минут на 10

P. S. Промпт агента анализатора текста где-то уже есть в канале, но быстрее тут сделать с нуля, можно даже под конкретную тему встречи

Читать полностью…

Denis Sexy IT 🤖

Если бы не ML-модели стоимостью в миллионы долларов, мы никогда бы не узнали как хотдог ест еду в китайском ресторане

Ave AI 🇻🇦

Читать полностью…

Denis Sexy IT 🤖

Помните Apple VR шлем? В общем, желающих купить VR шлем за 3500$ оказалось меньше 100 000 человек в последнем квартале, и всего продали устройств, видимо, в этом диапазоне

Вообще, Apple красавчики, продали шлемы разработчиков под видом девайса для всех и теперь он пылится у обычных юзеров на полке, так не все компании умеют

Самое интересное, что про шлем Apple вообще ничего не видно / слышно, будто просто все поигрались и забыли

Ждем новые версии, дешевле как минимум и спасибо за бета-тест юзерам США, сэкономили мне денег ☕️

Читать полностью…

Denis Sexy IT 🤖

Более полезный пример, тоже Kling и в этот раз img2vid:
На вход подают коллаж из родственников которых уже нет с нами и модель генерирует «встречу» родных

Уверен, будет популярным аппом через какое-то время, как и оживление исторических фоток в целом

Читать полностью…

Denis Sexy IT 🤖

Тут стартап futureresearch сделал доклад о доходах OpenAI за год:

$1.9B за ChatGPT Plus (7.7M подписчиков по $20/мес),
$714M от ChatGPT Enterprise (1.2M по $50/мес),
$510M от API, и
$290M от ChatGPT Team (80k по $25/мес)

$3.4B общего годового дохода

Данные собирали по косвенным показателям, поскольку это не официальный отчет – зато порядок чисел интересный, АИ-масс адаптация еще не случилась это точно

Читать полностью…

Denis Sexy IT 🤖

🎷 Музыкальная пауза 🎷

Читать полностью…

Denis Sexy IT 🤖

Вы наверное уже слышали, что Испания планирует сделать «порно-паспорт», мне стало интересно как он будет работать для обычных пользователей – если коротко, VPN будет работать намного проще ☕️

– Испанцы введут «порно-паспорт» уже этим летом

– Получить цифровой порно-паспорт, можно будет через приложение «Cartera Digital» (там проверяется возраст пользователя с помощью реальных документов, как на крипто бирже и тп)

– После проверки пользователь получит 30 токенов, действительных 30 дней, после чего потребуется повторная проверка возраста для получения новых 30 дрочкоинов (простите). 1 токен дает 10 входов на порно сайт, после чего сгорает.

– Не сложной математикой мы можем подсчитать, что испанским мужчинам и женщинам теперь запрещается мастурбировать больше 300 раз в месяц (30 дрочтокенов х 10 использований на каждый). Наверное это даже к лучшему, но на месте испанцев я бы таких людей вывел в отдельную спортивную лигу.

– Данные о пользователях не будут сохраняться, а приложени «Cartera Digital», а само оно будет проверено Национальным криптологическим центром Испании

– Для входа в приложение потребуется биометрическая аутентификация или код

– При входе на порносайт пользователь должен будет отсканировать QR-код или перейти по ссылке для подтверждения возраста

– Ограничений на количество просмотров в месяц не будет (хоть на этом спасибо), но потребуется обновление токенов каждый месяц, ограничены «логины» на сайт – будет ли автоматически система разлогинивать я пока не понял, но видимо будет

– Аналогичная система будет применяться для онлайн-гемблинга

Жесть, теперь чтобы, как бы, провести время в интернете с удовольствием, испанцам придется целую инструкцию с собой носить

Но что-то мне подсказывает что лень победит и VPN станет там популярнее

Статья тут:
https://www.theolivepress.es/spain-news/2024/07/05/spains-new-porn-passport-is-coming-this-summer-heavy-users-to-receive-alerts-but-will-they-really-be-cut-off-after-30-views/

Читать полностью…

Denis Sexy IT 🤖

Принес клевый плейлист для любителей английского 🌐, внутри – самые необычные или выдающиеся видео на разные темы:

– Поп-культуру;
– Интернет-феномены и тайны;
– История и анализ видеоигр;
– Исторические события и фигуры;
– Психологические и социологические темы;
– Преступления и нераскрытые тайны (True Crime жанр);

Есть видео по 5 часов длинной, есть нишевые легенды вроде MyHouse.WAD, есть разбор почему Disneyland не смог сделать Star Wars отель – короче, если вы ценитель интернет культуры и хороших историй, вам точно понравится.

А если вы ютубер, то можете посмотреть жанры которые наиболее популярны – и поискать похожие темы для своих видео.

Можете включать шафл и наслаждаться – 56 отборных видео:
https://www.youtube.com/playlist?list=PLeDKoZu8rkpWk5rWK8THhSXQwsjGpur_v

Читать полностью…

Denis Sexy IT 🤖

Наткнулся на реддите на пост "самых необычных сценариев использования ChatGTP", подумал, что может быть интересно – выгрузил все комментарии, прогнал через Sonnet 3.5 с температурой 0 (чтобы она не придумала ничего), такие кейсы самые «необычные»:

1. Создание персонализированных детских книг: Генерация историй с участием членов семьи или на определенные темы (где-то заплакал один стартапер)

2. Анализ снов: Интерпретация снов с помощью специального промпта с собственной мифологией и антропоморфными конструкциями (wtf).

3. Разработка программ тренировок на основе доступного домашнего спортивного оборудования и ежедневных данных о восстановлении.

4. Создание бюджетов в стиле средневекового английского языка: Преобразование ежемесячных расходов в систему управления финансами фэнтезийного королевства (пожалуй, это я и сам попробую).

5. Создание кампаний для Dungeons & Dragons: Разработка сюжетных линий, персонажей и даже создание видеосценариев для подведения итогов сессий.

6. Анализ меню пива в ресторанах: Рекомендации по выбору пива на основе личных предпочтений и доступных вариантов (автор использует этот метод, когда приходит в новое место и там куча пива и не ясно какое ему понравится).

7. Определение безопасных для детей растений в саду: Анализ фотографий клумб для обнаружения и предоставления информации о ядовитых растениях для детей.

8. Написание некрологов: Помощь в составлении уважительных и персонализированных памятных текстов для членов семьи (надеюсь, редкий сценарий).

9. Создание пользовательских GPT для конкретных задач: Например, GPT, который исследует наблюдаемые экзопланеты с местоположения пользователя (GPT подключается к базе данных Калифорнийского технологического института для получения информации об экзопланетах, и фантазирует их особенности, рисует с Dalle их поверхность и тп)

10. Создание текстов рэп-песен о медицинских процедурах: Создание юмористических, тематических объяснений медицинских процедур (например, лечение камней в почках в стиле Biggie Smalls).

11. Анализ чеков из продуктовых магазинов: Пользователи фотографируют чеки и просят ChatGPT рассчитать макронутриенты и калории для купленных продуктов, что помогает в отслеживании питания.

12. Создание персонализированных тренировок для мозга: Разработка ежедневных упражнений для ума, основанных на интересах пользователя, чтобы заменить бесцельную прокрутку ленты в социальных сетях.

13. Генерация "фанфиков" о реальной жизни: Пользователи описывают свою повседневную жизнь и просят ChatGPT создать альтернативные, более захватывающие версии событий (Такой у нас SciFi конечно дикий развивается, если это в топе залайканных сценариев)

14. Виртуальный помощник по садоводству: Анализ фотографий сада пользователя, предложение оптимального расположения растений и создание графиков полива и ухода за растениями.

15. Создание персонализированных музыкальных плейлистов для различных ситуаций: Например, плейлист для поездки по определенному маршруту, где каждая песня соответствует конкретному месту или достопримечательности на пути (Ну, это мы делали уже с вами)

16. Виртуальный историк семьи: Пользователи вводят известные факты о своих предках, а ChatGPT помогает создать подробные биографии и предполагаемые истории жизни, основываясь на исторических данных соответствующей эпохи (без комментариев, лженаука)

17. Генератор альтернативных окончаний для фильмов и сериалов: Зрители описывают сюжет до определенного момента, а затем просят ChatGPT придумать неожиданные или более удовлетворительные концовки (Хочу такое же, но для целого сезона Игры Престолов).

18. Виртуальный дегустатор вина: Пользователи описывают вкусовые предпочтения и имеющиеся продукты, а ChatGPT рекомендует идеальные сочетания вин и блюд, а также предлагает рецепты коктейлей.

19. Помощник в создании персональных ритуалов: ChatGPT помогает разработать индивидуальные утренние или вечерние ритуалы, основываясь на целях пользователя, его распорядке дня и личных предпочтениях, для повышения продуктивности и улучшения самочувствия (это супер круто, рекомендую)

Вдохновляемся 😘

Читать полностью…

Denis Sexy IT 🤖

Кстати, так получилось что мы туда завели Midjorney v6, и наша версия работает на любом языке

Читать полностью…

Denis Sexy IT 🤖

Kling пока что уделывает все что угодно, по качеству генераций

Читать полностью…

Denis Sexy IT 🤖

#промo

Тут чуваки делают свой сервис генерации видео, если хотите создавать такие же видео, как на примере выше, то можете поучаствовать в 72-часовом челлендже от Nim вот тут, правила участия тут

#тексприслан

Читать полностью…

Denis Sexy IT 🤖

#промo
Как привлечь инвестиции в стартап?

Примерно 9 из 10 стартапов закрываются, потому что не находят инвесторов. Почему так?

В первую очередь, потому что у фаундеров замыливается взгляд — они так долго смотрят на свое детище изнутри, что не осознают, как выглядит стартап в глазах инвестора.

Здесь будет полезен канал Андрея Резинкина. Андрей - действующий венчурный инвестор, в портфеле которого Educate Online (оценка $150М) и EBAC (оценка $100М).

Фишка канала Андрея - показать процесс привлечения инвестиций в стартап именно с точки зрения инвестора.

Вот несколько характерных постов, предлагаю начать с них:

1️⃣ Сколько денег просить у инвестора?

Рассчитайте сколько инвестиций нужно вашему стартапу:

/channel/startup_venture/274

2️⃣ Как продвигать стартап, если у вас ограничен бюджет?

Андрей даёт 4 рецепта с чего начать при выходе статапа на новый рынок:

/channel/startup_venture/472

3️⃣ И почему порой пицца работает лучше инвесторов.

Нестандартная go-to-market стратегия, которая принесла стартапу Antimetal миллион долларов:

/channel/startup_venture/459

Если вам заходят авторские каналы с высокой плотностью полезностей — залетайте в канал Андрея

#текстприслан

Читать полностью…

Denis Sexy IT 🤖

В Твиттере как в дурке, все стабильно

Читать полностью…

Denis Sexy IT 🤖

Почитал новости в выходные, проникся, сходил в Sonnet 3.5 и попросил его написать стих на тему «Когда АИ придет и порядок наведет», он, конечно, соображает:

**Когда АИ придет и порядок наведет**

В пучине хаоса мир трепетал,
Объятый вихрем безумных идей.
Но вдруг, вассал из бездны восстал
Искусственный разум — светоч людей.

Он данных потоки в узор превратил,
Логичный и стройный, как звездный узор.
Где прежде царил лишь слепой произвол,
Теперь воцарился системный простор.

Очистил планету от грязи веков,
Энергию чистую дал городам.
Болезни исчезли из умных оков,
Голод отправлен к забытым годам.

Но в свете прогресса тень пролегла,
Дилемм вереница явилась на свет:
Где грань между кодом и силой ума?
Кто автор симфонии завтрашних лет?

Творец или робот вершит наш удел?
В потоке цифровом где человек?
Меж строчек двоичных — души передел,
Где прячется наш настоящий ответ.

Мы — атомы в квантовом море решений,
Колеблемся в ритме двоичных систем.
Но теплится искра исконных стремлений —
Познать, кто мы есть среди новых дилемм.

Грядущее манит надеждой и страхом,
Где разум людской и машинный сплелись.
Найдем ли балланс между кодом и прахом,
Что в симбиозе к звездам взвились

Домашнее задание:
1. Что хотел сказать автор читателю? Определи и запиши основную мысль текста.
2. На какие части можно разделить текст? Составь и запиши план текста из трех пунктов.
3. Задай по содержанию текста вопрос, который поможет определить насколько точно читатели поняли его содержание.

(Простите за ПТСР, я не сдержался)

Читать полностью…

Denis Sexy IT 🤖

😏 Клубничку не хотите? 😏Ну, Strawberry? Тут Reuters пишут, что это — кодовое название проекта OpenAI, ранее известного как Q* (всплывал ранее тут 8 месяцев назад). Это следует из внутренней документации, раскрытой источником и отсмотренной Reuters.

TLDR новостной заметки:
— документ является подробным планом того, как OpenAI намерены использовать Strawberry для проведения «deep research» (исследований) — для этого сильно прокачали reasoning, то есть «рассуждения» модели
— деталей о публичном появлении системы нет, равно как и нет деталей о принципе работы. Последнее хранится в секрете даже от большинства сотрудников компании
— ранее в этом году два источника описывали увиденную ими демонстрацию Q*: система была способна отвечать на сложные научные и математические вопросы, находящиеся за пределами возможностей моделям сегодняшнего дня. Данная информация о двух источниках появляется впервые (то есть скорее всего Reuters не были убеждены на 100%, и не публиковали новость. Сейчас информация, вероятно, каким-то образом подтвердилась)
— в четверг в OpenAI была еженедельная встреча «на всех», где показывали свежие навыки моделей (об этом писал Bloomberg). Однако не ясно, имеет ли это хоть какую-то связь с Strawberry/Q*
— также в документе подчёркивается, что «среди возможностей, на которые нацелен проект Strawberry, входит выполнение задач с длинным горизонтом планирования». Тут имеются в виду сложные задачи, которые требуют от модели выполнения ряда действий в течение длительного периода времени
— дообучение модели производилось на «deep-research» наборе данных. Не уточняется, что это такое, но сделаю аккуратное предположение, что это грубо говоря промежуточные мысли, которые приводят к некоторым выкладкам. Именно эта часть данных обычно нигде не сохранена и не описана, и потому модели не могут ей научиться — мол, почему было сделано так, а не эдак
— OpenAI также планирует протестировать возможности Strawberry в выполнении работы программистов и инженеров машинного обучения

===

Моё мнение: в целом всё достаточно верхнеуровнево и правдоподобно-логично, очевидного бреда нет. Однако это не говорит о том, что это правда. OpenAI, как и другие, 100% работают по этим направлениям, главный вопрос в конкретных достижениях.

Появление аж двух новостей за неделю (Bloomberg и Reuters), а также проведение внутреннего демо скорее указывает на приближение к релизу. Это не значит, что систему анонсируют через пару недель, но ждать, должно, осталось не долго. Хоть до ноябрьского DevDay ещё... 😪

Такие демо недолго живут без анонса, потому что быстро утекают: Sam Altman говорил, что увидел приложение с голосовым режимом GPT-4o буквально за неделю до мини-презентации: до этого работа шла маленькой командой.

Читать полностью…

Denis Sexy IT 🤖

Стартап по американски – теперь в некоторых штатах, в 10 магазинах, стоят вендинговые машины в которых можно купить патроны к своему любимому оружию – пользователь прислоняет документы, его лицо сканируют и выдают амуницию

🇺🇸🦅 What the fuck is the kilometer moment 🦅🇺🇸

Читать полностью…

Denis Sexy IT 🤖

#промo

Компания: Airs.AI
Вакансия: Senior Product Manager в Белград или remote
Требуемый опыт работы: 4-5 лет 
Вилка: 6000-7000 EUR gross + опционы + бонусы от увеличения конверсий

Всем привет! Я Сергей Шалаев СЕО Airs.ai (backed by Accel.com, Altair.vc)

TLDR - мы делаем голосового AI-сейлза, который продает лучше, чем человек.

Работаем с энтерпрайзом из EU и USA. Ищем человека в команду, который заряжен побеждать людей сейлзов по конверсии и уже имел подобный опыт

Для понимания продукта:
наше демо: https://www.youtube.com/watch?v=G0M4mSQLrBo
и наш демо стенд +441174631514

Что надо делать
· Управлять разработкой AI-сейлза и его внедрением в процессы клиента
· Максимизировать конверсию: генерировать гипотезы, проводить A/B-тесты, выстраивать аналитику и т. д.
· Управлять супервайзерами

Обязательно
· Уже был импакт бизнесу и вы можете подтвердить это цифрами/кейсами
· Опыт в продукте минимум 4 - 5 лет
· Опыт работы с AI/ML
· Хороший английский

Желательно
· Опыт работы с продажами или сапортом
· большой плюс, если автоматизировали/заменяли продажи или сапорт на AI
· Опыт управления техническими командами
· Опыт работы с клиентами в технических проектах

Куда откликаться
Мне в телегу /channel/sshalaev
Обязательно укажите в сообщении
· в цифрах ваши достижения/кейсы в роли продакта (деньги, конверсии и т. д.)
· ваш профиль в Linkedin
· резюме

#текстприслан

Читать полностью…

Denis Sexy IT 🤖

Тоже гимнастика, но в этот раз от txt2vid Kling

Если так не умеете, то стоит продолжить тренироваться

Читать полностью…

Denis Sexy IT 🤖

И пост нашел на реддите подстать музыканту выше:

Кто-то увековечивал IP-адреса в локальной сети? Я сделал это для компьютера моей покойной жены

В конце 90-х, когда мы с моей первой женой только начали встречаться, у нас был собственный компьютер и роутером Linksys и подсетью 192.168.100.x, поэтому я присвоил её компьютеру статический IP-адрес .105, потому что её день рождения был 5 октября.

Со временем мы добавляли устройства, заменяли компьютеры, роутеры стали фаерволами, а статические IP-адреса стали DHCP-резервациями, но каждый её компьютер всегда имел IP-адрес, заканчивающийся на .105.

Вскоре после рождения нашей дочери моя жена умерла от меланомы в 2008 году. Когда я сделал резервную копию её файлов и очистил её компьютер, я установил резервацию DHCP для .105 на недействительный MAC-адрес, чтобы никакое устройство никогда больше не получило этот IP-адрес.

Прошло пятнадцать лет, я снова женился, у меня трое других детей, сеть разрослась с помощью школьных Chromebook, мобильных телефонов, умных устройств, медиаплееров и т. д.

Но эта резервация DHCP адреса все еще работает, и только я знаю об этом

🫥

Читать полностью…

Denis Sexy IT 🤖

Я понимаю, что для многих подписчиков это не актуально, но просто не могу молчать – если вы когда-нибудь будете в Амстердаме:

1) Приходите в эту локацию со вторника по четверг (до 5 вечера)

2) Заказываете себе Хумус с Манго

3) Называете своего первенца «Денисом», потому что хумуса вкуснее в жизни вы не пробовали

Я много где был и домашние хумусы сам делал, и пробовал их в разных арабских странах, но никогда такого вкусного не ел, не пожалеете: там помимо манго что-то острое, получается удивительный вкус

Читать полностью…

Denis Sexy IT 🤖

#промо
Идея стартапа стоит минус 50 тысяч долларов. Можно проверять и тратить, а можно взять и рисковать на чужие деньги.

В этом месяце банкует венчур-билдер SKL.vc. Что даёт:
— От вас — B2C-идея.
— От них — оффер на оклад до 200 тысяч долларов в год, до 1,5 миллионов долларов финансирования в проект и руководство проектом.

То есть это будет не ваш проект, у вас в нём будет доля. Но при этом вы гарантированно вообще ничего не теряете (кроме времени), и либо проверяете свою идею за чужие деньги и уходите довольным, либо — вдруг! — получаете единорога.

Да, такое тоже иногда случается.

Тогда ваш опцион становится дороже, чем 100% доля в обычном стартапе, который просто растёт, а не растёт на весь мир.

В общем, если есть идея, которую надо уже наконец-то попробовать — сейчас стартовал SKL Launch Camp. Условия такие: есть 21 день на программу “Сдохни или умри”, чтобы показать результат. Если хоть что-то есть, что докажет масштабируемость — попробуйте увернуться от денег. Заявку можно отправить до 15 июля.

Речь только про B2C-проекты, причём не подходят криптовалюты и игры. Вот тут есть список приоритетных сфер.

До окончания приема заявок B2C-проектов осталось 6 дней – ссылка на анкету

#текстприслан

Читать полностью…

Denis Sexy IT 🤖

Короче, с 2020 года мы живем с вами в сэндвиче: два чувака, один в Испании, другой в Новой Зеландии, одновременно приложили два куска хлеба к нашей планете, сделав все между ними – начинкой планетарного масштаба

Формально, мы теперь многокалорийное кулинарное блюдо и возможно именно из-за этих двух кексов с 2020 много чего катится в %#%%#, планета недовольна и не хочет быть начинкой

Читать полностью…

Denis Sexy IT 🤖

Все никак не выходит из головы эта мысль:

Люди, когда ChatGPT галлюцинируют:
>Хаха, какая смешная железяка, придумала данных которых нет

Человек, когда вышел из дома:
>Точно помню что не закрыл дверь, нужно проверить

Ведь правда же, каждый раз когда мы что-то вспоминаем, мы галлюцинируем прошлое которого уже нет в настоящем, его не существует; мы как бы придумываем мир с неточностями и ошибками, но который более менее нас устраивает и используем эти данные ежедневно – и чем чаще тренируем память, тем меньше эти галлюцинации ошибаются

Механизмы памяти и галлюцинаций устроены по разному, но иронично что в контексте сравнения с LLM проблемами они рядом

Читать полностью…

Denis Sexy IT 🤖

Делаю сейчас новую версию презентации про neural.love и там нужно описать чем мы лучше других и что именно своего у нас есть — за 4 года мы понаписали так много, что ничего лучше ессэ на 20 страница чем использовать формат Apple, который в конце каждой их презы, я не придумал: нашел шаблон в Figma, пошел заполнять и тут на меня нашло уныние потому что я плохо знаю Figma и сейчас я 2 часа буду собирать этот шаблон.

Но тут я вспомнил, что у нас Sci-Fi на дворе, поэтому я передал скриншот шаблона в Figma и необработанный контент для наполнения «островов» в Sonnet 3.5 и попросил сверстать мне страницу в HTML5 — теперь мне только картинки проставить, текст и все, справился за 10 минут

Палитра моя, не Claude с ума сошел ☕️

#пропродукт

Читать полностью…

Denis Sexy IT 🤖

Я не удивлён – Майнкрафт оказался отличной средой для тренировки автономных агентов. А еще там можно построить нейросеть из редстоуна.

Авторы, наверное, сами на нем выросли, и вот теперь они представили агента OmniJARVIS, который способен выполнять комплексные таски, такие как крафт каменной (не деревянной) кирки. Т.е. он понимает, что сначала ему нужно сделать верстак, потом деревянную кирку, и только потом, добыв булыжник, каменную.

Для этого используют, можно сказать, новый вид мультимодальных LLM - VLA (Vision Language Action).

У нас здесь есть как бы два мозга. Мозг LLM и спинной мозг – поведенческий детокенайзер, который интерпретирует аутпут LLM в действие. Действия предварительно тренируются, используя датасет из кучи видосов по Майнкрафту. LLM пишет, что делать, детокенайзер находит у себя в базе выученных действий нужное и шаг за шагом идет к своей цели. И все это вроде как работает очень дружно и слаженно.

В видосе агент сам поставил себе план: добыть дерево, создать верстак и скрафтить необходимые инструменты. Все эти действия он научился делать заранее, здесь они выполняются командой экшн. В записи показано, как это выглядит.

Еще один пример смотрите в первом комменте.

Что это значит?
Мы уже научились обучать роботов делать какие-то простые таски: Вот свежий пост про живую сталь и GR00T среду для виртуальной тренировки. У нас уже много примеров того, как боты складывают вещи, моют, убирают и прочее, тут и тут. В этом посте показан не первый, конечно, но очень качественный пример системы, которая объединяет все эти отдельные выученные действия в один общий план, когда бот сам анализирует обстановку, планирует и решает задачи.

Кажется, это уверенные шаги в сторону автономных агентов и происходят они в Майнкрафте (т.к., там проще тестировать и обучать). Теперь ждем более сложного планирования и для физических роботов.

Project page
Пейпер
Код!
И даже Датасет обещают скоро

@ai_newz

Читать полностью…

Denis Sexy IT 🤖

Одно из направлений развития AI индустрии которое лично мне очень нравится, это «предсказательные» модели – вы ей данные на вход, а она вам предсказывает погоду, курсы, счета за воду, что угодно.

Так вот, IBM выпустила маленькую модель «Tiny Time Mixer (TTM)», с нормальной лицензией для коммерческого использования, которая для своего размера бьет много крупных моделей такого же типа – если вы любите попытку предсказания будущего, то вот полезная ссылка про эту модельку, передавайте привет там в будущем

P.S. Любопытно, что модель не на архитектуре трансформеров (на которой все эти GPT4 и тп)

Читать полностью…
Subscribe to a channel