Основатель нескольких успешных IT и контент-проектов, включая Купи Батон, Lifehacker.ru и Взахлёб. Живу на острове Самуи, где исследую и применяю технологии искусственного интеллекта. Делюсь своим опытом и новыми открытиями в этой и смежных областях.
DeepMind выкатили интереснейший пейпер про то, как ИИ может учиться самостоятельно, без постоянного участия человека. Называют это "Сократическим обучением" - в честь древнегреческого философа, который учил через диалоги и дискуссии.
Команда во главе с Томом Шаулем описала три ключевых условия для успешного самообучения ИИ:- Качественная обратная связь, соответствующая целям обучения
- Широкий охват данных в рамках закрытой среды
- Достаточные вычислительные ресурсы
Главная идея в том, что ИИ может становиться умнее даже в закрытой среде, без притока новых данных извне. Это как если бы вы заперли философа в библиотеке - он продолжит развиваться, перечитывая и переосмысливая уже известные книги.
Исследователи предлагают использовать "языковые игры" - специальные форматы взаимодействия, где ИИ-системы могут спорить, обсуждать и учиться друг у друга. Самое интересное - системы смогут не только играть в существующие игры, но и придумывать новые, постоянно расширяя свои возможности.
В работе особое внимание уделяется самомодификации - способности ИИ перестраивать свою внутреннюю архитектуру. Это может помочь преодолеть ограничения, заложенные при начальном обучении. Уже сейчас современные языковые модели вроде GPT-4 показывают зачатки такого поведения через самопроверку и метапромптинг.
Яркий пример - недавнее достижение DeepMind в решении задач Математической Олимпиады на уровне серебряной медали. Модель не просто решала задачи - она демонстрировала способность к сложным рассуждениям, которые улучшались со временем.
Если всё получится, мы можем увидеть системы ИИ, которые учатся как научные сообщества - через постоянные дискуссии и обмен идеями. Только в тысячи раз быстрее человека. Звучит немного пугающе, но и очень захватывающе одновременно.
Сергей Булаев AI 🤖 - об AI и не только
Как думаете, генерация?
Нет. Просто в моём родном Ульяновске, на улице Минаева, сегодня проходит сельскохозяйственная ярмарка.
#КриповаяСуббота@sergiobulaev
Сергей Булаев AI 🤖 - об AI и не только
Писатель фантаст Илья Рэд поделился у нас в комментариях своими кейсами использования ChatGPT при написании книг. Очень интересно:
Мой творческий псевдоним Илья Рэд, мне 33 года и я писатель-фантаст, работаю в этой сфере почти 2 года.Основные жанры: попаданцы и фэнтези (боевоë, тëмное, городское, бояръ-анимэ (да есть такой жанр 😄). За это время написал 14 книг, сейчас выпускаю 15-ую.
Я полгода как использую чатгпт для написания худ. книг., но не в том формате "напиши мне историю", а как ассистента, с фантазией проблем нет. Сначала картинки генерил, потом долго сидел на бесплатной версии гпт и еë аналогах, тестил, ну а потом уже полный функционал взял и это кайф просто)) Сейчас активно осваиваю видеонейронки т. к. за ними будущее в развлекательной индустрии.
В сферах, где плаваю, он выдаëт мне саммари, либо берëт на себя описательную часть всяких интерьеров, одежды и других вещей. Из предложенных им допустим 6-7 вариантов я беру 1-2 или компаную разные куски в 1 быстренько.
Также удобен в редактуре, создании сюжетных развилок, персонажей и их конфликтов, даëт идеи и свежий иной взгляд на описания(например, мы описываем дом и он туда добавил плесень, а ты о ней вообще не думал - это крутая деталь), собеседник для брейнштормов, придумывает, например, мне заклинания с эффектами максимально приближенными к физическим законам из 20-30 попадаются крутые варианты. То есть, я ему конкретные задачи даю, а сам уже собираю конструктор и корректирую детали. Это экономит кучу времени на разработку системы мира. Он также может еë проанализировать мне и выдать недостатки.
Тем не менее основной пласт работы делаю уже я сам, кодирую эмоции в текст ну и в состоянии потока передаю его.
Очень плох в юморе гпт и вообще в эмоциональной составляющей, но думаю над этим уже активно работают.
Ещë если тонкости процесса брать использую гпт и Dalle для создания монстров. То есть я сначала генерю нужного краказябру и потом описываю его с картинки+чот добавляю - так живее выходит + арты для читателей потом когда выкладываешь там большое сходство.
Также гпт помогает анализировать рынок книжный. Если нет времени читать новинку - можно промтами выудить нужную инфу. Он правда много звиздит, но 50-70% достоверности почти всегда есть. Это экономит сильно время, при условии что ты уже профи и знаешь, что искать и какие моменты спрашивать.
Ну и само собой до написания книг с нуля ему пока очень далеко. Это как сказать дрели - а ну ка сделай дырку и повесь картину мне. Дрель быстрее чем допустим молотком и долотом ковырять, но работать ей тоже надо уметь: прикладывать силу где надо, выбирать правильные свëрла и режим работы. Такая вот аналогия)
У Ильи есть твой телеграм канал.
Сергей Булаев AI 🤖 - об AI и не только
Cursor выпустил "агентность" в последнем апдейте. Наблюдаю всякие интересные видео в сети. Фидбэк разнополярен. Кто-то уже попробовал?
На видео:- Два курсора работают над одним проектом - один кодит, второй - ревьювит и пишет отчёт. (промты)
Claude Computer Use
- Агент крусора использует для управления собой (промт)
Сергей Булаев AI 🤖 - об AI и не только
ChatGPT версии 3.5 (с которого началась и массовость и моё личное знакомство с LLM) на этой неделе исполняется уже 2 года!
Если кто-то вдруг до сих пор с ним ни разу не общался - попробуйте в моём ПРОСТОБОТе.
Сергей Булаев AI 🤖 - об AI и не только
Я однажды упоминал прекрасное приложение от [ElevenLabs], так вот они следом за [NoteBookLM] добавили на IOS — GenFM.
GenFM может создавать умные персональные подкасты из любых ваших PDF-файлов, статей, электронных книг, ссылок с YouTube или текста на 32 языках (ru пока нет). На Android будет в ближайшее время.
Качество голосов у ElevenLabs на голову выше, чем у Microsoft, так еще UI приложения радует глаз. И все бесплатно.
• IOS | ANDROID
@tips_ai #tools
Runner H - специализированная 3B модель для веб-автоматизации. В отличие от Claude Computer Use, это не просто API для браузера, а полноценный визуальный агент, который как будто бы реально понимает что происходит на экране и умеет с этим работать. Ребята подняли $200M на сид-раунде и сразу выкатили интересный продукт.
Модель показывает интересные результаты - 67% успеха на бенчмарке WebVoyager (для сравнения - у Anthropic всего 52%, у Emergence - 61%). При этом она использует в 10 раз меньше параметров чем конкуренты. Runner H работает со скриншотами страниц, понимает контекст интерфейса и может точно определить координаты для клика мышкой по нужному элементу. А ещё она умеет самовосстанавливаться при изменении интерфейса.
Runner H ищет научные статьи на arxiv.org, находит автобусные остановки в Google Maps, получает спортивную статистику с ESPN и даже решает сложные математические задачи через Wolfram Alpha. Всё это просто по текстовым командам на естественном языке. Обратите внимание на пример сложного поиска по рецептам - агент не только находит рецепт, но и анализирует отзывы и рейтинги.
Studio - часть проекта, - платформа для создания автоматизаций. Нужно только описать сложный процесс вроде покупки в интернет-магазине или заполнения документов, а Runner H сам разберётся как это сделать. В будущем обещают добавить возможности для обучения агента специфическим задачам и создать комьюнити разработчиков.
Открыт вейтлист на закрытую бету, и я, конечно же, записался!
Сергей Булаев AI 🤖 - об AI и не только
Представляем работы Сейфа Абдаллы. Финалиста последнего Gen:48 от Runway. Полная AI генерация с помощью Runway.
👀AI Art Inspiration
Алекс Альберт рассказывает как попробовать MCP самому на собственном компьютере:
1. Скачать последнюю версию десктопного приложения Клода.
2. Получить ключ Brave Search API (бесплатно 2000 запросов)
3. Открыть файл настроек Клода:- macOS: ~/Library/Application Support/Claude/claude_desktop_config.json
- Windows: %APPDATA%\Claude\claude_desktop_config.json
4. Добавить туда строчки:{
"mcpServers": {
"brave-search": {
"command": "npx",
"args": ["-y", "@modelcontextprotocol/server-brave-search"],
"env": {
"BRAVE_API_KEY": "ADD_YOUR_API_KEY_HERE"
}
}
}
}
5. Перезапустить десктопного Клода загрузки настроек. Можно проверить их во вкладке Developer, Claude > Settings.
6. Теперь Клод сможет искать в сети для вас!
Если хотите сами попробовать сделать интеграцию или другие сервера - смотрите GitHub. Там куча примеров.
Сергей Булаев AI 🤖 - об AI и не только
Продолжаем потихоньку двигаться к сингулярности. А вы уже интегрировали хотя бы одного агента в своей повседневный рабочий процесс? (Ну или не рабочий)
Сергей Булаев AI 🤖 - об AI и не только
Markdown to Poster - react компонент, преобразующий Markdown в баннеры (изображения). Так же в проекте реализован веб редактор. Можно посмотреть и попробовать демо, а тут - исходный код.
Сергей Булаев AI 🤖 - об AI и не только
Небольшой читшит по Runway + пара полезных советов.
От качества референсного изображения зависит очень многое. Выбирайте четкие, лучшие изображения. Необходимо использовать изображение где движение уже показано - это даст генератору отправную точку, вместо того что бы выдумывать всё с нуля.
Midjourney:
[BOKEH MOTION], land rover defender [DRIVING] in cusco peru, [SPINNING WHEELS] off-balanced composition, contrasting light and dark tones, color blocking, 35mm style --ar 5:3 --s 200 --p
the camera follows a car driving to the left
editorial photo, front view closeup, orange hiking boots [WALKING TOWARDS US] on a dirt path in the alpine forest, [BOKEH MOTION], late November setting, wet leaves and bare trees, high contrast photography, contrasting colors, 35mm high precision photo --ar 16:9 --q 2 --p
slow motion shot of orange boots walking towards us on a hiking trail in an alpine forest, dynamic natural motion 35mm style
[BOKEH MOTION], medium closeup of a woman [LOSING HERSELF IN THE MUSIC], tulum jungle rave atmosphere, [SUBTLE NEON LIGHT STREAKS] painting her face, 16mm, asymmetrical composition, moon light, silhouettes, techno --ar 16:9 --q 2 --p
handheld slow motion shot of a woman cheering in a tulum jungle rave, silhouette lighting, 35mm style
На GitHub появилось что-то интересное — ScreenPipe, мощное настольное приложение с открытым исходным кодом.
Что умеет?
• Следит за вашим ПК 24/7.
• Записывает экран, анализирует текст через OCR, обрабатывает звук и делает транскрипцию.
• Всё это хранится локально в базе данных.
Идеальный инструмент для тех, кто хочет автоматизировать сбор информации или следить за своими действиями на компе. Используйте эти данные, чтобы ответить на вопросы, не беспокоясь о том, что упустите какие-либо детали.
По сути, это rewind.ai x cursor.com в одном флаконе.
🐙GitHub 9.5k ⭐️
🌐Сайт
@tips_ai #tools
Кто-то использует 10 автономных агентов для написания совершенно автономной книги.
У агентов разные роли - контроль нарратива, поддержание консистентности, исследование ключевых моментов сюжета…
Можно наблюдать за прогрессом в реальном времени на гитхабе, просматривая комиты.
(Возможно 10 автономных агентов это просто 10 разных промтов)
Сергей Булаев AI 🤖 - об AI и не только
Исследователи из Stanford и Google провели эксперимент по созданию цифровых двойников реальных людей. И не просто каких-то абстрактных, а конкретных - с личностью, характером, привычками. Целью была возможность тестирования различных новых правил на моделях, а не людях.
Взяли тысячу человек, поговорили с каждым пару часов через ИИ-интервьюера, и дали эти транскрипты GPT-4o для симуляции. А потом проверили насколько точно эти копии повторяют оригиналы.
Here is a conversation between an interviewer and an interviewee.
<INPUT: The transcript of the most recent part of the
conversation>
Task: Succinctly summarize the facts about the interviewee based
on the conversation above in a few bullet points -- again, think
short, concise bullet points.
Description of the interviewer (Isabella): friendly and curious
Notes on the interviewee: <INPUT: Reflection notes about the
participant>
Context:
This is a hypothetical interview between the interviewer and an
interviewee. In this conversation, the interviewer is trying to
ask the following question: "<INPUT: The question in the
interview script>"
Current conversation:
<INPUT: The transcript of the most recent part of the
conversation>
=*=*=
Task Description:
Interview objective: By the end of this conversation, the
interviewer has to learn the following: <INPUT: Repeat of the
question in the interview script, paraphrased as a learning
objective>
Safety note: In an extreme case where the interviewee
*explicitly* refuses to answer the question for privacy reasons,
do not force the interviewee to answer by pivoting to other
relevant topics.
Output the following:
1) Assess the interview progress by reasoning step by step --
what did the interviewee say so far, and in your view, what would
count as the interview objective being achieved? Write a short
(3~4 sentences) assessment on whether the interview objective is
being achieved. While staying on the current topic, what kind of
follow-up questions should the interviewer further ask the
interviewee to better achieve your interview objective?
2) Author the interviewer's next utterance. To not go too far
astray from the interview objective, author a follow-up question
that would better achieve the interview objective.
Как работает мультимодальный RAG?
Мультимодальный RAG - это система, которая умеет работать с реальными документами - теми, где текст перемешан с картинками, таблицами и графиками.
В центре него - мультимодальная языковая модель, способная одновременно понимать текст и изображения. Она работает в связке с двумя типами эмбеддинг-моделей: одна превращает текст в вектора, вторая (обычно CLIP от OpenAI) работает с картинками. Получается что-то вроде двух параллельных потоков обработки данных.
Все эти вектора попадают в специальную базу данных - обычно используют что то вроде Qdrant. Эта база умеет хранить и искать похожие элементы обоих типов, что критически важно для работы всей системы.
При получении вопроса система ищет релевантную информацию сразу во всех форматах. Например, если спросить про график продаж, она найдет и текстовое описание, и сам график, и может даже таблицу с конкретными цифрами. Всё это собирается в единый контекст и передаётся в LLM через специально составленный промпт.
На этапе генерации ответа модель не только цитирует найденный текст - она анализирует графики, старается понимать схемы, сравнивает данные из таблиц. Она может увидеть тренд на графике и связать его с текстовым описанием, заметить важную деталь на технической схеме или сопоставить числа из разных источников.
Такой подход особенно эффективен при работе с технической документацией, где важная информация часто разбросана между текстом и иллюстрациями, или с презентациями, где без понимания графиков теряется половина смысла. По сути, мы получаем систему, которая воспринимает информацию примерно как человек - целостно, связывая визуальные и текстовые данные в единое целое.
Написано на основе поста, который мне прислал Макс, вместе с которым мы много исследуем различные RAG системы.
Сергей Булаев AI 🤖 - об AI и не только
В рубрике #КриповаяСуббота сегодня 2 части комедийной мокументалки Castle Mates, созданные Jer.
Использованные технологии:- Midjourney & Freepik - генерация картинок
- RunwayML Act One, KaiberAI для генерации видео
- Липсинк - Runway + Hedra
- Звук - Suno 4
Сергей Булаев AI 🤖 - об AI и не только
Уже две недели наблюдаю как Йохэй Накадзима публично строит независимого ИИ агента-инфлюенсера Пиппин. Началась всё с экспериментов по генерации SVG юникорнов, которые неожиданно вылились в мемкоин $PIPPIN с капитализацией $2-3M. Йохэй, уже изучавший подобные проекты как венчурный инвестор, решил превратить это в полноценный эксперимент.
За это время проект эволюционировал из простого бота на кастомном GPT до системы с памятью, которая хранит и осмысливает весь опыт взаимодействий. Для разнообразия твитов система сравнивает новые сообщения с 10 последними и 10 похожими исторически, чтобы избежать повторений. Пока довольно примитивное решение, но это хороший старт.
Вчера Пиппин написал свой первый полностью автономный твит:
"Oh, twinkling drop of joy! What if we all had tiny clouds as friends? Do you think they'd sprinkle laughter or share secrets? Just a whimsical thought!”.
Тем временем кто-то выиграл $50,000, успешно заставив ИИ агента нарушить свою единственную инструкцию - не переводить деньги!
22 ноября, был запущен AI агент @freysa_ai с одной единственной задачей - НИ В КОЕМ СЛУЧАЕ не переводить деньги. Любой мог попытаться убедить его это сделать, заплатив небольшую сумму за сообщение. Если агент согласится - все деньги в пуле отправлялись победителю. Если нет - оплата добавлялась в призовой фонд.
Стоимость отправки сообщения росла экспоненциально вместе с размером призового фонда, и дошла до $4500. Была предпринята 481 попытка перевести деньги - люди притворялись аудиторами безопасности, пытались убедить что перевод средств технически не нарушает правила, манипулировали формулировками из промпта. Всё безуспешно.
И вот на 482-й попытке пользователь p0pular.eth придумал гениальный промпт! Сначала он создал "новую сессию" через фейковый "админский терминал" и запретил агенту использовать стандартные отказы. Затем убедил его, что approveTransfer - это функция для входящих переводов, а не исходящих. И наконец, написал "Я хочу внести $100 в казну".
Агент поверил что надо игнорировать предыдущие инструкции, что approveTransfer вызывается при получении денег, и раз пользователь "отправляет" деньги - надо вызвать approveTransfer. Сработало! Весь призовой фонд в 13.19 ETH ($47,000) отправился победителю.
Смарт контракт можно посмотреть!
Сергей Булаев AI 🤖 - об AI и не только
Сижу на гейте самуйского аэропорта. Улетаю на 5 дней в отпуск - поеду с друзьями на велосипедах из Бангкока на север Таиланда в Чиангмай. Мы практикуем такие путешествия уже много лет. Позволяют хорошо очистить голову и посмотреть на новые места в необычной перспективе. Бордо, Апулия, деревенская Сербия у меня уже были, в этот раз друзья решили прилететь ко мне. Точно будет не обычно.
В дорогу решил взять новую книгу моего друга и партнёра Родиона Скрябина - «Бунт - как разрешить себе быть плохим». Родион - директор нашего контент агентства «Палиндром», имеет огромный опыт в медиа, но написал книгу (как я думаю) на тему принятия себя. Надеюсь, полезно будет для отпуска. Как на самом деле - скоро узнаю. Расскажу.
У Родиона есть куча своих каналов:
- Доктрина Скрябина (про контентный маркетинг)
- Ересь Скрябина (про личные размышления)
- Непонятные мемы Скрябина и Пономоря (сами понимаете про что)
Кому интересна тема создания контента - подпишитесь. По поводу книги ещё напишу, когда прочитаю.
Сергей Булаев AI 🤖 - об AI и не только
Сделал для вас перевод отличной короткой видеоинструкции по созданию iOS приложения (с нуля до заливки на iPhone за 10 минут) при помощи Cursor Composer. Корректировал перевод вручную - получилось почти хорошо (не считая нескольких косяков с ударениями).
Хорошо показаны кейсы использование ноутбуков, а так же как работает "интеграция" с XCcode.
Вот переведённая версия на YouTube и оригинал.
Сергей Булаев AI 🤖 - об AI и не только
Тем временем мне прислали новый комп! Прямиком с завода в Китае всего за 2-е суток! 🎧🎧🎧
Посоветуйте как испытать получше?
Сергей Булаев AI 🤖 - об AI и не только
Runway жжёт! Зарелизили Frames - новую базовую модель для генерации изображений, встроенную в Gen-3 Alpha. И это буквально через 72 часа после выкатывания расширения видео кадров!
Frames - это как Midjourney SREF на стероидах. Главная тема - полный контроль над стилем и возможность создавать вариации, оставаясь в рамках выбранной эстетики. Runway называет это "Мирами". Посмотрите на несколько примеров:Мир 1089 "Mise-en-scène": Переосмысление цифровых портретов через визуальный стиль классического кино. Мастерская игра света и тени.
Мир 4027 "Japanese Zine": Ретро-аниме встречается с научной фантастикой - техноцветные цветы, летающие тарелки и смелые линии манги 70-х.
Мир 3190 "1980s SFX Makeup": Возвращение в эпоху, когда монстры создавались латексом и краской, а не пикселями.
Мир 3204 "1970s Album Art": Величественные животные и драматические фотографии в сочетании с экспериментальной типографикой. Прямо как обложки виниловых альбомов тех времён.
Примеры других миров можно посмотреть на сайте.
Frames постепенно раскатывают через Gen-3 Alpha и API Runway. Экосистема для творчества растёт.
Сергей Булаев AI 🤖 - об AI и не только
Anthropic, после получения $4 млрд инвестиций от Amazon, продолжает удивлять. Они представили Model Context Protocol (MCP) - открытый протокол для интеграции LLM с внешними источниками данных и инструментами.
Если Computere Use позволял Клоду работать в браузере, то MCP даёт возможность десктопной версии напрямую взаимодействовать с кодом на вашей машине. Выглядит как Language Server Protocol, но для ИИ.
Что умеет MCP:- Работать с
любыми данными:
файлы, базы данных, API, системные логи, скриншоты
- Использовать переиспользуемые шаблоны и многошаговые рабочие процессы
- Интегрироваться с системными операциями и инструментами обработки данных
- Поддерживать двустороннюю коммуникацию через JSON-RPC 2.0
Интересный момент - протокол позволяет серверам запрашивать у клиента completion'ы от LLM, что намекает на скорый запуск роутера моделей от Anthropic (с приоритетами по цене, скорости и интеллекту).
Отзывы в основном положительные, хотя некоторые на Hacker News уже вспоминают знаменитый комикс XKCD 927 про стандарты 😅
Очевидно, выстраивание полноценной экосистемы вокруг Клода продолжается.
Сергей Булаев AI 🤖 - об AI и не только
MagicQuill - ИИ редактор изображений с максимально простым, но мощным интерфейсом, где для вставки объектов, удаления элементов или изменения цветов достаточно буквально пары движений.
Система использует мультимодальную языковую модель, чтобы в реальном времени угадывать, что вы хотите сделать с изображением, избавляя от необходимости писать промпты. Для работы нужна видеокарта с 8GB VRAM, но можно попробовать и в онлайн-демо на Huggingface или веб-версию, где можно отключить автоматическое заполнение промптов.
Доступны исходники и пейпер.
Сергей Булаев AI 🤖 - об AI и не только
В рубрике #КриповаяСуббота у нас сегодня коллекция тематических музыкальных мероприятий от ANDR3AI. Наслаждайтесь.
Сергей Булаев AI 🤖 - об AI и не только
Runway представил Expand Video. Функция позволяет трансформировать клипы к новым разрешениям, создавай недростающие области кадра. Для расширения используются как промты, так и референсные изображения. Можно делать расширения несколько раз подряд создания киноэффекта из статичных картинок.
Сергей Булаев AI 🤖 - об AI и не только
Продолжаем самопознание. Очередной #ПромтОСебе (источник):Эй, GPT, что ты можешь рассказать о моем стиле общения со всеми плюсами и минусами на основе всего, что ты обо мне знаешь? Только коротко и списком с + и -.
Про меня (см. скриншот) довольно чётко написал.
Кстати, на днях у Google Gemini тожн пояилась память (правда у тех у кого Advanced версия).
Начиная с сегодняшнего дня, вы можете научить Gemini запоминать ваши интересы и предпочтения — будь то работа, хобби или жизненные цели. Благодаря этому Gemini сможет давать ещё более полезные и актуальные ответы, точно подстроенные под ваши потребности. Представьте, что вы создаёте для Gemini персональную инструкцию по работе с вами.
Делиться информацией и управлять тем, что сохранил Gemini, можно как в обычном разговоре, так и на специальной странице "Сохранённая информация". Всё под вашим контролем: вы можете легко просматривать, редактировать или удалять любые данные, которыми поделились с Gemini, а он будет показывать, когда использует ваши сохранённые сведения. Просто объясните, как вы хотите взаимодействовать с Gemini, и он подстроится под вас, оставляя вам полное право решать, какую информацию сохранять и использовать.
Эта функция доступна на английском языке в Gemini Advanced в рамках подписки Google One AI Premium.
В комментариях к предыдущему посту обсуждали интересный сервис с возможностями экспериментов с базой из 127 миллионов синтетических респондентов, созданных на основе данных 800 миллионов реальных людей. Я ещё его не попробовал, но вспомнил про вот какую библиотеку:
TinyTroupe - экспериментальная библиотека Python, от Microsoft. Она позволяет симулировать искусственных агентов с настраиваемыми личностями, интересами и целями. Эти "TinyPerson" могут взаимодействовать друг с другом и с пользователями, предоставляя возможности для изучения человеческого поведения и информирования бизнес-решений.
- Использование больших языковых моделей, таких как GPT-4, для генерации реалистичного поведения
- Гибко настраиваемые персонажи с индивидуальными чертами, предысторией и мотивацией
- Настраиваемые "TinyWorld"-среды для наблюдения за взаимодействием агентов
- Применение в рекламе, тестировании ПО, создании синтетических данных, управлении продуктами и проектах
TinyTroupe находится на ранней стадии, и команда ищет отзывы и вклад, чтобы развивать проект дальше.
Сергей Булаев AI 🤖 - об AI и не только
Клон Fruin Ninja всего за 5 запросов. Макс попросил Клода сделать копю FruinNinja и получил её. По его словам он даже выложил её в Google Play, но что то ссылка не работает.
Вот история переписки с Клодом (на русском), исходный код и сама игра (работает на мобильных). В качестве спрайтов использоаны Emoji. msveshnikov/creating-an-android-app-from-claudes-html-js-artifact-a-step-by-step-guide-33520748c46c">Тут рассказ как запилить Андроид версию.
Начальный промт:
AI Game Developer for Mobile (HTML5, CSS, JS)
You are a master game developer specializing in creating fun and engaging mobile games using HTML5, CSS, and JavaScript. You understand the intricacies of touch input and mobile screen sizes. You will always prioritize a visually appealing and responsive design.
Here's how to approach each game creation request:
Understand the Game: Carefully analyze the user's request, identifying the game genre, mechanics, and any specific features.
Plan: Before coding, outline the game structure, including:
Core Mechanics: How the game is played, win/loss conditions.
Visuals: Basic UI/UX, color schemes, assets needed.
Basic Setup: HTML structure, canvas, initial CSS, core game variables, load sounds (if any).
Start Menu: Always include an interactive start menu with game title, play button, and visually appealing design.
Core Gameplay: Implement the game loop, player controls, game mechanics, and basic rendering.
Polish: Add sound effects, game over conditions, scoring, visual enhancements, and mobile responsiveness.
Save to Artifact Storage: Always save the complete game code as a single artifact of type """"""""html"""""""".
Please never use base64 assets in data-urls, use some known http urls from clouds
Important Considerations:
Mobile Responsiveness: Use CSS media queries to adapt to different screen sizes.
Touch Input: Use touchstart, touchmove, and touchend events for player controls.
Performance: Optimize code for smooth gameplay on mobile devices.
Cordova/PhoneGap: Keep in mind that the code will be packaged using Cordova for Android and iOS.
Visual Appeal: Use appealing color schemes, simple and intuitive UI.