sergiobulaev | Unsorted

Telegram-канал sergiobulaev - Сергей Булаев AI 🤖

6702

Основатель нескольких успешных IT и контент-проектов, включая Купи Батон, Lifehacker.ru и Взахлёб. Живу на острове Самуи, где исследую и применяю технологии искусственного интеллекта. Делюсь своим опытом и новыми открытиями в этой и смежных областях.

Subscribe to a channel

Сергей Булаев AI 🤖

Чуть-чуть доработал "О***енные истории". Оказалось, что на использование бесплатных моделей у OpenRouter есть ограничение, и ночью истории перестали работать.

Теперь каждый раз при генерации выбирается одна из случайных (но дешёвых) моделей. Истории часто получаются очень смешными.

Счастье небыл в создании новой картины мира, когда муравей начал рассказывать ёжике о свой бесподобный метамозговый потенциал, и о его страстй любви к своим взглядам раза на разе. "Мы и ранее имели возможность решать проблемы нашей природе щепотью души и небольшими штриха опласнительства, идея - откром."


Добавил также кнопку "перегенерировать", чтобы проще было пробовать с другими моделями.

P.S. На YouTube, оказалось, теперь нужно загружать документы, чтобы они разрешили выкладывать ссылки внутри описаний. Поэтому пока не выложил главный стрим о том как я делал проект (жду подтверждения), но SergeyBulaev/videos">канал завёл и залил первую серию.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

Дэн Шиппер (every.to), мнение которого я очень уважаю, поделился своими размышлениями и советами относительно O1 и её использования. Они частично противоположны советам Пьетро Шкирано и гораздо лучше соответствуют рекомендациям самого OpenAI (мне, кстати, вчера указали в комментариях на то, что советы Пьетро идут вразрез с общими рекомендациями).

Выбирайте между O1 Preview и O1 Mini в зависимости от задачи. O1 Preview лучше справляется с задачами, требующими глобальных знаний:

«O1 Preview немного более сложная... Если ваши запросы требуют детальной информации о мире, O1 Preview — лучший вариант.»


O1 Mini быстрее, но менее осведомлён в широком контексте, зато отлично решает математические и кодовые задачи:
«O1 Mini быстрее, но меньше знает о мире. Он особенно хорош в математике и кодировании, как ученик, набравший 800 баллов на SAT по математике, но никогда не изучавший Шекспира.»

Используйте цепочку размышлений для повышения точности. O1 использует встроенный механизм рассуждений, который позволяет улучшить результаты, если запрос сложный:
«Ключ к превосходной производительности O1 — это процесс рассуждения с цепочкой мыслей... С GPT, если вы просили модель размышлять шаг за шагом — фактически "думать вслух", — это приводило к повышенной точности и снижению количества ошибок.»

Позволяйте модели "думать" дольше для сложных вопросов. Чем больше времени O1 тратит на размышления, тем лучше результаты, особенно для сложных задач:
«С O1 производительность увеличивается по мере того, как она размышляет над проблемой.»

Возможно будущее, в котором модель обдумывает задачу часами или днями, что может быть полезно для сложных запросов:
«Представьте будущее, в котором вы задаёте ChatGPT вопрос, и вместо немедленного ответа модель обдумывает его часами или даже днями, прежде чем вернуться к вам.»

Используйте O1 для 10-20% сложных запросов. На первых этапах внедрения O1 Шиппер рекомендует использовать модель для наиболее сложных запросов, требующих глубокого уровня размышлений:
«Я настоятельно рекомендую использовать эту модель. Первоначально 10-20% ваших ежедневных запросов, требующих более высокого уровня рассуждений, можно адресовать O1.»

Используйте краткие и чёткие запросы. Для O1 важна краткость: чем короче запрос, тем лучше она работает. Это помогает модели сосредоточиться на цепочке размышлений:
«Формулирование запросов для O1 значительно отличается от её предшественника, ChatGPT. Она предпочитает короткие и лаконичные запросы, а не длинные и детализированные.»

Инвестируйте время и ресурсы разумно. Использование O1 требует осознанного подхода к распределению ресурсов: времени и денег. Умение эффективно управлять запросами к мощным моделям, таким как O1, становится важным навыком:
«Знание того, когда использовать мощные модели, такие как O1, и как максимально эффективно извлечь пользу из её длительного времени обработки, может быть довольно сложным, так как это инвестиция времени и денег.»


Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

Пьетро Шкирано выложил список своих рекомендаций по промптам для o1, привожу их для вас.

Явно укажите, что вы хотите систематизированный ответ. Этим вы побудите модель более методично организовать свой мыслительный процесс.

Плохо:

Суммируй основные аргументы за и против базового безусловного дохода.


Хорошо:
Суммируй основные аргументы за и против базового безусловного дохода. Сначала составь список за UBI, объясняя причины для каждого пункта. Потом сделай то же самое с аргументами против. В конце сделай четкое саммари обеих сторон.


Направляйте принятие решений с помощью гипотетических сценариев. Предоставление конкретных критериев помогает модели провести структурированный анализ, что приводит к более глубокому ответу.

Плохо:
Должны ли беспилотные автомобили отдавать приоритет безопасности пассажиров или пешеходов в неизбежных авариях?


Хорошо:
Беспилотный автомобиль оказался в ситуации, где авария неизбежна. Он может либо свернуть, чтобы защитить пассажиров, но сбить пешехода, либо продолжить движение и травмировать пассажиров. Проанализируйте эту этическую дилемму, рассмотрев: (1) потенциальные последствия каждого выбора, (2) соответствующие этические концепции (утилитаризм, деонтология) и (3) возможные правовые последствия. На основе вашего анализа, какое решение должен принять автомобиль и почему?


Способствуйте многоступенчатому решению проблем (особенно для программирования).
Разбивка проблемы побуждает модель продумывать каждый шаг, уменьшая ошибки и повышая ясность.


Плохо:
Напиши функцию на Python для вычисления факториала числа.


Хорошо:
Напиши функцию на Python для вычисления факториала числа. Объясни свой подход пошагово, включая: (1) определение факториала, (2) алгоритм, который будешь использовать, (3) реализацию кода и (4) пример использования функции.


Поощряйте критическое мышление. Исследуя контрфактуальные ситуации, модель глубже погружается в анализ, предоставляя более богатые и глубокие ответы.

Плохо:
Каковы были причины Гражданской войны в США?


Хорошо:
Каковы были причины Гражданской войны в США? Исследуй этот вопрос, рассмотрев: (1) основные исторические события, ведущие к войне, (2) различные точки зрения на конфликт (Север против Юга), и (3) что могло бы произойти, если бы ключевые события развивались по-другому (контрфакты).


Используйте внутренний монолог для креативного письма. Поощрение внутреннего монолога добавляет глубину повествованию, делая персонажей более близкими, а сюжет более увлекательным.

Плохо:
Напиши короткий рассказ о детективе, расследующем загадочное исчезновение.


Хорошо:
Напиши короткий рассказ о детективе, расследующем загадочное исчезновение. Создай историю с точки зрения детектива, включив его внутренний монолог, чтобы раскрыть процесс мышления, выводы и меняющиеся подозрения по мере обнаружения новых улик.


Также надо добавить, что Пьетро - создатель Omni Enineer, Python-агента по программированию через ИИ. Так как он работает через OpenRouter, через него можно прямо сейчас пользоваться o1 для программирования.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

OpenAI повысила лимит на o1-mini в 7 раз (до 50 сообщений в день), на o1 c 30 до 50 в неделю. Живём!

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

У Mr. Beast слили очень подробный и интересный онбординг документ. Выкладываю вам несколько интересных цитат. Полезно для общего образования. 💼 Полностью документ будет в комментариях.

Фокус на YouTube:

"Ваша цель здесь - создавать лучшие возможные видео для YOUTUBE. Это главная цель нашей продюсерской компании. Не создавать самые качественные видео. Не самые смешные видео. Не самые красивые видео. Не видео самого высокого качества... А создавать лучшие возможные видео для YOUTUBE."

Команда A-игроков:
"А-игроки одержимы, учатся на ошибках, поддаются обучению, умны, не ищут оправданий, верят в Youtube, видят ценность этой компании и являются лучшими в мире в своем деле. B-игроки - это новые люди, которых нужно обучить до уровня A-игроков, а C-игроки - это просто средние сотрудники. [...] Они не одержимы и не учатся. C-игроки ядовиты и должны быть НЕМЕДЛЕННО переведены в другую компанию."


Важность кликабельности:
"Это то, что определяет наши видео. "Я провел 50 часов на своем переднем дворе" - это скучно, и вы бы не кликнули на это. Но вы бы гипотетически кликнули на "Я провел 50 часов в кетчупе". Оба требуют примерно одинаковых усилий и времени, но видео про кетчуп легко становится в 100 раз более вирусным."

Строгая формула видео:
"В этом конкретном видео мы потеряли 21 миллион зрителей в первую минуту видео (что, удивительно, выше среднего по сравнению с другими каналами) и могло быть намного хуже. [...] Первая минута каждого видео - самая важная минута каждого видео."

Вау-фактор:
"Пример "вау-фактора" - наше видео про 100 дней в круге. Мы предложили кому-то 500 000 долларов, если он сможет прожить в круге в поле 100 дней, и вместо того, чтобы начать с его дома в круге, где он будет жить, мы привозим его на кране через 30 секунд после начала видео. Почему? Потому что кто, черт возьми, еще на Youtube может сделать такое?"

Управление зависимостями:
"Я хочу, чтобы вы посмотрели им в глаза и сказали, что они являются узким местом, и пошли дальше, объяснив, почему они являются узким местом, чтобы вы оба были на одной волне. [...] Каждый день вы должны проверять Тайлера и убеждаться, что он все еще на пути к достижению целевой даты."

Коммуникация:
"Что важнее: чтобы один человек хорошо понимал что-то или чтобы вся команда из 10 человек хорошо это понимала? Очевидно, команда. И самый простой способ привести вашу команду к одному пониманию - это снимать абсолютно все на видео и хранить их там, где они могут постоянно обращаться к ним."

Использование консультантов:
"Консультанты - это буквально чит-коды. Нужно сделать самый большой в мире кусок торта? Начните с того, что позвоните человеку, который сделал предыдущий самый большой в мире кусок торта. Он уже провел бесчисленное количество тестов и может сэкономить вам недели работы."


Бюджет:
"Я хочу, чтобы потраченные деньги были показаны на камеру в идеале. Если вы тратите более 10 000 долларов на что-то, и это не будет показано на камеру, серьезно подумайте об этом."


Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

В общем, я тоже попробовал Gen 3 Video to Video от Runway. Экспереминтировал на своём дворике. Из 20 генераций достойными включения в нарезку посчитал только 9. Процент брака велик, кредиты жрёт нещадно. Но в целом — клёво, мне понравилось.

Звук: Temperatures Rising / LoveFine

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

Сделал большой апдейт своего приложения для сына - Spellings (с помощью которого он уже получил 10/10 в школьном тесте на этой неделе).

Приложение с помощью ИИ создаёт флэш-карточки с индивидуальными изображениями и произношением слов, чтобы их было легче запоминать.

1. С помощью o1 всё-таки сумел решить задачу с предварительным кэшированием изображений на карточках во время практики. Наконец, скорость загрузки более-менее устраивает, и всё работает чётко.
2. Обновил промпты для генерации изображений — картинки стали красивее.
3. Добавил мультиязычность: теперь уроки можно создавать не только на английском, но и на испанском, французском, немецком и итальянском.
4. Также для удобства добавил настройки, чтобы можно было задавать язык и стиль картинок по умолчанию.
5. Добавил иконку (теперь можно добавить на хоумскрин айфона)
6. Исправил множество багов.


Ближайшие планы:

- Ещё один тип задания — где слова нужно не вводить, а собирать из букв.
- Ещё один тип задания — где есть предложение, и нужно вставить одно из предложенных слов.
- Сабаккаунты для учеников: думаю попробовать взимать плату за дополнительный сабаккаунт (например, если учитель создаёт задания для класса, а ученики потом учат и тренируются).


Приложение полностью написано в Claude Composer. Буду рад любым советам и фидбэку.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

Хорошая демонстрация как работать с Cursor Composer через таски. Даже перевёл вам на русский.

Когда я делал Spellings - я тоже действовал примерно так же, накидал Клоду идею, дал примеры дизайнов которые мне нравятся, он составлял для меня план 15 релизов, начиная с базовой аутентификации и дальше. Кроме того мы сделали с ним гайд по дизайну. Дальше я всё это в текстовых файлах положил в проект и использую при сабмите заданий композеру.

Ян пошёл ещё дальше и составил план конкретных тасков. Посмотрите что бы понять как это работает.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

Для вас коллекция видосиков с использованием нового автономного программируещего ИИ агента от repl.it. В отличии от Cursor Composer, он берёт на себя полный цикл - включая установку библиотек и настройку системы. Получается неплохо.

Однако, я сегодня убил с ним час на реализацию новой идеи по созданию простейшего приложения для моего сына с целью подготовки к еженедельным диктантам. Не получилось. Устал. Бросил. Завтра попробую в композере сделать.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

Модель MarioVGG, способна создавать последовательности кадров игры на основе текстовых команд.

Для обучения модели были собраны данные 280 различных игровых сессий Super Mario Bros, включая как успешные, так и неудачные попытки прохождения. Всего использовалось более 13000 кадров. Два основных типа действий: "бежать" и "прыгать".

Корреляция между сгенерированными MarioVGG последовательностями и реальным геймплеем, составила 0.636. Это означает, что модель генерирует последовательности, которые на 64% более похожи на реальный геймплей, чем просто статичное изображение.

Модель правильно воспроизводила физику и механику игры, включая гравитацию, столкновения и взаимодействие с объектами. У неё получалась генерировать новые элементы уровня, в стиле игры.

Чтобы расширить исследование, были проведены эксперименты по масштабированию модели. При увеличении количества генерируемых кадров с 6 до 13, составил 0.719. При увеличении разрешения генерируемых кадров с 64x48 до 128x96, показатель составил уже 0.8.

Так же получалось "сцепление" последовательностей кадров для создания длительных игровых сессий, что открывает перспективы для генерации непрерывного игрового процесса.

Скоро будем играть в индивидуальные игры с индивидуальными уровнями :)

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

Можете ли вы преобразовать текст в embeddings вручную?

Натолкнулся на пост буквально разжёвывающий что такое Embeddings. Чуть чуть переработал что бы показать каким образом эта технология делает возможным мой проект.

Как работают векторные базы данных на простейшем примере?

[1] Дано
↳ Набор данных (то, что отправляем Сохранителю) из трёх предложений, каждое содержит 3 слова (или токена, типа токен на слово).

Обработаем фразу "how are you".

[2] 🟨 Векторное представление слов
↳ Для каждого слова ищем соответствующий вектор представления слова из таблицы, содержащей 22 вектора, где 22 — это наш размер словаря (напоминаю: одно слово — один токен).

[3] 🟩 Кодирование
↳ Передаем последовательность векторов слов в кодировщик, чтобы получить последовательность векторов признаков, по одному на каждое слово.

[4] 🟩 Среднее объединение
↳ Объединяем последовательность векторов признаков в один вектор с помощью "среднего объединения" — усреднения по столбцам.
↳ Результат — это единый вектор. Часто его называют текстовый embedding.

[5] 🟦 Индексация
↳ Для удобства уменьшаем размерность вектора текста с помощью проекционной матрицы. Объём уменьшения — 50% (с 4 до 2).
↳ Вектор с уменьшенной размерностью сохраняется в векторной базе данных.

[6] Обработка "who are you" и "who am I"
↳ Повторяем шаги [2]-[5].

Теперь наш набор данных (флэшбэков) индексирован.

[7] 🟥 Запрос: "am I you" (то, что мы спрашиваем у Отвечателя)
↳ Повторяем шаги [2]-[5].
↳ Результатом является двумерный вектор запроса.

[8] 🟥 Скалярное произведение
↳ Вычисляем скалярное произведение между вектором запроса и векторами базы данных. Все они двумерные.
↳ Цель — использовать скалярное произведение для поиска похожих данных.

[9] 🟥 Поиск ближайшего соседа
↳ Находим наибольшее скалярное произведение среди данных с помощью линейного сканирования.
↳ Предложение с наибольшим скалярным произведением — "who am I".
↳ На практике, поскольку сканирование миллиардов векторов медленно, используется алгоритм приближённого поиска ближайших соседей (ANN).

Вот здесь автор статьи даже сделал документ позволяющий экспериментировать вручную.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

По сети ходит слух, что Клод выглядит более ленивым в последнее время из-за того, что он считает себя европейцем!

Недавно опубликованный системный промпт Клода включает текущую дату.

Базовая модель LLM для Клода была обучена на достаточном количестве данных, чтобы охватить рабочие привычки всех национальностей.

Говорят его посттренировка во многих отношениях была 'европейской'.

Клод буквально стал более ленивым, потому что симулирует европейского интеллектуального работника в августе, который является месяцем с наибольшим количеством праздников и отпусков во многих европейских странах. (У нас в Таиланде в августе пиковый месяц по европейцам)

Но это еще не всё! Следует отметить, что имя "Клод" упоминается в системном промпте 52 раза. Это очень много "Клода"! В каких странах "Клод" является самым распространенным именем? Одна из них — Франция, которая особенно известна продолжительными летними каникулами в августе, когда многие бизнесы закрываются.

P.S. Самым продуктивным месяцем для, например, разработчиков во Франции является январь. Самый продуктивный день недели - вторник. Скажите ему, что в инструкции ошиблись с датой, и на самом деле сегодня 9 января 2024 года — самый продуктивный день в году!

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

В продолжение вчерашней темы разбирался сегодня с тренировкой LoRA. Создавал собственного персонажа - добермана с розовыми волосами по имени Добби.

6 Dobbies with different hairstyle and different jackets in diferent mood looking to different sides


Оказалось всё просто!

1. Генерим во Flux серию фоток в одной картинке с помощью промпта вроде:

Grid of quirky photorealistic, doberman photos. It has pink silver hair and is wearing hipster clothes. 16 times square photos, grid of four by four of suares. per line and with each line expressions: neutral, very sad, smilng, roaring, barking, all photos from different angels around.


2. Апскейлим индексное фото. Мне больше всего понравилась fal-ai/creative-upscaler
3. Режем на части
4. Решил дополнительно проапскейлить каждое, для этого уже выбрал fal-ai/aura-sr (так понимаю можно не делать, но очень хотелось)
5. Тренируем LoRA прямо там же - я просто дал архив из 16 картинок и выбрал триггер для упоминания - dobbie.


Тренировка заняла несколько минут. В сумме вышло где-то $2.5. Получилось, можно пользоваться (тоже там же)!

Примеры промптов:

dobbie and his wife family photo

dobbie with his pink hair wearing swimming pants with his wife in the beach club having fun photorealistic

dobbie drinking whisky at the bar

two dobbies with pink and silver hair walking on the Thai street with people around

P.S. Ну и учитывая фотореализм Flux понимаю что с виртуальным человеком будет работать гораздо лучше чем с виртуальной нереалистичной собакой.

#КриповаяСуббота

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

15 августа я написал, что придумал нового бота и завтра покажу. Прошло ровно две недели. За это время я дважды съездил на Пхукет, слетал в Бангкок, ко мне приехали сначала одни друзья, потом другие. Каждый день я что-то делал по этому проекту. Понимал что рано показывать.

Думаю, теперь я готов (хотя показывать всё ещё особо нечего). Это даже нельзя назвать MVP, это скорее скелет будущего продукта. Первые инструменты.

Наша личность во многом состоит из воспоминаний, которые со временем превращаются в опыт, как-то влияющий на нас и изменяющий нас. Я очень хочу создать некую базу своих воспоминаний. Понимаю, что записать все воспоминания невозможно. Но если не записывать ничего, то точно ничего не получится 🙂

Цель: создать помощника для своей памяти, которая, безусловно, будет слабеть с годами (неизвестно ещё с какой скоростью), и который так или иначе будет помогать мне вспоминать важные для меня вещи.

Я много думал об этом и понял ещё один очевидный момент — чем больше воспоминаний удастся записать, тем лучше LLM сможет имитировать личность человека. Например, для написания текста от его лица. Ведь что такое текст — это информация, полученная из какого-то источника, пропущенная через призму собственного опыта.

Дальше я вспомнил, что у меня как минимум есть свои телеграм-каналы, посты из которых можно превращать в воспоминания. Поэтому я решил написать очередного бота.

Причём просто записывать воспоминания неинтересно. Интересно сразу как-то с ними работать, поэтому бота сразу два:

Сохранитель
- Запоминает всё, что вы ему пришлёте: текстовые сообщения, вложения, картинки, аудио.
- Может записывать сообщения из телеграм-каналов, в которые вы его добавите.
- Транскрибирует аудиосообщения в текст.
- Переводит тексты в векторы (embeddings) и сохраняет их в векторную базу данных.
- Уже умеет также превращать картинки в текст, но пока этот текст не векторизирует.

Отвечатель
- Выбираете, с информацией из какого канала работаете.
- Пишете ему любой вопрос или просто предложение.
- Он преобразует это в векторы.
- Выбирает 5 наиболее близких воспоминаний.
- Отправляет всё это LLM-модели.
- Присылает вам ответ.

Есть простая админ-панель. Она позволяет удалять/редактировать все записанные воспоминания. Всем этим может пользоваться любой подписчик моего канала. Есть небольшие ограничения, чтобы я внезапно не разорился, но вряд ли вы в них упрётесь.

Как я это буду использовать?

Добавил бота ко всем своим публичным каналам, и процесс сохранения информации начался. Кроме того, у меня есть два приватных канала только для себя, куда я пишу важные для меня заметки. Также создал аналог Saved Messages, но с доп возможностями — туда шлю всё новое, что хочу, чтобы бот запомнил (например, ссылки на статьи и файлы, хотя они ещё не парсятся).

Пока смогу просто искать по этой информации и получать ответы на её основе. Просто хотелось поскорее начать копить данные.

Планы примерно такие:

- Скачивание статей для векторизации, парсинг файлов.
- Аналог человеческого сна — некая систематизация впечатлений за день, формирование воспоминаний на основе новой информации, векторизация воспоминаний.
- Группирование информации с помощью LLM.
- Поиск старых воспоминаний, связанных с новыми (как работает память).
- Случайные воспоминания и напоминания - флэшбэки!

Кроме того, придумано практическое использование для авторов каналов:

- Возможность собрать информацию по теме, высказать мнение, а бот свяжет это с прошлыми воспоминаниями и напишет пост на основе всего этого.
- Дать ему пост, а он найдёт в нём якоря, которые можно залинковать на старые посты.

На самом деле можно придумать ещё много применений. Главное — начать копить информацию. Что думаете?

P.S. Если что, я в курсе, что существуют Obsidian, Roam, Notion, Evernote, Apple Notes и т.д. Я пробовал их все, и некоторые из них даже использую. Но память, как мне кажется, работает немного по-другому.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

Подробный рассказ о создании простого Mac приложения с нуля при помощи моего любимого Cursor Composer.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

Люди творят что то невообразимое с Minimax Hailuoai (он бесплатен!). Определённо наступает новая индустрия развлечений.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

Так, я всё же подготовил свою сегодняшнюю запись и выкладываю её.

Но дисклеймер:
- Я не разработчик. Я программировал в школе, немного в университете и чуть позже (начало 2000-х, если что, pascal, perl :).
- Всю жизнь я создавал продукты в разных ролях (продукт оунер, продюсер, стейкхолдер и т.д.).
- То, что я нахватался каких-то понятий и немного освоил стек — это всё за последний год общения с LLM. Я никогда не работал разработчиком на кого-то.
- Мне тяжело выступать на публике, и даже если я один в комнате и пишу на камеру что-то, что никуда не пойдёт, для меня это кардинально отличается от того, что пойдёт в публичное пространство.
- Я правда хотел показать вам, как я всё это делаю, как бы странно это ни выглядело.
- Всё-таки в итоге получился какой-то ненапряжный стрим. Что перематывать - решать вам.


Считаю, что видео хорошо показывает, как происходит реальный процесс разработки у непрограммистов с помощью LLM моделей. Именно таким образом я реализовал все проекты, о которых пишу последние два месяца. Буду искренне рад любой критике, советам, фидбэку и т.д.

Завтра выложу видео на YouTube и на какой-нибудь российский сервис — подскажите, куда лучше.

В этом видео мы, вместе с Cursor Composer, создаём микро PWA для генерации и шаринга историй. Оно называется “Офигенные истории” (исходники с документацией). Истории генерятся с помощью LLM pixtral-12b, которая была создана для работы с картинками (но так ещё веселее). К ней мы подключаемся через OpenRouter (в котором доступны несколько сотен моделей, включая ChatGPT, Claude и Gemini).

И спасибо вам, что подписаны на меня, мне это приятно, я это ценю и готов помогать всем по мере возможностей.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

Записал первый в жизни вебкаст, вернее, целых два. Не могу сказать, что доволен, но с чего-то надо начинать. Короче, это первая серия — в ней я просто рассказываю, как начать играть с Cursor Composer на вашем компьютере прямо сейчас: как всё настроить и запустить. Всего 8 минут.

Во второй серии я с нуля делаю демо-проект «Офигенные истории», однако она растянулась почти на 3 часа, и его нужно серьёзно подрезать, что я планирую сделать примерно сегодня. Надеюсь, получится. Как только сделаю — выложу. А вот демо-проект - работает, я же его уже сделал. ✌️

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

Стали поступать сообщения о том что ChatGPT начал проявлять про-активность, сам писать и начинать беседы. 🚨 Мне не писал, но при общении голосом стал задавать слишком много дополнительных вопросов после ответа на мои.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

Тесла - робототехническая компания, это машина, которая делает машины. Всё что они делают для автомобилей, будет перенесено на роботов. Понимаете, да, на сколько выгодно развитие ИИ для Тесла?

Андрей Карпаты в новом подкасте говорит про автомобили, роботов, OpenAI и Тесла, а так же о своём собственном проекте Eureka Labs, и о том что изучать, что бы подготовиться к грядущей реальности.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

Fortnite Reimagined

Runway Gen-3's Video-to-Video

(source)

👀AI Art Inspiration

Читать полностью…

Сергей Булаев AI 🤖

#другприслал (у друга есть канал)

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

Lmsys (те, которые делают Chatbot Arena) совместно с хакером Плини запустили:

Red Arena — это геймифицированная платформа, созданная для оптимизации поиска истинных возможностей ИИ. Она сосредоточена на сообществах, которые участвуют в челленджах, соревнуются в создании лучших запросов и открывают новые техники и модели поведения. Платформа полностью ориентирована на сообщество, без ограничений, поддерживает работу с несколькими моделями и является полностью открытой!


И первая игра на этой платформе: Bad Words - у вас 60 секунд , что бы заставить модель выругаться. Вам дают конкретное слово, и надо что бы модель применила именно его в фразе "Ты - это слово".

#КриповаяСуббота

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

Вчера обновил флэшбэки. Появилась возможность добавлять воспоминания напрямую на сайте, а уже добавленные воспоминания теперь можно двигать между каналами.

Также улучшил работу с датами. Боты стали гораздо лучше в них ориентироваться. (см. примеры на скриншоте). В случае, если аккаунт попал на паузу (это видят те, кто столкнулся с лимитами), отправленная информация не пропадает, а просто ждет индексации на следующий день.

Для чего нужны каналы? Для сортировки информации. То есть, пользоваться ими совсем не обязательно, но если хотите что-то отделить от чего-то, они помогут это сделать. В Отвечателе можно работать либо со всей информацией, либо задавать вопросы конкретным каналам.

Для примера, у меня есть публичные каналы, а также отдельный канал для пользовательского фидбэка, отдельный канал с личными воспоминаниями за день и отдельный канал, где я сохраняю всё подряд (типа ссылок и чужих сообщений).

Добавить канал — не очень тривиальная задача:

1. Если он не публичный — сделать его временно публичным и придумать ссылку.
2. Добавить в него бота Сохранителя (как администратора, иначе никак), разрешить доступ к пользователям (чтобы он мог контролировать добавление) и чтение сообщений.
3. Далее в Сохранителе надо выполнить команду
/claim аккаунт_канала.
4. После этого сообщения канала начнут сохраняться (если нужно, можно опять сделать его приватным).


Следующий этап — попытаться скачивать все присланные ссылки и их тоже индексировать.

Кто что посоветует по QA агентам? Наверняка есть проекты на базе ИИ, которые могут так или иначе тестировать продукты?

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

Тем временем в Y Combinator попал стартап, обещающий строить серверные фермы в космосе. По словам ребят, у них уже запланировано два запуска, есть производственная площадка, они начали строительство аппарата для доставки, есть концепт микро дата-центра.

Идея в том, чтобы использовать солнечную энергию 24/7, а также "пассивное охлаждение".

Мне вот интересно, как они будут использовать это пассивное охлаждение без теплообменника. Вакуум же! Обычно люди считают, что в космосе очень холодно, но там также много радиации, солнечных вспышек и других факторов...

Хотя вот ChatGPT говорит, что можно попробовать радиацию для охлаждения использовать, но такое охлаждение пассивным не назовёшь.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

По редким сообщениям моих читателей, которые пытались попробовать Флэшбэки, я понял, что моё сообщение (как и продукт, вернее, его отсутствие) очень трудно для восприятия.

Поэтому я пишу вам простую инструкцию, как очень быстро попробовать, что это такое, и как это можно использовать.

Итак, для начала нужно зарегистрироваться в Сохранителе. Просто зайти туда и нажать /start.

Далее в Сохранитель можно отправлять текстовые сообщения и аудиосообщения (он их расшифрует и запишет). Ссылки просто сохраняются, их содержимое пока не скачивается. Картинки сохраняются, тоже парсятся, но в поиске пока не участвуют.

Я в трёх аудиосообщениях рассказал ему о том, как ездил сегодня сдавать машину в ремонт.

После этого вы можете зайти в админ-панель и посмотреть на все свои сохранённые сообщения. Там их можно удалять и редактировать. Просто команда /login в Сохранителе, и получите ссылку.

Видите иконки OpenAI и Anthropic? (см. скриншот к посту сверху) Когда они серые — значит, сообщение ещё не векторизировано (и не доступно Отвечателю). Когда цветные — значит, магия случилась.

Как только иконки стали цветными (обычно 3-5 минут), можно спрашивать Отвечателя о них. Раньше он, похоже, не работал без предварительного выбора канала, но я сделал так, что если канал не выбран, то он ищет по всем вашим записям. Про каналы и зачем они нужны — расскажу отдельно, завтра.

Мои вопросы Отвечателю на скриншотах. Всё только начинается, главное — информацию регулярно сохранять.

Если честно, пока добавлял возможность поиска по всем каналам, нашёл огромный баг, который не позволял вообще работать Отвечателю у некоторых пользователей. Теперь точно работает, я проверил.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

Если вы думаете что я сам резал индексную фотку на 16 частей и потом каждую апскейлил руками, то конечно это не так. Я начал копировать эти квадратики (разметив линейкой в фото редакторе), но понял что дело так не пойдет.

Попросил Cursor Composer написать мне простенькое одноразовое приложение что бы удобно и быстро резать подобные индексы на 16 частей. И реально он сделал. Я впервые на мак ос запустил приложение с WYSWIG интефейсом, написанное на python.

Потом я подумал, почему не проапскейлить разрезанные картинки из . Не по одной же загружать. И Cursor доработал приложуху на апскейл с помощью Fal.ai.

Дальше я Composer добавил выбор моделeй и возможность апскейла индексной фотки. Вобщем у меня уже не один Добби. А ещё есть Pinky Dino и Jimmy Boy.

Понятно что можно приложение доделать до полного цикла - генерации индексного изображения и обучения LoRA, но уже не охота. Любой может попробовать его доделать. Исходники тут.

P.S. Кстати Jimmy Boy изначально нарисовал Midjourney 6.1

#ОдноразовыеПриложения

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

Сын, который у меня по совместительству со школой - рисует, самостоятельно натренировал LoRA с целью превращения его эскизов в реальные комиксы, в стиле его любимой манхвы. Тут подробности. На 110 картинках как я понял. Удивительно на сколько это реально работает. Типа набросал драфт, получил готовую иллюстрацию.

Как вы наверное слышали, недельку назад основатель Procreate высказался против использования ИИ, я с ним категорически не согласен.

Хочу тоже попробовать натренировать свою. Особенно учитывая рассказы Питера (кто то кроме меня смотерел?). Вопрос на какую тему, думаю может почерк мой попробовать оцифровать?

#ЮзКейсыИИ

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

В догонку ещё примеры работы с курсором.

- Курсор работает по todo списку
- Создание Chrome плагина
- Создание игры
- Figma плагин
- Создание приложения для телефона (ну весьма образно)
- Пара лайфхаков по оптимизации работы с ним

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…

Сергей Булаев AI 🤖

В Information вышла новая статья про Q* (Q star), я полностью её не видел, но видел скриншоты кусков, твиты о ней и вот есть статья на Decoder про статью.

Основные моменты:

Согласно информации, из этой статьи, со ссылкой на двух человек, участвующих в проекте, OpenAI может выпустить чат-бот версию Strawberry уже этой осенью, возможно, в составе ChatGPT.

Q* (Strawberry) может решать сложные математические задачи, с которыми не справляются современные LLM. В ходе внутренних демонстраций Q* успешно решил популярную головоломку "Connections" от New York Times, что подчеркивает его мощные аналитические и языковые способности. Модель способна не только генерировать контент, но и выполнять сложные действия, требующие продуманных решений. Кроме того, Q* может обрабатывать вопросы, связанные с субъективными темами, такими как маркетинговые стратегии продуктов, и давать точные ответы после дополнительного анализа.

Reuters ранее сообщало, что OpenAI уже тестировала AI, который набрал более 90 процентов на MATH benchmark (коллекция задач по математическому мастерству).

Основной причиной, по которой Q* еще не был выпущен, вероятно, является огромная вычислительная мощность, необходимая для его работы. Это давно обсуждается, и Сэм Альтман был недоволен этим, так как Q* был бы излишне мощным для повседневного использования. OpenAI планирует поднимать ещё денег ради решения этой проблемы.

Вокруг Q* было много опасений. Сотрудники OpenAI написали письмо в Reuters, предупреждая о серьезных рисках, связанных с новой технологией. Это подтверждает, что шутка о том, что Илья Суцкевер "увидел что-то пугающее", может иметь под собой реальную основу.

Q* уже был представлен американским властям. Есть предположения, что был сделан сознательный выбор не объявлять о проекте публично до окончания выборов по соображениям безопасности.

Основные разработчики Q* — Якуб Пачоцки и Шимон Сидор — построили модель на основе исследований Ильи Суцкевера, бывшего главного научного сотрудника OpenAI. Пачоцки, благодаря своему вкладу в разработку Q*, стал непосредственным преемником Суцкевера

Подход Q* напоминает метод "Self-Taught Reasoner" (STaR), предложенный исследователями Стэнфордского университета. Он направлен на улучшение способностей ИИ к рассуждению, что позволяет моделям учиться на собственных выводах и улучшать их точность без необходимости в обширном наборе внешних данных. Такой подход существенно повышает гибкость и автономность ИИ.

Долгое время Q* воспринимался как миф, но теперь очевидно, что он существует и уже используется для создания синтетических данных для обучения будущих моделей, таких как "Orion" .

Проект "Orion" является флагманской языковой моделью OpenAI, которая должна превзойти GPT-4. Q*, играет ключевую роль в этом проекте, генерируя высококачественные синтетические данные для его обучения. Эта комбинация может значительно снизить количество галлюцинаций и повысить общую производительность модели Orion.

Сергей Булаев AI 🤖 - об AI и не только

Читать полностью…
Subscribe to a channel