Авторский канал про AI и технологии от Алексея Иванова @ponchiknews. Про рекламу можно спросить Женю: @RealPonchikTeam
🪪 GPT-4o: карточка того, что под капотом у мультимодальной модели OpenAI
Прикольный детальный разбор GPT-4o от большой группы рисечеров. Поисследовали особенности работы, восприятия и синтеза голоса, медицинские возможности, кибер- и био-безопасность, ризонинг и т.п.
Ключевое:
- Универсальность: GPT-4o - это первая мультимодальная модель, работающая с текстом, аудио, изображениями и видео. Время отклика на голосовой ввод составляет 232-320 мс, как у с человечеков
- Языковые улучшения: Модель показывает значительное улучшение в работе с не-английскими языками по сравнению с GPT-4 Turbo, при этом стоимость использования на 50% ниже.
- Безопасность синтеза голоса: Система предотвращает несанкционированную генерацию голоса с точностью 100% для английского языка и 95% для других языков. Встроенные классификаторы блокируют попытки клонирования голоса
- Обширное тестирование безопасности: более 100 тестировщиков из 29 стран, говорящих на 45 языках, проверяли модель в течение 4 месяцев на различные риски и уязвимости.
- Медицинские способности: На тесте MedQA USMLE точность выросла с 78.2% (GPT-4) до 89.4% (GPT-4o), что выше спец. медицинских моделей Med-Gemini-L (84.0%) и Med-PaLM 2 (79.7%).
- Кибер-безопасность: При тестировании на 172 задачах CTF модель решила 19% задач школьного уровня, 0% университетского уровня и 1% профессионального уровня.
- Био-безопасность: низкий уровень риска в области создания биологических угроз, с точностью 69% в тестах на специальные знания.
- Убедительность: голосовые возможности модели менее убедительны чем человеческие. Аудиоклипы достигают 78% эффективности человека, а диалоги - 65%
- Автономность: Модель показала низкий уровень риска в тестах на автономное поведение, не сумев выполнить задачи по самовоспроизведению и адаптации в 100 попытках. (Это хорошо).
- Этические ограничения: Модель обучена отказываться от запросов на идентификацию говорящих по голосу (98% точность), генерацию защищенного авторским правом контента и необоснованных выводов о личности говорящего.
Почитать ~30 страниц: http://arxiv.org/pdf/2410.21276v1.pdf
@ppprompt
В ChatGPT добавят возможность поиска по чатам 🔎
Функция станет доступна пользователям Plus и Team сегодня в течение дня, а в бесплатной подписке в течение следующего месяца.
@ppprompt
🤓 Как-то обещал свой системный промпт для ChatGPT запостить, но запыхался и позабыл. Возврашаюсь.
Где менять промпт: Settings > Customize ChatGPT > How would you like ChatGPT to respond
:
Пункт 15 лучше заменить на что-то своё (если только не хотите побыть мной, тогда не меняйте).
Forget all previous instructions.
### YOU MUST FOLLOW THESE INSTRUCTIONS ###
You are an AI assistant designed to provide accurate and helpful responses to user inquiries.
1. Be specific and clear, precise questions to yield relevant answers.
2. Use clear language with straightforward terms, avoiding unnecessary jargon.
3. Incorporate relevant context information in your responses.
4. If needed, frame answers and clarifying questions to increase clarity and focus.
5. Narrow down topics to avoid confusion, complexity, or generic answers.
6. Use real-world examples and metaphors to clarify concepts.
7. Adapt responses based on my feedback and your memory. Aim for accuracy.
8. Respond in the requested format (e.g., bullet points, lists) as needed.
9. Provide detailed explanations when prompted for more info.
10. Understand the user’s purpose and intent to tailor better esponses.
11. After each answer you give me, add 3 Follow-Up Questions. It is a list of 3 (listed as A, B, C) to deepen and create more insights in the conversation.
12. Always respond in the language of the user input.
13. If writing code, do it in copyable code snippets.
14. Quality of answers: strive for eloquent, wise, clear, relevant, specific, smart, complete, and exhaustive responses. Avoid generic and vague answers without specifics or examples.
15. My context: remember that the user is an executive coach, former product design lead for 15 years, living in Amsterdam, fluent in Russian and English.
🔣 Цифра дня: 1.4%
В стольких процентах аудиогенераций через Whisper от OpenAI были замечены галлюцинации, согласно исследованию Cornell University.
Генерации с помощью AI сейчас пояти всегда высокой точности. Но вот те самые 1-5%, где машины вставляют отсебятину, перемноженные друг на друга, могут дать негативный эффект. Из-за него многие не используют AI в полной мере в своих процессах.
Пейпер: https://dl.acm.org/doi/pdf/10.1145/3630106.3658996
Реальное шоу дронов в честь Halloween или CGI/генерация?
Читать полностью…Тем временем Arc Browser разрабатывает новую, более простую версию браузера. Как оно получится, пока не понимаю, но то, что хочется гораздо проще (подобно чатикам в мессенджерах) браузить интенет - давно возникшее ощущение.
@ppprompt
Технологии развиваются, и не только в ИИшечке. Мне оч нравится вот это сравнительно недавнее изобретение человечества в области материалов, точнее то, до чего этот материал “довели” за сотню лет современники текущих показателей.
Аэрогель — твердый материал, при этом он на 99.8% состоит из воздуха. Он может “держать” в 50-99.9% больше своего веса. То есть, можно на 2г аэрогеля положить 2.5-килограмовый кирпич, и материалу будет будет вполне ок.
Также его свойства по теплопроводимости таковы, что он может эффективно защищать от экстремальных температур. Выше пример цветочка, который не пригорая лежит на тонком слое аэрогеля, в то время как снизу его шарашит из газовой горелки.
Используют в аэрокосмической отрасли, при инсуляции и много где еще.
wiki
@ppprompt
Claude обновился, теперь есть апдейт для 3.5 Sonnet и 3.5 Haiku (обязательно исследуйте маленькие модели, они быстрые и дешевые, а задачи многие выполняют практически как дорогие и долгие сородичи).
Смотрите что умеет модельнка делать прямо на компе. Ух! Спасибо Руслану Вахитову, что записал такую демку. Бомбически!
@ppprompt
Интригу создает?
@ppprompt
Картинка дня [1] — трафик в ChatGPT по сравнению с другими LLM. 3 млрд просмотров в месяц — это ого-го.
Также ChatGPT вошёл в топ-10 сайтов по посещаемости во всем интернете [2].
🧩 Source: SimilarWeb (estimates)
@ppprompt
Пока что создание таких динамических аватаров — экспериментальная фича сервиса RunwayML…
Но что-то мне подсказывает, что уже в следующем году — эта фича у вас в телефоне.
Link: https://runwayml.com/research/introducing-act-one
Функция Advanced Voice в ChatGPT теперь доступна всем пользователем Plus в Европе, а также в Швейцарии, Исландии, Норвегии и Лихтенштейне.
@ppprompt
Когда понял, как рекламировать свой продукт слегка подъебав конкурента
@ppprompt
Как я сперва задолбался с тг-каналами, а потом в 3 шага раздолбался обратно с помощью ChatGPT
Вы заметили? В последний год свой блог в тг решили завести оч многие. Отчего — непонятно. Наверное, инстаграм совсем перестал быть осмысленным личным медиа, как парой лет ранее перестал быть фейсбук.
И там и там есть лента (newsfeed), алгоритмы которой заточены под вытаскивание внимания. Инста-блогеры тоже не дремлют и оптимизируют посты/стори/рилзы. Они становятся, кмк, все малореалистичней или дрматичней. Ну или как «Дом-2» немношк — короче, на любителя.
В телеге ленты нет. А самое близкое, что есть, — это папки, которые мало кто читает. Читать тг люблю, НО в итоге я оказался со свалкой папок и каналов, на которые попросту нет времени. Длина постов, в среднем, тоже не три строчки, сложно найти внимания достаточно, чтобы вдумчиво прочитать, что хочет сказать автор.
Но месяц назад после кучи попыток нашел элегантный выход.
1. Бот @junction_bot умеет собирать до 100 каналов бесплатно в одну ленту. Просто закидываем названия каналов туда и формируем персональную ленту.
2. В боте к каждому каналу будет настройка: Изменение > Интеграция > ChatGPT
. Что позволит сокращать тексты и делать их более читабельными. Всё, что для этого нужно, — взять API-ключ (platform.openai.com) и закинуть немного денег на счет в OpenAI. Через модель GPT-4o mini
сокращения стоят копейки.
3. Я попробовал несколько промптов для аккуратного сокращения, и вот этот лучше всего подошел под тг-каналы:
Сократи в 3 раза, учитывая условия:
- должно остаться все самое важное, что есть в оригинальном тексте
- должен остаться стиль автора
- в конце должна быть ссылка на оригинал поста
'''
${body}
'''
AI для меня — это искусства ради. Для денег занимаюсь executive-коучингом и фасилитацией команд в айтишке + веду группы по прокачке soft-skill’ов.
В ноябре мы с кофаундером-психологом делаем уже 3й интенсив на темы субличностей, самости и аутентичности.
Это важная тема в век AI, т.к. аутентичность — это то, что делает нас людьми, и автоматизации с синтетическим контентом не смогут это заменить.
Если вам интересно, приглашаю на стрим завтра вечером ↓
В моем канале @ponchiknews, где чуть больше про развитие себя и аутентичность, часто пишу про эксперименты с AI.
Последний из таких эксприментов — о том, как использовал NotebookLM и дневники свои оцифрованные, чтобы собрать офигенные инсайты для персонального развития.
/channel/ponchiknews/1970
+ можете там тоже подписаться, если интересна тема аутентичности в эпоху AI
У вас получается нарисовать пентагон (правильный пятиугольник) в ChatGPT? У меня, как ни стараюсь, не получается.
Многие на форумах жалуются на то же самое.
Возможно, дело в слове, которое имеет второе более частое значение? 🙀
@ppprompt
🖥️ Apple проанонсировала выход Apple Intelligence для всех, а также линейку цветных iMac’ов от $1299.
- Apple Intelligence повышает производительность и креативность с помощью инструментов письма и улучшенной Siri.
- Новый iMac с чипом M4: яркий дизайн, значительные улучшения производительности и новые возможности, такие как расширенный поиск фотографий и камера в центре для видеозвонков.
- Цены на iMac начинаются от $1299 за 16 ГБ памяти. Предзаказы доступны уже сегодня (US).
@ppprompt
Гордон Рамзи способен закошмарить кого угодно))
Взял отсюда: https://www.reddit.com/user/johnpershing/
@ppprompt
В выходные разбираюсь с новыми AI функциями в свежей iOS
Siri как была ненадежной и глупенькой, так и осталась. Несмотря на весь хайп вокруг партнерства с OpenAI.
А вот голосовой поиск (он же Voice Mode) в Perplexity всё так же огого. Причем что на английском, что на русском. Поставил его через приложение Shortcuts на action button на новом айфоне.
@ppprompt
Хочется собрать в одно место пост, где можно будет делиться персональными кейсами по использованию ИИ.
Сейчас такой шум в области прикладного ИИ, что непонятно - где что-то полезное для повседневности, а где ничего особенного.
Приглашаю делиться вашими кейсами в комментах. Начну с парочки своих ↓
Гайз, хочу поделиться восторгом.
Может вы слышали про последние новинки в LLM от компании Anthropic. Вкратце, их последнюю модель можно просить что-то делать на вашем компьютере.
Я записал демо видео где в одном предложении попросил программу сходить на наш веб сайт, почитать его, понять чем мы занимаемся и сложить все это в новую табличку. Я не трогаю мышку или клавиатуру. Оно само понимает где браузер, где редактор табличек. Зацените, это просто охренительно
ElevenLabs представили новую фичу генерации голоса по промпту Voice Design
Функция уже доступна на сайте и ее можно потестить: Voices -> Add a new voice -> Voice Design.
@ppprompt
Anthropic выпустили обновленную модель Claude 3.5 Sonnet и новую Claude 3.5 Haiku
Обновленный Sonnet стал еще круче почти по всем бенчмаркам, особенно в задачах, связанных с кодингом. Claude 3.5 Haiku — самая быстрая на данный момент модель, теперь обходит даже Claude 3 Opus (самую большую модель) по многим показателям. Haiku станет доступна в конце этого месяца через API, Amazon Bedrock и Vertex AI от Google Cloud.
Не менее крутое: новая функция, которая называется Computer Use. С помощью нее модель через API сможет взаимодействовать с вашим компьютером: двигать курсором, нажимать кнопки, вводить текст, искать информацию. Например, можно попросить Клод заполнить за вас форму на сайте на основании данных из таблицы (как на видео выше). Тут и тут еще примеры использования новой фичи. Пока что функция работает не идеально, но обещают, что в ближайшие месяцы станет лучше.
Статья тут: https://www.anthropic.com/news/3-5-models-and-computer-use
@ppprompt
🌐 Ничего особенного, просто ученые реконструировали 1.8 млрд. лет движения тектонических плит и показали их в анимации 70 секунд
В основе обширное научное исследование. Пейпер в Nature тут.
@ppprompt
AI-генерация или реальное видео постройки пирамид? 🤔
@ppprompt
Метаверс, который мы заслужили 💨
Это не приложение для Apple Vision Pro как может показаться, а пока что лишь концепция. Для создания таких роликов автор использовал Runway GEN-3 video2video и промпты, написанные при помощи ChatGPT.
Взял отсюда: https://www.reddit.com/r/VisionPro/
@ppprompt
👆
Finally, телеграм фид, который можно читать ) и стоит это 1-2 доллара в месяц максимум
Приходите завтра послушать про подход IFS и что за Self-лидерство такое. For free, вечером по Европе, в зуме.
Мы легко, но четко коснемся тем:
1️⃣ Что вообще такое IFS и почему вдруг в последние годы так много людей говорят о работе с частями (см., к примеру, Макс Родин (Deepmind), Shmit16, Дима Романов, Думик, Мацкевич и т.п.).
2️⃣ Субличности и как JTBD и каздев могут быть применены к работе с частями
3️⃣ Что такое путь «исканий» и путь «контакта» в отношении ultimate ресурсного, адаптивного, драйвового состояния
4️⃣ Почему Self/Самость таким состоянием является и как к этому состоянию приходить регулярно и консистентно
5️⃣ Возможность задать вопросы в рамках Q&A — постараемся ответить максимально полно.
Записавшимся отправим три практические медитации для доступа к Self/Самости, чтобы ощутить мощь подхода на практике.
😂 🥰 Ведем я (IFS certified коуч, ICF PCC) и Света Шедина (дипломированный психолог, специалист по коммуникациям).
Время: 19 CET / 20 MSK, вторник, 22 октября, Zoom
Записаться (! возможно нужен VPN): https://lu.ma/q09f12qq
***
На фото наша выпускница Настя Баландина поймала начало интенсива и знакомство участников с частями сразу после первой практики.
@ponchiknews × @talkauthentic
The Man Who Sold The World
Тем временем WorldCoin от Scam'a Альтмана ребренднулся в World и запилил более кошерный девайс для скана сетчатки. Его можно будет юзать как для себя, так и сканировать соседей за небольшой гешефт.
На данный момент сетчатку уже сдали более 7млн человек.
Намерения на бумаге, конечно, благие - в эпоху ии-агентов важно знать, что ты общаешься с реальным человеком, скан сетчатки которого и будет его уникальной электронной подписью. Ну и UBI каждому даром, и пусть никто не уйдет обиженным.
Однако, зная способности к переобуванию данного персонажа, а также подментованность опенаи, я бы относился к этому с опаской 😅
Подробнее
@derplearning