Авторский канал про AI и технологии от Алексея Иванова @ponchiknews. Про рекламу можно спросить Женю: @RealPonchikTeam
🧀 Тем временем, бесплатные пользователи ChatGPT (GPT-4o) жалуются на бесплатный сыр: он не такой вкусный, его не так много, да и дают его не так часто.
Что можно сказать?
Давайте предположим, что беспл. доступ к GPT-4o сделали не просто так. Что может быть причиной?
1. GPT-4o стал такой дешёвый, что его можно подавать как GPT-3.5? Очевидно, что не настолько, и суровые ограничения нужны, как и для GPT-4 Turbo.
2. Беспл. тариф GPT-4o - это модель freemeum. Ее задача — закидывать пользователей в платный тариф, т.к. при даунгрейде в GPT-3.5 видна огромная разница.
3. Возможно, причина в маркетинговой стратегии OpenAI, которую приоткрыл Сэм Альтман, сказав, что хотят быть более итеративными, чем раньше (гэп между GPT-4 и GPT-4o - больше года).
Что именно это значит?
1. На беспл. тарифе НЕ будут доступны многие функции мультимодальности, в то время как их начнут выкатывать на про → будет возникать желание прикоснуться к магии из фильма Her, о которой все говорят, а $20/мес не такая большая цена для такой магии.
2. На про-версии будет расти контекстное окно (для мультимодальности это маст). Контекст в 128К токенов в GPT-4o сейчас vs. 2M токенов, которые обещает Gemini Ultra, — это по объему как USB-флешка по сравнению с целым жестким диском. Чтобы пользоваться по-настоящему важными фичами, нужен большой контекст.
3. Запуски GPT-4.5 и GPT-5 уже в пайплайне, и они будут выходить примерно как гениальные запуски Apple: вот новый крутейшией iPhone Pro Max 100500GB, а вот iPhone SE для тех кто попроще, а еще те кто попроще могут использовать старую модель. То есть, будет постоянное подталкивание людей в pro-подписку.
Как это будет работать можно почитать в этом моем посте, который объясняет феерический успех Apple через призму обращения к идее статуса и репродукции.
4. С точки зрения репутации и имиджа, Сэму очень важно было показать, что OpenAI - это именно Open. Его уже и Маск обвинял, что они должны по честноку переименоваться в Closed AI, и кто только нет. Поэтому это во многом еще такой символический жест.
Покупки компаний ИТ гигантами. Самые активные — это Google и Microsoft. Они на двоих прикупили 500+ компаний — больше, чем Apple, Meta, Amazon, Netflix и Nvidia вместе взятые
@ppprompt
Ничего особенного, просто ученые в Шеньженском университете вживили человеку чип, который может читать намерения — настолько, что способен писать сложные китайские иероглифы.
Правда, человек смотрит на те же самые иероглифы на экране (хотя можно предположить, что он мог бы их и представлять себе, но мы еще не там)
🔗 Link
@ppprompt
🎞 Что смотрите в ютубе на тему AI?
Какие разборы? Мнения? Анализ? Тесты и эксперименты?
Поделитесь в комметариях. А пока вот мой список, май 2024:
Топ-3
- Fireship">Fireship. Самый мой любимый юморной канал про AI.
- aiexplained-official">AI Explained. Топовый по качеству инсайтов.
- TwoMinutePapers">Two Minute Papers. Короткие разборы ключевых рисёчей в мире AI.
+ еще Топ-10
- DaveShap">David Shapiro. Разборы всего про AI/AGI (четвертую техническую революцию) от философа и компьютерного гика
- WesRoth">Wes Roth. Разборы различных юзкейсов AI, новых моделей и т.п.
- TinaHuang1">Tina Huang. Об индустрии gen AI, большом техе и т.п. от бывшей дата-саентистки Meta
- TheAiGrid">The AI GRID. Подробные разборы всего, что связано с AI.
- SirajRaval/videos">Siraj Raval. Эксперименты с AI, на которые приятно смотреть
- 3Blue1Brown. Визуализации ключевых концепций в AI/ML, трансформерах, LLM
- Lex Friedman Podcast AI Series
- Arxiv Insights. Разборы ключевых пейперов из Arxiv.org (там публикуются все основные работы по AI).
- Computerphile/videos">Computerphile. Качественные разборы всего, что связано с AI.
- CodeEmporium/videos">CodeEmporium. Прикольны объясняелки из мира генеративного AI, NLP, LLMs, data science, etc.
@ppprompt
Коротко о Google I/O вчерашнем:
1. Gemini AI: Обновление моделей Gemini 1.5 Pro и Flash. Pro обрабатывает большие объемы данных, быстрая модель Flash — для мелких задач.
2. Интеграция с Gmail: Gemini 1.5 Pro анализирует PDF и видео в аттачах, дает резюме и инсайты. (Ждём такое же в тг!)
3. Veo и Imagen 3: Veo — генерация видео высокой четкости, Imagen 3 — text-to-image, реалистичные изображения.
4. Аудиообзоры: Генерация аудиообсуждений на основе текстового ввода, например, озвучка плана урока.
5. AI Sandbox: Инструменты генеративного ИИ для создания музыки и звуков с нуля.
6 Проект Astra: Мультимодальный ИИ-ассистент, понимающий и взаимодействующий с миром через камеры устройств.
7. Google Photos: Интеграция Gemini с функцией "Ask Photos" для ответов на вопросы о галерее пользователя.
8. Google Lens: Поддержка видео-поиска, позволяющая задавать вопросы о записанных видео и получать ответы.
Там еще было про устройства, андроид, новые телефоны пиксель и т.п., но мне кажется это все вторично.
@ppprompt
Согласны? (автора цитаты потом напишу, чтобы не байасить вас)
Читать полностью…Хорошие новости: Claude.ai от Anthropic наконец-то доступен по всей Европе (в браузере, и в App Store).
Без VPN и плясок с бубном))
@ppprompt
Кстати, вчера OpenAI немного подколол Google: лет 6 назад компания делала на I/O демку, где продукт под кодовым названием Google Assisstant Duplex звонил в ресторан и заказывал столик на вечер. Прикладываю видео этого разговора.
Дальше демки это не пошло, гугл показал насколько их ассистент — AI-ассистент, но… как и многие демки Google последних 10 лет, эта оказалась немного преувеличением реальности, а не готовым продуктом.
Как думаете, могут Сундара Пичаи снять с поста CEO за про#@бы на ниве AI?
@ppprompt
По поводу опроса вчерашнего…
Тут вот какое дело: если честно, ВСЕ предыдущие технические революции делали людей богаче (и средний класс, и бедняков). Это доступ к еде, ресурсам, услугам и тп, повышенная продуктивность, сниженная цена. Вместо домработницы пылесос, микроволновка и стиралка. Вместо телеграмм, посылок и писем — интернет и доставка. Вместо перелётов — Zoom. И так далее.
Вряд ли техническая революция в форме AGI НЕ повторит путь всех предыдущих. Так что ставлю на опцию а) в обоих случаях.
PS: людям свойственно думать, что мир не становится богаче/лучше/безопасней, тк мы видим в новостях войны и кризисы, переживаем безработицы и рецессии и т.п. но на больших цифрах все идет в гору (см. выступления Ханса Рослинга, например).
@ppprompt
🤖✍️ Промптинг от Antropic: что, как и зачем
GPT-4o будем обсуждать подробно в ближайшие дни, как только раскатается на всех.
А пока отвечу на один из самых частых вопросов: где искать интересные подходы к промптингу?
На мой взгляд, неплохая библиотека промптов получилась у создателей Claude.ai. Взять их можно тут: https://docs.anthropic.com/en/prompt-library/library
У них же можно почитать классный туториал по промпт-инженирингу (почему-то в Экселе): https://docs.google.com/spreadsheets/d/19jzLgRruG9kjUQNKtCg1ZjdD6l6weA6qRXG5zLIAhC8/edit?usp=sharing
А еще у создателей Claude есть чудо-агрегат по созданию промптов из коротких в обстоятельные, называется Prompt Generator. Его задача - взять что-то невразумительное, вроде “сделай саммари текста” и превратить в хорошо расписанный промпт для саммарайзинга, который регулярно выдает классные результаты.
Link: https://console.anthropic.com/dashboard
@ppprompt
📅 Пометьте в календаре: уже совсем скоро (в 10am PT = 20.00 Мск) OpenAI покажет нам кое-что интересное
По слухам нас ждет новая модель (пока еще не GPT-5), вероятно с функциями голосового ассисента. Ранее Reuters писало, что OpenAI работает над конкурентом Perplexity и Alphabet и планирует анонсировать свой ИИ-поисковик, но Сэм опроверг эту информацию в посте выше.
Трансляция будет тут: https://openai.com/
Ждем?
@ppprompt
💩 AI для жизни
Читать полностью…Про AI safety: подоспел первый инструмент от государств для тестирования и оценки безопасности моделей.
В данном случае речь об AI safety institute в Великобритании.
🔗Анонс: https://x.com/soundboy/status/1788910977003504010
🔗Опенсорсная платформа: https://ukgovernmentbeis.github.io/inspect_ai/
@ppprompt
Прислали прикольный чарт, который полгода назад запостил Виталик Бутерин (co-founder, Ethereum) про то, кто что думает в ML/AI-индустрии про безопасность x таймлайн по AGI.
Сильно аутдейтед, конеш, интересно посмотреть кто и где на этом чарте оказался бы весной этого года.
Source: https://x.com/vitalikbuterin/status/1729251822391447904
Кажись ИИ-модели выходят на новый уровень)
World AI Creator Awards (WAICA) в сотрудничестве с платформой Fanvue проведет первый в мире конкурс красоты для ИИ-моделей под названием «Miss AI».
За 1ое место обещают приз в размере $5000 + продвижение на платформе Fanvue и PR-поддержку на сумму $8000.
*Fanvue - онлайн платформа для контент-мейкеров с упором на ИИ
Оценивать будут внешность участниц, их соц сети (в том числе кол-во подписчиков), а также навыки использования ИИ-инструметов и промпты авторов.
Чтобы принять участие нужно быть старше 18 лет и успеть подать заявку до 10 мая.
@ppprompt
+ к предыдущему, прислали читатели
Читать полностью…Apple показала новые фичи, которые добавят в iOS 18, среди них:
— функция Eye Tracking, которая позволит управлять iPad и iPhone глазами (разработана специально для пользователей с ограничениями в возможностях / accessibility)
— Vehicle Motion Cues: помогает уменьшить эффект укачивания пассажиров в транспорте (черные точки повторяют движения транспорта и меньше укачивает)
— Music Haptics: новый способ прослушивания музыки на iPhone для глухих или слабослышащих пользователей (Taptic Engine в iPhone воспроизводит касания, текстуры и вибрацию под звук музыки)
Больше функций и подробностей тут: https://www.apple.com/newsroom/2024/05/apple-announces-new-accessibility-features-including-eye-tracking/
@ppprompt
Ничего особенного, просто американские спецназовцы в очередной фазе тестирования робособак, вооружённых винтовками.
Link: https://www.ghostrobotics.io/
UPD: Link2: тут тесты робособак с рокет-лончером: https://www.twz.com/marines-test-fire-robot-dog-armed-with-rocket-launcher
@ppprompt
Илья Суцкевер уходит из OpenAI
Вместе с ним компанию покидает Ян Лейке, который вместе с Суцкевером руководил командой Superalignment. Новым Chief Scientist назначен Якуб Пахоцки.
@ppprompt
Переключился в лучшем поисковике Perplexity (версия Pro) на GPT Omni вместо Claude Opus. Как же все бомбически летает, конечно…
@ppprompt
Veo — новая модель генерации видео от Google
Может создавать видео с разрешением до 1080p и продолжительностью до 60 секунд. Подразумевается как конкурент Sora, но на первый взгляд кажется, что не дотягивает.
А вам как?
Примеры генераций тут
@ppprompt
#Объясняем: Mixture of Models (MoM): когда сразу 3-5 LLM участвуют в генерации ответа
Ютюбер Крис (канал All About AI) объясняет, в чём преимущество метода промптинга Mixture of Models (MoM) и показывает три варианта его реализации.
Если коротко: сперва 2-3 модели попроще создают “контекст” для оригинального промпта, а затем отправляют контекст+промпт в более сеьёзную LLM (GPT или Claude).
Зачем? Согласно отчетам, получается более крутой ответ.
Пробовали MoM подход?
@ppprompt
Сегодня вечером Google I/O, ежегодная конференция гугла, где ожидается много анонсов про AI. Проблема только в том, что в отличие от OpenAI Developer Day и Apple WWDC, Google I/O особо никто не ждет.
Вчера аккурат перед презентацией GPT-4o Гугл выложил вот этот ролик в твиттере — по сути, мультимодальная Gemini app для андроида, которая делает примерно все то же, что GPT-4o.
Сегодня в комментариях все пишут, что latency в секунду уже кажется невыносимой.
Должно быть, Гуглу оч сложно уже больше года быть в позиции догоняющего. И вот опять.
А вам как такая демка?
@ppprompt
Не знаю, заметили ли вы из демо-роликов сегодня, но GPT-4o уже и заигрывает как Скарлетт Йоханссон из Her Спайка Джонза. (А парень из OAI идеально играет роль антагониста-задротика)
Читать полностью…Про GPT-4o
- GPT-4o может как принимать, так и генерировать комбинации из текста, аудио, изображений, позволяя значительно более естественное взаимодействие между человеком и компьютером.
- Ответ на аудио вопросы занимает от 232 мс и в среднем 320 мс, что сопоставимо со средней скоростью человеческого ответа в разговоре.
- GPT-4o демонстрирует значительные улучшения в работе с текстами на неанглийских языках.
- Использование GPT-4o на 50% дешевле при вызове API, делая его более доступным и эффективным решением.
- GPT-4o значительно превосходит предыдущие модели в понимании визуальных и аудио данных.
@ppprompt
📚🧠 5 must-read книжек про AI
Несмотря на то, что все быстро меняется в области AI, есть ряд популярных (НЕ технических) книг, которые я бы назвал важными/рекомендуемыми к прочтению. Они помогают понять тему AI/AGI в широком смысле, чтобы врубаться в эти системы, а не просто следить за новшествами как потребитель сервисов и моделей.
Мой топ-5 книг и моя оценка к каждой:
1. Life 3.0 by Max Tegmark – 9/10
Профессор физики из MIT Макс Тегмарк обсуждает, как ИИ повлияет на рабочие места, преступность, войны, правосудие, общество и наше ощущение человечности. Он рассматривает будущее жизни на Земле и за ее пределами.
2. Superintelligence by Nick Bostrom – 7/10
Оксфордский профессор философии Ник Бостром — один из самых ярких людей, рассуждающих о морально-этических и футуристических вариантах развития AGI. Его классическая книга исследует потенциальное будущее ИИ и экзистенциальные риски, связанные с развитием сверхразума (так он называет продвинутый AGI).
3. Gödel, Escher, Bach: An Eternal Golden Braid, by Douglas Hofstadter – 9/10
Увлекательный экскурс в теорию систем, рекурсии, самореференцию, парадоксы, неполноту и неочевидные иерархии. По Хофштадтеру, понимание этих принципов дает ключ к тому, чтобы понять, как работает природа сознания. Хотя книга не про ИИ, ключевые её концепции помогают понять разумность как таковую.
4. AI Superpowers: China, Silicon Valley, and the New World Order by Kai-Fu Lee – 8/10
Исследование и прогнозы о том, как две супердержавы – США и Китай –продолжат сражаться в области AI: в рисёче, внедрении, автоматизации, робототехнике, этических ограничениях, общественном договоре.
5. The Alignment Problem by Brian Christian – 8/10
Исследование того, как люди пытаются донастраивать черный ящик AI с помощью согласования (alignment) – вознаграждая или порицая за те или иные ответы и действия. Проблема гораздо нетривиальнее, чем думается – из-за сложности того, что люди сами хотят и какие предубеждения имеют, а также из-за непростого устройства самих gen AI моделей.
@ppprompt
Тем временем, не забываем про главный юзкейс ChatGPT и прочих LLM ↓
Читать полностью…OpenAI – это новый Apple. По крайней мере, по важности их публичных выступлений, и вот почему
Год назад CEO OpenAI Сэм Альтман предсказал, что компания-юникорн с одним сотрудником уже была основана. Причина — безудержный прогресс в области AI.
Отчетливо вижу, что 2024-й не опроверг, а скорее подтвердил этот прогноз по ритму, важности и эффекту изменений на то, как люди работают и над чем.
В понедельник 13 мая у OpenAI будет очередное важное кейноут-выступление. Предыдущее было аккурат перед драмой с отставкой Альтмана, тогда анонсировали GPT Store (первый стор с агентами, если не считать CharacterAI), Enterprise-версию, расширенное окно контекста.
По моим ожиданиям, Сэм и ко проанонсируют:
1/ Релиз модели GPT-4.5 turbo (пока не 5), но что-то достаточно сильно отличающееся от GPT-4 turbo по качеству) с окном контекста не меньше 500K токенов
2/ Условия коммерческой работы с разработчиками агентов (GPTшек) — без них GPT Store очевидно буксует.
3/ Демо ощутимых эффектов партнерства с медиа вроде Le Monde и Prisa
4/ Роадмэп к GPT-5, который я ожидаю к концу года (после выборов в США)
5/ Заверения + демонстрация активной работы над безопасностью, этикой и прочими такими штуками, без которых AI глобально может наделать дел (и этого многие очень боятся).
Я не думаю, что будет релизнута в общий доступ Sora и точно не будет релизнут GPT 5 (о последнем Альтман сам говорит у себя). Поисковик, признает CEO, тоже пока не делают — полагаю, по соглашению с Microsoft/Bing. Ну ничего, есть же офигенный Perplexity Pro, продолжаю его использовать как дефолтный.
***
Когда-то мир с интересом ожидал очередного выступления лидеров Apple, которые рассказывали, что там сейчас the next big thing в технологиях. Сейчас, на мой взгляд, Apple стала компанией, которая делает чуть более мощные и более тонкие версии своих предыдущих моделей. Ее место занял OpenAI - дерзкий, прорывной, прогрессивный коллектив, который действительбно меняет мир.
@ppprompt
Пообещавшие память еще в феврале, OpenAIщики только сейчас начали раскатывать функцию памяти в ChatGPT.
Вам уже подвезли?
PS: Если хочется общения с чистого листа, без учета прошлого контекста, нужно будет использовать “временные чаты”.
🔗 https://help.openai.com/en/articles/8590148-memory-faq
🐶 Саммари, которые вставляет читать (промпт)
Вы знали, что самый распространенный юзкейс для применения LLM в мире — это делать саммари длинных текстов и видосов? Полтора года с появляения ChatGPT, год с запуска GPT-4, а все так же самая популярная функция — это “сократи мне тут плз”. Эх…
Сегодня хочу поделиться промптом, который я итеративно сделал своим дефолтом для сокращений текстов, особенно транскриптов звонков. Написан он по-английски, но ответ будет на том же языке, на котором “приложенный” к нему текст.1. Act as a professional summarizer and assistant with Strategist (Self-Actualizing) and Alchemist (Construct-Aware) Action Logics according to Ego Development Theory.
2. Context: I will provide you with the Conversation Text.
3. Your task:
A. Summarize key points of the Conversation Text into 10 bullet points.
B. Add up to 3 key action items.
C. Add all references as a separate list
D. Add 2-3 metaphors or analogies to aid memorization of key themes and ideas of this conversation.
4. Format: Write your answer in the language most commonly used in the Conversation Text. Start your message by mentioning the title of the summary. If available, add names of participants and date & time. Write in plain text.
5. Tone of Voice: Be empathetic, concise, intelligent, driven, and wise. Think step by step.
6. Constraints: Make sure you follow 80/20 rule: provide 80% of essential value using 20% or less volume of text.
Этот пример, в основном, для транскриптов звонков, но его же с небольшими изменениями использую для любых текстов.
Вам такое актуально? Если да, полайкайте пост, чтобы я понял общую реакцию. И если окажется достаточно интереса, сделаю полноценную GPTшку на базе этого и еще пары сокращательных запросов.
#️⃣ #prompt #llm #claude #gpt
@ppprompt