quantumquintum | Unsorted

Telegram-канал quantumquintum - Quantum Quintum

2386

Авторский канал Константина Кичинского про информационные технологии и науку: новости, запуски, мнения, исследования противоречия и комментарии. 😶‍🌫️ Вопросы и предложения (кроме рекламы) — @constantinkichinsky.

Subscribe to a channel

Quantum Quintum

Тут Антон рассказывает о новом отчете Microsoft по будущему работы с очевидным шлейфом ИИ.

Мне кажется, самое главное в нем даже не конкретные детали, где и в чем на сколько процентов прирастают надои. А мозговзрывательный факт, что Microsoft уже полтинник. 50 лет!

Тем не менее, фан-факты про ИИ
1. ИИ увеличивает поток документов и правок к ним
2. ИИ уменьшает поток писем и взаимодействие с почтовым клиентом
3. ИИ увеличивает эффективность встреч только, если перестраивать культуру встреч
4. ИИ (копилот) ожидаемо берет на себя существенно более сложные запросы, чем поиск
5. ИИ является очевидным бустером в работе с клиентами для начинающих, далее эффективность снижается.
6. ИИ является очевидным бустером для топ-ученых в расширении "поиска", и менее эффективен для остальных
7. ИИ повышает количество работ (и просмотров) для художников, но визуальная новизна деградирует.
8. ИИ приводит к снижению стоимости компенсации фриланса, завязанного на работу с текстом, на площадках.
9. Работающие промпты — это по-прежнему боль для обычных пользователей без базового понимания программирования и умения системно декомпозировать задачи. Но есть позитивные поджвижки на стороне динамичного и визуального UX/UI.
10. Активное использование ИИ делает людей сверхуверенными в себе. Также может приводить к эрозии когнитивных навыков. (Не то, чтобы это неисправимо, но требует усилий.)
11. Люди переносят на ИИ концепцию поиска (извлечения) информации, считая ее достоверной. Но это не так. Нужно закладывать другую концепцию. RAG, кстати, не помогает доверию, скорее наоборот.
12. Поворот в сторону сочетания ИИ-агентов и записных книг (NotebookML, Copilot Pages, etc) не случаен. Так правильно.
13. С обучением новым навыкам с помощью помогающего решать ИИ все плохо: он не помогает вырабатывать самостоятельный навык. Правильный путь — ставить ИИ в помощь и масштабирование учителя.
14. Стиль коммуникации с ИИ должен быть заточен под сценарий, аудиторию, приложение и т.п. (ака эксперт в своей области, а не всезнайка).
15. Ditto — новые аватары, замещающие вас. Не уверен, что термин приживется. Но пользователи отдают предпочтение ИИ-заместителю, копирующему оригинал, vs. другому человеку, отправленному делегатом на встречу.

Общий эффект GenAI на глобальную эффективность в текущей системе декомпозиции труда будет в районе 0.2-1.4% на горизонте до 10 лет. Это без существенного переосмысления рабочих процессов, которые в целом остаются стабильными. Но также правда, что большинство исследований отдачи от ИИ носит несистемный характер, не выдерживающий научной критики. :)

Сам отчет обязательно тоже читайте, если вы вдруг работаете в около-продуктивити домене или занимаетесь ИИ.

Читать полностью…

Quantum Quintum

Алло, алло, чат-жи-пи-ти, как дела? Короче, теперь можно позвонить ChatGPT с городского с вацапа по номеру (1-800-CHATGPT, или классически 1-800-242-8478). Ограничение - 15 минут в месяц на каждый телефонный номер.

OpenAI называет это важным первым шагом для новичков в теме ИИ, не привыкшим к промптовым веб-интерфейсам и предпочитающим классические методы коммуникации. TheVerge подозревает, что заодно OpenAI будет собирать сэмплы голоса (как это давно делал Google), но в компании это отрицают. Но даже без сбора сэмплов именно голосов, это все равно запускает массовый цикл обратной связи по качеству коммуникации голосом.

Ждем шуток про «звонок другу», «ой мне срочно надо ответить» и бабушкаGPT.

https://www.theverge.com/2024/12/18/24324376/openai-shipmas-1-800-chatgpt-whatsapp

Читать полностью…

Quantum Quintum

Так, ну матрица-то все ближе и ближе.

Тут ребятки из гугловского DeepMind показали "мировую" модель Genie 2, которая по базовому промпту для изображения генерирует "играбельный" трехмерный мир, в котором человек или агент могут перемещаться, используя стандартные команды с клавиатуры и мыши.

Графика пока страдает всеми болячками генерации изображений 2-летней давности, вопросы консистентности мира тоже требуют доработки. "Путь в тысячу ли" еще впереди, но первый шаг уже точно сделан. В целом ощущение такое, что мы на пороге появления новых типовых игровых движков.

https://deepmind.google/discover/blog/genie-2-a-large-scale-foundation-world-model/

Читать полностью…

Quantum Quintum

Искусство заголовка: "Nvidia’s new AI audio model can synthesize sounds that have never existed".

Думаешь: вау, круто! Пойду послушаю рычание селурианской пустырки с Проксима Центавры b или завывания солнечных китов в космическом эфире, или перешептывания атлантов и лемурийцев в горах Шамбалы.

Но нет...

Реальность: собачки гавкают под музыку, фабричные машины кричат в агонии, мяукающая флейта, скрипка плачет как ребенок, хор из звуков сирен.

Читать полностью…

Quantum Quintum

Свежее исследование IDC по ожидаемой отдаче от внедрения GenAI.

Обещают много денег, большие кагры, отдачу инвестиций в 3.7 раз (а у лидеров - в 10 раз!) на каждый доллар, надои выше, чем у традиционного ИИ и т.п.

Читать полностью…

Quantum Quintum

В тему, почему в ближайшие годы самые разные компании (в смысле — не только Microsoft) будут пытаться собрать данные из нетипичных источников.

Помянутая в предыдущем посте Epoch AI сделала еще анализ по доступным текстам для обучения: вывод простой — они заканчиваются.

Это не прямо вопиющая и внезапная новость. Просто контекстно попалось.

Конечно, не все так просто. Может, не всегда больше — лучше. А может где-то синтетика компенсирует. А может...

Но факт в том, что есть еще некоторое количество "заблокированных" источников, когда тексты есть в принципе, но они не доступны всем этим конторам. Сегодня самых крупных блока три:
— Корпоративные переписка, документы и др. артефакты, особенно онпрем;
— Частные переписка и офлайн-документы на конечных устройствах, в т.ч. артефакты с коротким жизненным циклом;
— Специализированные тексты в вертикалях, часто связанные к государством: диагнозы, рецензии, материалы судебных дел и пр.

Все это будут пытаться "вскрыть" прямо или косвенно.

Читать полностью…

Quantum Quintum

Как и ожидалось™️, AI-фичи редактирования становятся просто базовой функций примерно любого редактора. Вот уже и до его величества Блокнота в Windows тоже докатывается ИИ-функциональность по редактированию размера/тональности/формата. Пока через облако, но уверен, с прокачкой темы AI-чипов в железе и малых моделей, будет локальная подстраховка.

Что тут важно понимать:
1. Ладно Microsoft (не ладно, если серьезно), но в перспективе любое текстовое поле будет дорощено ИИ-фишечками. Я лично верю в квази-стандартизацию на базе браузеров и готовых компонент соответствующих операционок, когда поверх RichTextBox/textarea/input-text появится слой API для AI-манипуляций. Можно ожидать готовых библиотек от AI-вендоров, но я больше верю в протаскивание через канал браузера или ОС.

2. Хотя перспектива переноса на клиент греет душу, пока мы говорим преимущественно об облачной обработке. Это означает, что в пределе все ваши тексты, в том числе промежуточные отправляются кому-то в облако, стоит вам начать печатать. Это не то, чтобы новость, просто если раньше это было скорее исключением, когда какой-нибудь ушлый сайт мог собрать все, что вы вводите в формы, даже без отправки, то теперь это просто по умолчанию. Даже в Блокноте, который всегда был офлайновым апом.

3. Ладно отправляется, может это все ради нашего удобства. Вопрос снова в лицензиях и правах на переиспользование ваших текстов. Навряд ли вы удивитесь, если вам скажут, что ваши тексты в "бесплатных" сервисах для перевода использовались для пополнения обучающей выборки. Но если вам скажут, что все, что вы в очередном браузере введете в любое текстовое поле (м.б., кроме паролей) будет использовано для обучения аффилированного ИИ, вас это тоже обрадует? :)

Почему я уверен, что это так и будет остаточно весомой степени? Потому что это слишком лакомый кусок, чтобы его игнорировать в условиях исчерпания готовых текстов. А тут мало того, что каждый сайт (или приложение) является основанием для разметки контекста, так и еще ваше взаимодействие с текстом формирует готовый цикл обратной связи. 🍿🍿🍿

Читать полностью…

Quantum Quintum

— Входит. И выходит. Замечательно выходит.

Тут такое дело. Disney снова собрался в метаверсы, точнее AI + MR. По слухам, в компании снова собрали группу для координации усилий по "прорывным технологиям", AI и смешанной реальности, в частности. В Office of Technology Enablement будет до 100 человек.

(Для контекста напомню, что Disney сократил отдел по метаверсу полтора года назад.)

Читать полностью…

Quantum Quintum

Эрик Шмидт, — помните такого ex-руководителя Google? — теперь топит за то, чтобы американская оборонка переориентировалась с танков на дроны (не удивительно, учитывая, что он теперь основатель стартапа, производящего военные дроны).

40 лет назад (26 октября был юбилей!) вышел первый Терминатор, отсылающий нас к мрачному 2029 году с войной человечества против цивилизации машин.

Эрику тогда было 29 лет, и вот ему, как и множеству других, топящих сегодня за войну и модернизацию армии через автоматизацию, практически 70, а отсылки юности до сих пор греют душу и требуют реализации.

Ну что, дедули, осталось 5 лет. :)

Читать полностью…

Quantum Quintum

Узнал, что не все знают, что такое White Label. Вот вам иллюстрация на сырных палочках.

Это один и тот же продукт, только:

1. Унагранде. Итальяно, спунтино буоно, мауро касалли.
2. Придумано Лавкой (для фанатов Яндекса)
3. Вкусно и натурально (для фанатов Вкусвилл)

Все делают на одном заводе в Брянской области.

Ну и заодно обратите внимание на наценку за бренд.

Читать полностью…

Quantum Quintum

Моя любимая игра в стратегические тренды с Гартнером.

Никогда такого не было, и вот опять — новые стратегические технологические тренды на 2025 год.

Рецепт стратегического прогноза:
— Половину прошлых стратегий заворачиваем в газетку и выкидываем в мусорку, делая вид, что их и не было. Все равно у всех память как у золотой рыбки.
— Для второй половины делаем рефрейминг новыми терминами или перепозиционируем под новые фокусы. Потому что инновации должны быть свежими.
— На 1/5 достаем из закромов старые вечные темы с максимально общими терминами.
— На 1/5 придумываем новые комбинации слов из стратегического бинго.

Вуаля. С вас много денег.

Читать полностью…

Quantum Quintum

Старая тема по отравлению промптов скрытыми инструкциями играет новыми красками в контексте копилотов, имеющих расширенный доступ к пользовательским данным.

Arstechnica рассказывает о новой "уязвимости":
1. Злодей отправляет вам письмо, в котором так или иначе скрыта (от человеческого глаза) инструкция к внешнему копилоту, который обработает это письмо.
2. Копилот автоматически или в ответ на запрос пользователя делает суммаризацию письма. Но внезапно начинает обрабатывать вложенную инструкцию.
3. Инструкция заставляет копилот поискать нужную информацию в других письмах (данные продаж, код подтверждения и т.п.), сформировать из них ссылку со скрытым от пользователя текстом (используя Unicode Tags) и попросить пользователя нажать на эту ссылку.
4. Пользователю приходит ответ, что вот резюме и подробности по сссылке.
5. Пользователь доверяет своему копилоту и не ожидает подвоха. Кликает, данные отправляются на сервер злодея.

Ну как бы понятно, что это PoC, дырки частично уже позакрывали, но не покидает ощущение, что мы своими руками добавляем в свое окружение агента с расширенными полномочиями, который самим фактом своего присутствия в системе резко расширяет поверхность для атаки неведомым для нас образом.

Читать полностью…

Quantum Quintum

Про свежие обновления Miro (те самые, которые то ли ушли, то ли нет, то ли да) и эволюцию категории. Но не буду расплываться еще раз, какие ребята молодцы.

1. Если вы все еще делаете "доски" как наш ответ Miro, то вы упускаете главное — Miro уже давно не доски. Я условно провожу водораздел по годам ребрендинга (Realtimeboard → Miro, начало 2020х): категория "досок" разделилась на две.

— Первая, — я ее называю "Доски", — ближе к классическим школьным доскам, порисовать/обсудить в моменте, во время звонка, накидать идей/заметок и забыть. Можно по шаблону, можно из головы. Это то, что делают примерно 100% аналогов и "убийц" из России. Но на это также можно смотреть не только в логику поворота не туда, но и в повторении исторического пути с отставанием на 3-4 года от лидера рынка.

— Вторая, — я ее называю "Стены", но Miro называют просто Canvas, — ближе к офисным стенам и операционным проектным стендам, на которых собирается и обсуждается информация, которые устойчивы неделя к неделе. Здесь прорастают и архитектурные диаграммы, и канбан-доски, и работа с портфелем документов.

Наверное, возможен какой-то промежуточный путь, когда первые идут путем копирования вторых, избегая уже пройденных граблей. Но каждый раз они будут упускать из виду что-то очень важное и фундаментальное.

2. Miro начали крестовый поход на старую парадигму офисных продуктов. Это не является прямо неожиданностью, потому что все к этому шло. Хотя можно услышать, что это фигня, потому что Miro — это монопродукт, а не "экосистема приложений".

Сегодня, хоть Miro и дружит с тем же Microsoft в интеграциях с Azure, AI/Copilot и Teams, но последовательно "закрывает" все новые и новые ниши.

Уже было:
— PowerPoint не нужен, потому что фреймы — это слайды
— Visio не нужен, потому что схемы — это диаграммы. Причем с мега-фокусом на IT-архитектуры
— 1/3 Teams: Аудио-звонки и мессенджер не нужны — все внутри доски
— OneDrive и 1/3 Teams не нужны — складывайте документы в доску
— Planner не нужен — тут готовые канбан и ганты
— Stream не нужен — записывайте презы для асинхронного потребления

Новое:
— Word не нужен — пишите доки на доске
— Excel не нужен — заводите таблицы на доске
— 1/3 Teams: видео-звонки не нужны — все внутри доски
— Copilot не нужен — общайтесь с ИИ внутри доски

Да, тут можно бесконечно спорить о том, что это все недо-недо-недо. Тут нет таких фишечек, а тут таких. И вот это не умеет. Но точно также было с Google Docs десяток-полтора лет назад.

Важен вектор, в котором всю вашу "продуктивити и коллаборацию" заворачивают внутрь одно инструмента. Который и не инструмент уже, а все больше OS в браузере.

3. Отмечу, что помимо безусловных талантов в Miro, это также является следствием развития ряда энейблеров (хотя увидеть, что мир поменялся — это особый навык):
— Буст производительности фронтэнд-инфры со всеми этими WASM, WebGL, WebGPU, etc. — подкрепленные последовательным ростом производительности конечных железок. В вебаппах сегодня можно позволить себе сильно больше, чем 10 лет назад.
— Буст размеров, частоты обновления и разрешения экранов, которые означают, что можно легче относиться к информационной плотности на экране. Разреженная доска не эффективна в смысле плотности информации, но это не важно, если все видно и гладко.
— Буст онлайн-сессий и обсуждений, которым нужна поверхность, замещающая оффлайн-проектор, доски, стены, стикеры и т.п.
— Усложнение и стандартизация IT-процессов с Agile, архитектурными диаграммами и пр. + рост открытости в смысле API соответствующих внешних платформ.
— ...

4. Конечно, чтобы делать свои инновации, было важным вовремя расчищать поле от чужих инноваций и подбирать "ненужные" инновации в свою коробочку.

===
В общем, сегодня уже примерно понятно, где через год-два будет шайба. :)

Читать полностью…

Quantum Quintum

Внезапно, для всех, кто интересуется будущими ИИ-гаджетами и ассистентами очень добротное интервью с Jesse Lyu, CEO того самого Rabbit r1, который взлетел и был погромлен журналистами, но вроде как еще жив.

— Несмотря на "нападки" журналиста, в разговоре сквозит вера в свой путь. Прямо классический стартаперский дух, выпестованный прошлыми проектами. От почти плоской структуры на старте с отсутствием армии юристов и "мы слишком маленькие, чтобы с нами начал сотрудничать спотифай" до "в отличие от всяких брошек с лазерами мы выбрали менее рискованный путь и планомерное идем по нему, нет не боимся Apple и в чем-то даже опережаем".

— Продали более 100к девайсов, DAU - порядка 20к (30 на анонсе новых фич), постоянно активно порядка 5к девайсов. Не шик-блеск, но и не самая плохая конверсия для первой версии.

— Порядка 40% от стоимости устройства ($199) - это маржа, которая идет на оплату облачных ресурсов, ее должно хватить на год-полтора потребления ИИ-сервисов, дальше будут другие модели монетизации (брать подписку с пользователя вроде как не хотят). Но это работает, пока все крупные ИИ-вендора борются за рынок и готовы отгружать ресурсы стартапам задешево. Пользуйтесь моментом.

— Тема с LAM (Large Action Model) постепенно раскатывается, запустили песочницу. Напомню, что там фокус в том, что запрос-инструкция пользователя переводятся в действия над веб-приложениями (в будущем и мобилками). Фактически для пользователя поднимается виртуалка с браузером, а девайс выступает клиентом к ней (e.g., для того же стриминга со спотифая).

— Это агент, но это не массовая бот-ферма. За каждым агентом стоит конкретный юзер, для которого просто оптимизирована цепочка действий. Но рынок пока не понимает, как с такими агентами работать. 1) ни у кого нет нормальных API, 2) все захотят это как-то монетизировать. Так как API нет, то агент фактически делает клики на сайте, интерпретируя контекст. Такой RPA на нейронках. (От себя отмечу, что такие функции будут в будущем и в браузерах напрямую, вот увидите!)

— Из таких пользовательских цепочек над сервисами будет формироваться магазин автоматизаций, сценариев и т.п. Вот тут и появится дополнительная монетизация для устройств и сообщества. Нет ничего постыдного, чтобы использовать модель магазина с комиссией.

Читать полностью…

Quantum Quintum

Бо-бо-бо.
Больно Apple, больно Google.
Больше сторов, меньше денег.

===
Я думаю, вы уже прочитали в новостях, что монополия Google на магазин приложений и комиссию в 30% активно разрушается стараниями Epic и федерального судьи Джеймса Донато (США).

Среди прочего это означает, что Google, как и Apple в ближайшие годы будут ускоренно выстраивать альтернативные модели монетизации.

Чего стоит ожидать (я об этом писал два года назад):
1. Развитие 1st-party портфеля решений и комплексных подписок на контент, игры, подборки, связь и т.п. Обе компании уже в это играют, но теперь есть дополнительный повод.

2. Развитие федеративных моделей рекомендаций для рекламы и не только. Это о том, что ваш телефон на iOS/Android все лучше знает вас и выставляет API для рекламодателей. Тут есть место для экспериментов и небольшое окно для стартапов, но оно довольно быстро схлопывается из-за пересечений с GenAI-потугами.

3. (Новое) Развитие премиальных AI-фич, встраиваемых на уровне платформы и железа, но с гибридной моделью монетизации: либо дорогое железо с фичами (лицензия вендору), либо подписка на облачные вычисления, скорее комбо.

4. (Спекулятивно) Развитие темы зеленых вычислений и учета расходов на питание конечного устройства. Тут еще много работы и экспериментов предстоит, но можно предположить стремление вендоров размазать свои амбиции про zero carbon footprint по клиентской базе.

Читать полностью…

Quantum Quintum

Вышел новый альманах по ИИ от МФТИ с обзором состояния отрасли.

Смотрю на картинку с главными носителями повестки, так сказать. И не пойму, что меня в ней смущает.

Читать полностью…

Quantum Quintum

Внезапно так, Google тоже решил тряхнуть стариной и вернуться к теме XR, который то ли жив, то ли мертв, но всемогущий ИИ действует как святая вода, запуская цикл реинкарнации.

Очень похоже, что виной всему Марк-сотоварищи со своими очками и заходом на тему нативной интеграции ИИ и рост слухов о проработке аналогичного девайса в Apple. Тут важно, что постепенно дозрели сразу несколько технологий: 1) железку можно запихнуть в форм-фактор очков, 2) ИИ лучше понимает аудио-визуальный контекст и отчасти локально, 3) GenAI + GPT проложили путь к голосовым интерфейсам.

Надо еще сказать, что и Google не то, чтобы спал все это время. Большую часть "кирпичиков" мы уже видели в картах, circle to search и др. наработках для мобильного форм-фактора.

Вот тут видео-интро с видением Android XR: https://www.youtube.com/watch?v=Pn5uG1ys-pE

Вот тут лендинг для новой вариции ОС: https://www.android.com/xr/

Вот тут анонс для разработчиков: https://android-developers.googleblog.com/2024/12/introducing-android-xr-sdk-developer-preview.html

Читать полностью…

Quantum Quintum

Помните, был такой AI-гаджет AI Pin от Humane? После провала продаж ребята, похоже, решили самую малость пивотнуться и теперь предлагают свои софтверные наработки (ака CosmOS) другим создателям гаджетов и девайсов для встройки ИИ-фич, причем со ставкой на волну хайпа вокруг ИИ-агентов.

Показали демку, но это все из серии slideware, PoC, симуляции опыта и т.п. В целом, не очень понятно, почему создатели колонок, телевизоров или автомобилей сделают ставку на Humane, а не большого и надежного вендора.

Я понимаю еще, если бы они решили повторить трюк с андроидом: вот вам бесплатная открытая ось, давайте внедряйте поскорее — и будет человечеству счастье. Разве что они пытаются продаться кому-то, кто сделает ровно это. :)

Читать полностью…

Quantum Quintum

Еще отчеты — свежий репорт от Google Cloud с трендами по кибербезопасности.

Главная ось зла в глазах Гугла проходит через "Большую четверку": Россию, Китай, Иран и С.Корею.

ИИ становится все более очевидным инструментом противостояния, как со стороны ИБ, так и со стороны злоумышленников, причем снижающим входной порог.

Среднее время от обнаружения (репорт) уязвимости до ее эксплуатации снизилось с 32 до 5 дней. Ожидается, что этот темп как минимум сохранится.

Света в конце туннеля не видно.

Читать полностью…

Quantum Quintum

Ожидаемо, внедрение GenAI-тулов начинает прорастать детальной статистикой по эффективности.

Вот недавний анализ по Microsoft, Accenture и еще одной неназванной компании на примере разработчиков: 26% прирост производительности с наибольшим относительным приростом и уровнем принятия у менее прокаченных инженеров.

Что тут важно, наверное, сказать:

1. Если вам нужно обоснование на эксперименты с ИИ для разработки, то это хороший реф. Если вы сами делаете что-то вроде Github Copilot, то тоже можно ссылаться и сравнивать.

2. Хотя хочется перенести этот успешный успех и на другие области (e.g., офисные сотрудники), не все так просто. Дьявол в деталях: эффективность разработчиков в исследовании измеряется по количеству PR, коммитов и успешных сборок. Для переноса модели оценки нужны схожие условия.

3. Из данных следует, что уровень принятия выше не только у джунов, но также и у тех, кто недавно присоединился к компании (vs. ветераны труда). Это тоже понятно. Наверное, это рано или поздно станет критерием при выборе работодателя и, соответственно, аргументом в хантинге.

Читать полностью…

Quantum Quintum

Пузомерки и прочие бенчмарки всегда были хорошим стимулом прогресса. Много было и будет спекуляций на тему того, что ИИ умеет решать математические задачки и скоро будет огого! Ну ладно там школьные задачки 5-7 классов, на кону серьезные математические проблемы.

Вот ребята из Epoch AI собрали с помощью математиков свой бенчмарк FrontierMath из сотен действительно сложных задач, на которые у специалистов могут уйти дни и недели. По нему лучший результат у современных моделей - порядка 2%.

Забавно, что сам бенчмарк закрытый, чтобы избежать тюнинга под конкретные задачи. Мы ведь все прекрасно знаем, как маркетологи и пиарщики любят такие сравнения и как легко R&D команды поддаются соблазну пойти легким путем подгонки под тест.

Читать полностью…

Quantum Quintum

Дорогой, президент Трамп! Пишу тебе из деревни Беливью. Поздравляю и с нетерпением жду, как мы с тобой и твоей командой порвем США и весь мир нашими инновациями, порождая невиданные рост и возможности.

Твой бести, Сатья.


Ничего такого, просто главы ИТ-компаний кинулись поздравлять Трампа. :)

Читать полностью…

Quantum Quintum

Еще один звоночек, что копилоты/промпт-студии и ко становятся стандартным продуктивити инструментом: переупаковка привычных чат-интерфейсов в LLMкам в виде десктопных приложений с нативной интеграцией, проброской шорткатов и т.п.

— Буквально несколько недель как десктопными аппами разродилась OpenAI (про копилот от Microsoft тоже помним)
— Теперь в копилку можно положить десктопное приложение от Perplexity (под маки)
— Следом влетает Claude от Anthropic (win + mac)

Удивительное время, конечно. Лет десять-пятнадцать с офисными пакетами происходило буквально ничего (последняя серьезная революция — это когда Google протащил тему "офиса в браузере" и подвезли мобильные клиенты). А тут прямо расцвело. И зумы, и тимзы/слаки, и доски, и чаты-копилоты, и скоро агентов еще завезут.

Читать полностью…

Quantum Quintum

Ловите момент, AI-генерация кода становится мейнстримом. Сейчас в медиа и соцсетях немного пошумят, что Google уже 25% своего кода генерирует на своих Gemini. Российские СМИ обязательно напомнят, что свои модельки для кода есть и на Руси: от МТС до Сбера до Яндекса.

Но фоном проходит вторая новость, не менее важная: в Github Copilot теперь можно опираться не только на модели от OpenAI, но также и Google и Anthropic.

И это не то, чего ты ожидаешь от старого Microsoft, который все в дом и любовь в зубы с OpenAI. Но вполне укладывается в Microsoft, который follow the money.

Аналитики зовут этот тренд BYOAI. И дело в том, что крупные клиенты хотят контроля за моделями и, как минимум, возможности выбора доверенного поставщика.

У этого BYOAI есть следствие: нужно будет развязывать связку UI с AI через стандартизацию или фиксацию API на том или ином уровне. Если у вас нет API для интеграции (хотя бы внутреннего) и все на соплях, вы уже проигрываете в эту гонку.

https://arstechnica.com/ai/2024/10/github-copilot-moves-beyond-openai-models-to-support-claude-3-5-gemini/

Читать полностью…

Quantum Quintum

Продолжает потихоньку раскучиваться тема автоматизации взаимодействия с софтом, не имеющим специального API для сторонних систем.

Anthropic анонсировала инструмент "computer use", позволяющий переводить запросы пользователей в движения курсора/клавиатуры относительно интерфейса, к которому предоставлен доступ.

Под капотом анализ последовательности скриншотов с расчетом необходимых микроопераций, необходимых для совершения действия.

Почему это важно:
1. Снижение стоимости настройки автоматизации. Искусственная обвязка macro-api сервисов и приложений, не имеющих таковых официально, особенно старых программ, которые могут уже и не поддерживаться вендором. В принципе, не сильно важно, дальше поверх работают классические алгоритмы или ML-ные. Важно, что автоматизация операции обвязки экономит время разработчикам.

2. Автоматизация point&click-работы. Дальнейшая "автоматизация" однотипного труда в замороженных и чужих системах, когда переписывать внедренный софт дорого или работа ведется поверх чужой системы. Тут работают три мантры: 1) ботов в интернете будет еще больше, 2) переписывать древний софт снова не обязательно, 3) мартышкин труд автоматизируют, людей выгонят.

3. Инновация в "полуручном тестировании". Можно наконец-то начать заменять ручное тестирование на ИИ-тестирование, когда модель на вход получает фрагмент User Job и доступ к мышке и клавиатуры, и проверяется, насколько она способна выполнить задачу. Тут будет десяток другой стартапов с перехлестом ИИ-тестирования и ИИ-прогноза хитмапов. Еще одна ниша: ИИ-хелпер по интерфейсу, который показывает, как что-то сделать.

4. Еще один шаг в голосовом управлении. Возможности взаимодействия с интерфейсом голосом расширяются, масштабируясь на приложения, которые к этом, возможно и не готовы.

5. Рост скринскраппинга в том числе в злодейских целях. Фактически, развитие таких моделей сейчас означает, что не просто скрины вашего интерфейса отправляются кому-то в облако, но и что модели качественно извлекают из них полезные сведения и их классифицируют. И тут могут быть как красивые обертки вроде Windows Recall, так и злонамеренные с кражей данных.

Читать полностью…

Quantum Quintum

О, Microsoft тоже начал завозить готовых агентов, чтобы усилить вашу команду "как никогда раньше". На что тут важно обратить внимание:

1. Агенты как продолжение инвестиций в промт/бот-студии и кастомизации копилотов.
2. Готовые агенты на базе доменной экспертизы в бизнесе Dynamics 365 — это прямо шаг к автоматизации типовых линейных ролей и функций (e.g., коммуникация с подрядчиками, оценка качества обслуживания и т.п.)
3. Переход от стадии "ой, как здорово" к стадии "мы уже заработали на 9.4% больше тут, сэкономили там и т.п.", за которыми скрывается безусловный потенциал "оптимитизации" бизнесов.

Пройдет еще несколько лет, и вы не заметите, как часть ваших прошлых ролей и функциональных обязанностей была переложена на цифровые плечи цифровых гигантов, которые уже замещают ваш отдел кадров и сдают вам "сотрудников по подписке".

Пройдет еще несколько лет, и вы не заметите, как часть вашей культуры определяется внешним вендором, который "держит" 20-30-50% вашей "рабочей инфраструктуры".

Пройдет еще несколько лет, ... Ладно, не будем о грустном. :)

Читать полностью…

Quantum Quintum

Про корпоративные инновации от MIT Sloan и как их сделать возможными в 2к24:

1. Обеспечьте организационную гибкость
Заставьте цели работать. Какая гибкость, если вы пока вы пишите стратегию, рынок вокруг уже поменялся. Стратегия должна обеспечивать гибкие роадмапы и снижать влияние провалов.
Демократизируйте доступ к данным. Когда все запрятано по кубышкам, получается, что только топы имеют доступ ко всей картине и могут принимать решения. А они не могут сделать это вовремя. Нужно, чтобы данные понимала вся команда и это открывало путь взаимодействию и решению проблем.
Установите минимальные работающие политики. Высокоуровневые принципы для всей организации дают баланс между управлением ожиданиями и гибкостью. Команды должны знать, что можно, а что нельзя.
Предоставьте требуемые ресурсы. Гибкость означает возможность быстро двигаться, когда пошло. Гибкость не работает, если нужно ждать следующего бюджетного цикла. Венчурный капитал позволяет вынести финансирование инноваций в отдельное русло.

2. Разжигайте диптех венчур для долгосрочных инноваций
Не у всего есть простые (цифровые) решения. Иногда нужны более глубокие технологии, но тут нужен порох и смелость:
Коммерциализация риска. Диптех сложен, прототипы дороги, реакция рынка непредсказуема. Но если внутри нет эксперитизы, то вы и не отличите мух от котлет.
Капитальные инвестиции. Диптех дорог, чек начинается от $20m. Но можно разделять риски с другими компаниями и предпринимателями.
Протяженные временные рамки. Диптех долог, до материализации коммерческого внедрения может пройти десяток лет. Топ-лидеры компаний столько не живут. Но можно идти этапами, чтобы отслеживать прогресс.

3. Внедряйте ИИ. :)

===

Напомню три главные причины, почему корпоративные инновации не работают:
1. Наняли Chief Growth/Innovation/Wow/Meow Officer с командой, но никому другому в компании чужие инновации не нужны. Вариация: лид инноваций ушел, а клоуны остались. Вариация: запихнули инновации в подвал, на другой этаж, в другой город. Вариация: инициатива наказуема, кроме случайных успехов вопреки, за них тоже накажут, но потом.
2. Хотели инновации через год, а деньги закончились уже завтра. Вариация: посадили инновации на PnL бизнеса. Вариация: начали разговор с RoI. Вариация: посчитали, что это слишком радикально/вредно для текущего бизнеса.
3. Собрали шапито инноваторов (стартапов), чтобы украсть/купить идеи, а повторить/приземлить не смогли, потому что сами квадроберы и с лапками. Вариация: хотели срезать на углах и повторить внешние эффекты, игнорируя нижнюю часть айсберга.

Читать полностью…

Quantum Quintum

Регулярно слышу, что какая-то очередная российская компания мечтает стать русским [ответом] Microsoft (на днях было очередное интервью в Ведомостях одного из топов одного из топов). Иногда в целом по портфелю, иногда по отдельному направлению (офис, облако).

С одной стороны, обидно, что не хватает смелости на свой путь и свою систему координат.

С другой стороны, есть простой первый шаг, на который, кажется, никто из этих топов не готов. Нужно постоянно развиваться, инспектировать, что происходит в мире, и выстраивать сеть.

Тут вот The Information репортует, что Сатья Наделла имеет каждый день по две встречи с CEO клиентов и компаний в рынке и регулярный поток коммуникаций с основателями стартапов и венчурными капиталистами. Попробуйте.

Читать полностью…

Quantum Quintum

Коротко, эпичное в духе киберпанка (но осуждаю обоих, не делайте так!): китайские хакеры взломали системы Verizon и AT&T в США и несколько месяцев следили за системой прослушки, установленными в телекомах спецслужбами США.

Ты следишь за своими гражданами, не зная, что граждане другого государства следят за тобой, следящим за гражданами своего государства.

https://arstechnica.com/tech-policy/2024/10/reports-china-hacked-verizon-and-att-may-have-accessed-us-wiretap-systems/

Читать полностью…

Quantum Quintum

Помните, когда Microsoft запускала виртуального ассистента Cortana (а было и такое!), когда еще трава была зеленая, а OpenAI еще даже не родился, одна из ключевых фич этой истории была в том, что этот ассистент запоминает сведения о пользователе и может их использовать при формировании ответов и уточнении запросов.

Тогда это были простые вещи вроде адресов дома и офиса, но при этом Microsoft давала возможность посмотреть и поправить эти факты. Это было что-то вроде записной книжки секретаря.

Прошло время, история повторяется. Если вы не знали, то современные ИИ-помощники (они же копилоты и чатджипити-сотоварищи) тоже запоминают факты и предпочтения о вас. В ChatGPT на этот счет есть целая настройка, причем включенная по умолчанию.

На всякий случай, это не новость, та же OpenAI анонсировала это еще в феврале. Просто осознание этого начало докатываться до масс (e.g. popular science по ссылке).

По этому хороший повод отрефлексировать момент:
1. По мере вашей (долгосрочной) коммуникации с любым ИИ будет накапливаться информация о вас, ваших предпочтениях, фактах и т.п.
2. Это будет автоматически превращаться в системный (невидимый для вас) промпт, которым сопровождаются ваши запросы.
3. Вам будет казаться, что система все лучше и лучше вас понимает и вообще ваш лучший друг, готовый быть советчиком, подушкой, подружкой и т.п.
4. Это касается не только консьюмерских сценариев. В корпорате будет все то же самое, но к "личному" системному промпту под капотом будет пристегиваться еще и ролевой, соответствующей вашей позиции в организации.

Условно, вы спрашиваете:
— Составь пример документа с ТЗ на съемку промо-ролика нового музыкального сервиса.

А в сервис, который по-прежнему достаточно общий (!) уходит еще две обвязки:
— Про вас: пользователь предпочитает конкретные ответы с четкими деталями и подробностями, подтвержденными фактами и референсами.
— Про роль: пользователь находится на позиции старшего СММ маркетолога 3 месяца, поэтому отвечай с указанием соседних ролей, с кем нужно скоординировать решение задачи.

С этим будет расти заточенность ИИ под вас, но также вокруг вас будет формироваться пузырь, направляющий и закрепляющий ваше поведение.

Читать полностью…
Subscribe to a channel