На своей конференции Build Microsoft много интересного объявил, их новые планшеты Surface впечатляют уже не хуже эппловых. Но самый изящный — особенно учитывая, что конфа все-таки для разработчиков, а не широкой публики — ход состоял в том, чтобы вывести на сцену Сэма Альтмана, который потизерит ChatGPT-5, подчеркнет нерушимую дружбу и связь OpenAI и Microsoft и сообщит, что ChatGPT-4o уже доступен в облаке Azure. Кажется, в облачной гонке с Гуглом Microsoft очередной раз сделал красивый и мощный рывок. Результаты увидим через квартал-другой на квартальных отчетах.
https://mashable.com/article/microsoft-build-2024-gpt-4o-openai-azure-ai-studio
Сама заметка примерно ни о чем, но в ней есть любопытная деталь, которую я не отследил по другим источникам. Миша Прахин (aka imperator) — человек значимый для российской ИТ-индустрии и вполне заметный на глобальном масштабе. Окончил МИФИ, поработал в Microsoft, потом пришел после смерти Илюши Сегаловича в Яндекс на роль СТО и серьезно на этом посту потрудился. Потом вернулся в Microsoft и там плотно работал в Bing, был главой Bing Search — в том числе во время стараний интегрировать туда ИИ и надежд подвинуть Google.
Но после прихода Мустафы Сулеймана на должность CEO of AI, Миша свой пост потерял. Теперь же он выступает в роли одного из новых эдвайзеров Perplexity AI — а этот стартап последовательно обещает дать нам новый поиск, основанный на ИИ и таки потеснить Google.
Очень интересно будет последить за новыми шагами Perplexity AI. С одной стороны, мало кто в мире обладает таким разносторонним и масштабным опытом в области поиска и машинного обучения в нем. С другой стороны, Perplexity AI сейчас не в лучшей форме, а жизнь и процессы в стартапе немного не те, что в больших корпорациях:)
https://analyticsindiamag.com/bad-times-for-perplexity-ai-begins/
Разговоры об автономных агентах как светлом будущем приложений на основе больших языковых моделей добрались уже до вполне массовой деловой прессы: The Economist занимается и ликбезом, и стимуляцией интереса бизнеса. Причем разговор сразу ведут не просто про таких агентов — а про их ансамбли.
В терминологии Intel — это третья стадия развития применений LLM; мы пока на первой.
Интересно наблюдать за всякими побочными волнами, которые расходятся от двух недавних презентаций. И Гугл, конечно, порождает больше волн, поскольку он куда в большей степени интегрирован в жизнь людей своими продуктами, и каждое его телодвижение влияет на миллионы, а то и сотни миллионов пользователей.
Первыми, как нынче принято, всполошились и без того нервные издатели традиционной прессы.
“This will be catastrophic to our traffic, as marketed by Google to further satisfy user queries, leaving even less incentive to click through so that we can monetize our content,” - без обиняков замечает представитель News/Media Alliance.
Эта зацикленность на цеховых интересах, а не интересах людей, немножко достает — а заодно показывает, что с прессой не так, и почему ее проблемы лишь усугубляются со временем.
https://edition.cnn.com/2024/05/15/media/google-gemini-ai-search-news-outlet-impact/
В тему восприятия ИИ, которая была так важна на недавней презентации OpenAI. Важны интонации голоса ИИ-собеседника, важна его мгновенная реакция на слова человека — но OpenAI демонстрировала нам бесплотный голос из смартфона.
Ребята из компании Synthesia, которая идентифицирует себя как AI video engine, показали очень интересный ролик: они пересняли один из тех роликов, которые демонстрировались на презентации: там мы не видели экран смартфон, с которым разговаривал человек — а теперь нам показали этот экран с синтезированной девушкой, которая произносит реплики GPT-4o с отличной артикуляцией, живой мимикой и вообще совершенно по-человечески.
Интересно, что для меня уже немного утомивший ролик сразу стал смотреться иначе. И, похоже, будущее во многих местах будет именно таким 🙂 Взгляните, познавательно.
О, вот еще про «зловещую долину» :)) Китайцы из Unitree Robotics явно готовы побороться с Boston Dynamics за лидерство в якобы “пугающих” роликах про человекоподобных роботов. Впрочем, у них и человекоподобность своеобразна: тамошние инженеры решили, что общую конструкцию человеческого тела имеет смысл взять за основу — но избавить от ограничений нашей анатомии. Нет технических запретов для суставов крутиться хоть на 360 градусов и складываться под любыми углами.
Итог получается любопытным: стоит посмотреть видео целиком, а не тот фрагмент что в пост поместился. Нечеловеческие движения человекоподобного тела местами завораживают, но совсем не пугают.
Смотреть тем более интересно, что это не демонстрационный образец — эти роботы G1 в текущем году поступят в продажу по цене примерно $16 000 — очень дешево и доступно по современным меркам.
NASA хочет запустить левитирующие беспилотные поезда на Луне. Они смогут перевозить до 100 тонн грузов ежедневно. Такие поезда могут появиться уже в 2030 году, когда на Луне будет работать база NASA.
https://nypost.com/2024/05/10/lifestyle/nasa-plans-high-tech-railway-system-on-the-moon/
Очень мне интересно, как поведет себя Apple: потихоньку разрастается шумиха вокруг их рекламного ролика по поводу нового на днях анонсированного iPad. Ролик вполне стандартный, в нем использована довольно лобовая метафора: мощный пресс сжимает кучу всяких инструментов художников, музыкантов и прочих креаторов — и в итоге получается тоненький айпад.
Но некоторый слой нынешних креаторов сильно на взводе по поводу ИИ: если читать все подряд апокалипсические статьи, немудрено впасть в тревогу. И, понятно, они в этом ролике увидели исключительно угрозу себе и ополчились на Apple: «мы же и есть ваши основные пользователи, зачем нас мочить?»
Но мы видим лишь медиашум, а в Apple несколько больше приборов, демонстрирующих поведение пользователей — потому и интересно, что они решат: не всегда надо всем шумливым уступать.
(ролик минутный, его можно прямо в статье по ссылке посмотреть)
https://www.musicradar.com/news/apple-ad-hugh-grant
Почти с момента появления ChatGPT в публикациях стали высказываться мнения, что новый сервис угрожает поиску — и, в первую очередь, очевидно, Гуглу. Майкрософт даже делал ставку на повышение конкурентоспособности Bing благодаря языковым моделям.
Не сложилось.
Но вот снова волна стартапов и сопутствующих публикаций: Perplexity как новая угроза Гуглу. В заметке приведен разумный анализ интервью Аравинда Сриниваса, сооснователя Perplexity. Он опирается на добрую старую “Дилемму инноватора”, чтобы объяснить, как и почему его стартап сможет свергнуть Google и перехватить его могучую бизнес-модель.
The argument is seductive. But it is off the mark.
Почему — полезно целиком прочитать и интервью, и заметку. И потом самому подумать.
А пока читал, не мог отделаться от воспоминаний про яндексовый Нейро, где как раз возможности LLM встраиваются в пайплайн обработки нечеткого вопроса и поддержания дальнейшего диалога: сильно улучшая пользовательский опыт по целому классу поисковых запросов, исключая возможности галлюцинаций и ничуть не покушаясь на поисковую бизнес-модель:)
Но стартапам неймется, вот и OpenAI рвется на ту же сцену. И это прекрасно: в техногигантов полезно тыкать палочкой, чтоб не дремали:)
🤖😶 Каким люди видят идеальное лицо робота? Несколько лет назад учёные из Вашингтонского университета подробно исследовали этот вопрос. Пересказываем основные выводы.
Подписывайтесь 👉 @techno_yandex
SpaceX изначально относились к промышленному дизайну всех своих продуктов очень серьезно. С точки зрения эстетики лаконичности при сохранении функциональности у них учиться можно, будь то их ракеты, капсулы, терминалы Skylink или скафандры. Вот очередной -- не просто дизайн, а рабочий скафандр, в котором скоро состоится первый выход коммерческого туриста в открытый космос. Хотя он напоминает те скафандры, которыми пользуются на борту миссий Dragon, начинка и функционал сильно отличаются. Тут и дополнительные защиты, и своя информационная система с шлемом в роли дисплея, и большая подвижность. Кроме того, скафандр должен наглядно продемонстрировать инклюзивность космического масштаба, a future in which all kinds of body types can live and work beyond Earth — дизайн и конструкция обеспечивают очень широкий диапазон персональной подгонки снаряжения. В рамках Polaris Program уже в этом году должна состояться первая коммерческая прогулка в открытом космосе — с трансляцией происходящего на Землю с помощью спутников Starlink.
И еще одна модная и мощная технология использовалась при создании скафандра: Polaris Dawn astronauts will also sport 3D-printed polycarbonate helmets
https://www.popsci.com/science/spacex-eva-suits/
Wired: у Китая есть свой план по созданию интерфейса мозг-компьютер
Недавние инициативы Илона Маска по созданию нейрокомпьютерного интерфейса наделали шуму в прессе. Еще бы, в случае успеха миллионы людей с ограниченными возможностями получат шанс на новое качество жизни. Однако не только в США идут подобные разработки. Китай стремительно нагоняет американцев в этой перспективной области технического прогресса.
«В Китае предпринимаются огромные усилия по использованию методов машинного обучения для улучшения анализа сигналов мозга, говорится в отчете CSET».
https://theidealist.ru/braincpu/
#Wired #технологии #мозг #Китай
Пишущие про ИИ эксперты и журналисты — взрослые люди; поэтому, по заветам Маленького Принца, они все время щеголяют большими цифрами — постоянно нарастающие миллиарды параметров кочуют из статьи в статью, словно только в них и суть. Параметры, впрочем, — штука эфемерная:)
А тут журналисты задались задачей отследить другие большие и растущие цифры, причем вполне материальные. Речь о видеокартах: во времена начала ИИ-бума полтора года назад казалось, что десятки тысяч карточек — уже какой-то невообразимо мощный кластер. Но в дело пошли десятки миллиардов долларов, и теперь запрещенная Мета говорит и примерно миллионе карт у себя, 720 000 карт использовались для обучения SORA в OpenAI (а цели на близкое будущее — довести число карт до 10 млн), Microsoft собирается использовать 1,8 млн карт к концу текущего года.
Учитывая цены на видеокарты, получаем, что все эти достижения и планы обходятся в большие десятки миллиардов долларов каждой из компаний. Но это их не останавливает: ставки еще выше:)
https://analyticsindiamag.com/meta-spends-30-billion-on-a-million-nvidia-gpus-to-train-its-ai-models/
Прикольная и несколько непривычная коллаборация: Cisco + Bang & Olufsen: а всё из-за того, что гибридный режим работы в разных своих ипостасях остается массовым (и, похоже, таким и останется). А это, среди прочего, означает два интересных требования к железу:
1 если устройство активно используется для рабочих задач, в частности, требующих конфиденциальности и защиты от потенциальных атак, оно должно быть контролируемым со стороны ИТ-служб и службы безопасности.
2 Если устройство вперемешку используется для личных и корпоративных целей, оно должно удовлетворять тем требованиям к качеству, которые пользователь предъявляет к личным гаджетам.
И наушники (или вкладыши) — яркий пример такого устройства: не очень-то удобно менять их в течение дня только потому, что настал перерыв в рабочих созвонах и хочется под чашку кофе послушать расслабляющую музыку в надлежащем качестве.
Если смотреть на проблему под таким углом, смысл коллаборации проясняется:) Интересно, получится ли задать тренд на новый тип привычных устройств, одинаково приемлемых для безопасников и меломанов (не только акустических) :))
https://www.forbes.com/sites/marksparrow/2024/05/02/cisco-partners-with-bang--olufsen-to-market-true-wireless-earbuds/
Вот и еще один источник профессионально размеченных и высококачественных фотографий обещает стать легально чистым для обучения графических моделей.
Когда-то много лет назад, когда EyeEm был еще гордостью и надеждой европейской стартап-сцены (а не банкротом, которому недавно пришлось продаться испанцам FreePik;)) мне довелось с ними пообщаться. У них изначально внутри был план поживиться на тогда модной БигДате. То, что подавалось пользователям как сообщество фотографов со взаимными оценками, подробным тегированием и социальными механиками, с точки зрения бизнеса было созданием огромной профессионально размеченной базы фотографий. Но тогда модель не сошлась, это и привело к банкротству в итоге.
А сейчас вполне может статься, что 160 млн легальных и размеченных картинок очень даже востребованный актив:) Благо правильное пользовательское соглашение там было изначально.
Самим фотографам, конечно, может быть несколько обидно.
https://techcrunch.com/2024/04/26/photo-sharing-community-eyeem-will-license-users-photos-to-train-ai-if-they-dont-delete-them/
Беспилотные автомобили Baidu проехали 100 миллионов километров. Роботакси компании, которые развозят пассажиров в десяти городах, в том числе в Пекине, совершили 6 миллионов поездок. За всё время, как утверждают в Baidu, не было ни одной серьезной аварии.
Ранее о статистике поездок отчиталась Waymo. По данным компании, её роботакси совершают 50 000 поездок в неделю.
Сейчас очень любят рассуждать насчет лопат в эпоху золотой лихорадки — и почему в итоге выиграют Nvidia, строители больших датацентров, далее по списку дорогого железа.
И это не просто слова; это десятки миллиардов реальных дополнительных капитальных затрат.
Но есть другие исторические аналогии кроме лопат, про них тоже полезно помнить.
Как вкладывались на заре железных дорог в строительство плотна, которое быстро оказалось непригодным для резко потяжелевших поездов и локомотивов и потребовало полной замены. Как на заре интернета телекомы уложили только в Штатах сотни миллионов км кабелей — якобы с заделом на будущее (в котором пришли оптика и беспроводная связь)…
All the signs are that big tech has succumbed to irrational exuberance.
Будущее устроено не так очевидно, как некоторым (даже инвесторам) кажется:)
Другое дело, что не пользователи в итоге будут страдать:) Переизбыток инфраструктуры и отсутствие возврата инвестиций дорого обходится тем, кто вложился без оглядки. А пользователи в итоге оказываются на выгодной распродаже:))
А ещё любопытно замечание Сергея Брина: в своем интервью он напомнил, что десять лет назад были представлены очки Google Glass, но устройство так и не обрело массовой популярности, а поборники privacy активно его загнобили.
Во многом проблема сводилась к отсутствию killer app, которое могло бы в актуальных сценариях сделать именно очки незаменимыми. А теперь Project Astra (ИИ ассистенты с мультимодальным входом) может претендовать на роль того приложения. Говоря об идеальном совпадении — но задержавшемся на десятилетие — Брин заметил "It's funny, because it's like the perfect hardware,It's like the killer app now, 10 years later"
https://www.businessinsider.com/sergey-brin-google-glass-ai-killer-app-comments-project-astra-2024-5
CNBC: Подразделение роботакси китайской Baidu может стать прибыльным по итогам 2025
– Подразделение Apollo Go может получить прибыль за 2025
– Baidu является одним из крупнейших игроков на этом рынке
– Пекин разрешил взимать плату за роботакси три года назад
– Ездить без водителя компании разрешили прошлой осенью
– Apollo Go совершила примерно 839 тыс. поездок за Q4 2023
– Около 45% из этих поездок были полностью беспилотными
– Baidu также смогла экономить на автомобилях для сервиса
– Роботакси 6-го поколения стоит вдвое дешевле ($28,2 тыс.)
– В этом году Baidu развернет 1 тыс. таких роботакси в Ухане
– Apollo Go может стать безубыточной уже в Q4 2024
@ftsec
Прошедшие встык друг за другом презентации OpenAI и Google породили волну комментариев. Соблюду приличия и присоединюсь;) Спасибо «Собаке», что с утра прислали вопросы, и теперь я могу просто ссылочку дать. Коротко: я совсем не разочарован в Гугле; у них задачка посложнее, чем у OpenAI: они продуктовая компания, а продукты для миллиардов людей невозможно быстро перестраивать. Подробнее внутри материала «Собаки», там и обзор нормальный для пропустивших;)
https://m.sobaka.ru/lifestyle/technology/182214
Два замечания к вчерашнему анонсу OpenAI, представившим свою очередную модель GPT-4o[mni] Про фичи и новации уже настолько все отписались, что читатели этого канала наверняка и без меня в курсе.
Мне же интересно два момента:
1. Сэм Альтман у себя в блоге написал, что компания все больше осознает, что делает не продукты, а технологическую платформу для других: Our initial conception when we started OpenAI was that we’d create AI and use it to create all sorts of benefits for the world. Instead, it now looks like we’ll create AI and then other people will use it to create all sorts of amazing things that we all benefit from.
довольно важный пойнт, а то все ждут почему-то от OpenAI тяжелых продуктов: то поиск, то браузер, то еще что-то подобное.
2. Очень заметно, что в OpenAI не сильно боятся “зловещей долины” — если вообще верят в ее существование. А ведь этим эффектом так любят пугать доморощенные “эксперты” :)
Ответ на мой вчерашний вопрос пришел очень быстро: Apple устами своего вице-президента по маркетингу оперативно извинился и признал, что действительно облажался: “Our goal is to always celebrate the myriad of ways users express themselves and bring their ideas to life through iPad. We missed the mark with this video, and we’re sorry.”
Теперь интересно, где они лажанулись на стадии подготовки и выпуска — но это мы, увы, не узнаем.
https://www.theverge.com/2024/5/9/24153113/apple-ipad-ad-crushing-apology
По интернету гуляет коротенький ролик с китайской фабрики роботов, очередной раз нервирующий технофобов. В ролике нет деталей или ссылки на производителя, но журналисты Newatlas докопались до источника: речь о производстве китайской компании ExRobots, которая давно поставляет свои изделия и на выставки, и в разные сервисные компании. В статье есть и более подробный ролик (снятый аж два года назад!) про EX Future Science and Technology Museum, созданный этой компанией. Название ролика Visiting China's 'Westworld' in reality явно намекает, что в этой компании принципиально не боятся эффектов «зловещей долины» и последовательно добиваются максимальной натуралистичности в своих человекоподобных созданиях. И, видимо, такое решение вполне оправдывается спросом.
Очень бы хотелось в деталях их современные образцы поизучать, за два-то нынешних года прогресс должен быть по-настоящему впечатляющий:)
https://newatlas.com/robotics/chinese-humanoid-robots-realistic/
Я что-то сегодня и так разошелся, но неприлично не написать, что состоялась видеопрезентация новинок Apple, но которой — в полном соответствии с утечками — рассказали про новые айпады и аксессуары к ним. Новый iPad Pro получил и новейший процессор М4; значит, на нем пойдут “ИИ-жадные” приложения и, надеюсь, новые игры.
Поскольку айпады с 2022 года не обновляли, можно будет пощупать прогресс в области планшетостроения, тем более, что обновили и Pencil, и клавиатуру.
Любителям базовых цифр:
Built on a new second-gen 3nm process, Apple's M4 chip features four performance and six efficiency cores along with a 10-core GPU. In terms of general performance, Apple claims the M4's CPU is 50 percent faster compared to M2 with a GPU that's four times more powerful.
https://www.engadget.com/apple-ipad-event-2024-live-updates-as-apple-unveils-the-new-ipad-pro-100037991.html
Как и ожидалось, этот год радует сообщениями (подкрепленными видео) о достижениях самообучающихся роботов. Конечно, на слуху и массово в прессе и блогах Optimus от Теслы: ореол бренда работает. Ну и не может не радовать, что кто-то наконец научился складывать маечки, так что однажды я смогу перестать этим заниматься (лично меня бесит это занятие).
И, что опять же ожидаемо, китайский соперник тоже маечку успешно складывает, а потом еще и разглаживает:) И если сравнить оба видео, то, честно говоря, китаец впечатляет больше. Скорость движений, ловкость, точность Astribot's S1 выглядят человекообразнее. Хотя внизу у него колесики вместо ног — интересное решение, но уже не совсем гуманоидное:)
Но продолжаем следить: почти каждую неделю можно любоваться, как приближается будущее в образе тех самых роботов, которых рисовали фантасты:)
Netflix собираются в Roblox
(Кроме того, что потихоньку пилят свою игровую плафторму)
В этом тизере показали сразу два мира: One Piece и Stranger Things.
Вполне логичный шаг, учитывая непрерывный рост аудитории (и ее количество и ее возраст).
Кстати, Stranger Things вообще на протяжении многих лет регулярно экспериментируют с иммерсивными форматами, – в их промо-кампаниях всегда были одни из самых запоминающихся Lens-фильтров в снепчате и WebAR-экспириенсы. Ну и VR.
Интересно, хотя и печально, наблюдать за изменением риторики, описывающей то, что раньше называлось фрагментацией интернета и технологического мира вообще. Теперь с точки зрения журнала The Economist, вопрос кто контролирует технологии, стал “ethno-civilisational question”, ни больше, ни меньше. Там же приводится оценка цены нарушения торговли высокими технологиями по мнению МВФ: 1.2% of global gdp each year—about $1trn.
И не то, чтоб авторы выражали сожаление: время глобальной кооперации сменилось временем глобальной борьбы за лидерство, и участники за ценой не постоят.
Разборки вокруг ТикТока — это лишь разминка.
The next stage of the tech wars will play out in two major arenas. One is chipmaking, which creates the world’s information-processing infrastructure, including the one that trains and runs artificially intelligent software. The other is green technology, as its components may become the backbone of the entire global economy.
И позиция США формулируется без излишних дипломатических обтекаемостей: Any degree of Chinese control over the production of chips is intolerable to America.
Тут уже не до разговоров о пользе конкуренции; здравствуй, неприятный новый мир.
https://www.economist.com/international/2024/04/25/the-tech-wars-are-about-to-enter-a-fiery-new-phase
В околотехнологическом интернете последнее время все больше слухов о том, какие ИИ-фичи Apple объявит на WWDC летом. Самый свежий — что к внедрению ИИ в IOS 18 привлекают OpenAI; интенсифицировались переговоры между компаниями.
Впрочем, если пока идут переговоры, трудно себе представить, что к лету что-то уже срастется. С другой стороны, все указывает, что начинается интересная гонка между Apple и Google с его Андроидом; и наконец-то очередные версии мобильных ОС будут не только интерфейсные и косметические улучшизмы содержать.
https://readwrite.com/rumors-swirl-that-apple-plan-to-use-chatgpt-to-power-ai-features-in-ios-18/
А вот на эту тему хочется больше технических подробностей, но все статьи, которые пока удается найти, лишь повторяют общие слова: китайцы утверждают, что разработали двигатель для подводной лодки на основе оптоволоконного лазера мощностью 2МВт, который способен создавать тягу до 70 кН. Дальше идут всякие слова про управляемую детонацию, которые не очень просветляют: конечно, создать лазером плазму в воде можно, и такой локальный нагрев породит детонационную волну, но вот как обеспечить при этом тягу в конкретном направлении — бьются уже много лет. Если китайским ученым и инженерам удалось найти решение, гонка подводных вооружений уйдет на новый очень интересный виток
https://hackaday.com/2024/04/24/chinese-subs-may-be-propelled-silently-by-lasers/