Иногда говорят, что роботы и технологии в последнюю очередь доберутся до занятий, где телесность критична: например, никакая железяка не сможет заменить чуткие руки белкового массажиста.
Некоторые стартапы с таким мнением не согласны, и намерены свою правоту доказать экспериментальным путем. поэтому интересно прочитать подробный отчет дамы, посетивший сеанс массажа в исполнении "AI massage robot" от Aescape.
Тестировщица пришла в восторг и заявила, что к белковым массажистам не вернется. Конечно, это не означает, что все с ней согласятся, но показывает, что и в телесно ориентированных профессиях у людей уже появляются конкуренты.
https://mashable.com/article/aescape-ai-robot-massage
Я даже вернулся с прогулки в отпуске, чтоб посмотреть третий тестовый запуск Starship.
Во-первых, это просто красиво, и впечатляет живая картинка и с корабля, и с бустера. На сей раз они чистенько разделились, но торможение бустера пошло совсем не по плану. Было прикольно наблюдать, как показатель высоты бустера устремился к нулю, хотя скорость не падала ниже 1000 км/сек. Жаль, момент встречи бустера с океаном на такой скорости некому было запечатлеть со стороны; это должно было выглядеть интересно.
Впрочем, и сам Старшип не то чтоб штатно сошел с орбиты. Однако живые картинки плазмы вокруг корабля на входе в плотные слои атмосферы — удивительное зрелище.
Осталось дождаться официального разбора полетов, но в любом случае по сравнению со вторым тестом прогресс впечатляющий. Будем ждать следующего запуска.
https://www.youtube.com/watch?v=EfnkZFtHPmM
А Midjourney выкатил очень важную с практической точки зрения фичу: Character Reference. она позволяет от картинки к картинке сохранять одного и того же узнаваемого персонажа, при том помещая его в разные ситуации — собственно, пример на картинке прямо здесь в посте. Как минимум для жанра иллюстрирования худлита фишка необходимая. Да и не только, легко придумать и другие клевые сценарии.
Вот так стараешься не часто писать про ИИ, потому что и так все технологические новости им забиты, но классные новинки с такой скоростью появляются, что удержаться не получается.
https://petapixel.com/2024/03/12/you-can-now-recreate-the-same-character-across-different-ai-images-on-midjourney/
Теме «GPT для бизнеса: где нужно, а где опасно» в разных видах ежедневно посвящены несколько англоязычных статей в той ленте, которой я пользуюсь. Тем не менее, ссылки на такие материалы я тут почти не даю: во-первых, написаны они чаще всего какими-то смутными консультантами или вообще блогерами, во-вторых, реалии российские, как обычно, обладают своей спецификой, и транслировать сюда советы с других рынков некорректно (см. замечания Хуанга про суверенный ИИ, на которые недавно ссылался).
Поэтому с большим удовольствием сегодня сошлюсь на колонку Лёши Долотова в Форбсе; Лёша в Яндексе давно работает (много лет — как блестящий аналитик, а ныне — как крутой продакт как раз GPT-решений для бизнеса).
Там много внятного и практически полезного, вот для примера не заумное, а вполне инструментальное для менеджера объяснение возможностей текущих текстовых моделей:
Простейшая языковая модель умеет примерно то же, что обычный человек с бумагой и ручкой. Это довольно эрудированный человек, отлично знающий русский и английский языки, возможно, прогуливавший математику в школе, но дайте ему немного времени, он научится. Если такой персонаж может сносно решить ту задачу, которую вы для него задумали, то, скорее всего, и языковая модель сможет это сделать.
Короче: тем, кто читает меня в России очень полезная статья:)
https://www.forbes.ru/mneniya/507501-sloznosti-integracii-cto-pomozet-uskorit-gpt-transformaciu-biznesa/
Успокоительная часть рассказов про возможности современных генеративных моделей часто содержит тезисы о том, что модель — просто инструмент, творить поэтому не может по определению. Но все не так просто (как обычно в жизни и бывает).
Исследователи из университета Арканзаса попробовали сравнить с человеческими способности GPT-4 к дивергентному мышлению, которое часто считают основой креативности. Ответ получили ожидаемый (для тех, кто активно и умело с этими моделями работает):
the multimodal language model created by OpenAI was found to provide more ‘original and elaborate answers than the human participants.’
Но и этот ответ не должен вызывать испуга и воспринимать его надо в контексте. Во-первых, креативность не сводится к дивергентному мышлению, она шире и сложнее. Во-вторых, “AI, unlike humans, does not have agency, and is dependent on the assistance of a human user. Therefore, the creative potential of AI is in a constant state of stagnation unless promoted.”
Вся эта история просто еще раз показывает: на сложные вопросы обычно правильных простых ответов не бывает, а творчество — штука слишком сложная, чтоб самоуверенно заявлять на него свои права.
https://readwrite.com/now-ai-is-outperforming-humans-when-it-comes-to-creativity/
А вот эта технология, если будет реализована и доведена до уровня официального одобрения медицинскими регуляторами, может в итоге повлиять на нашу жизнь похлеще ИИ: уж больно много в нашей жизни, традициях, культуре, эмоциях и законах завязано на рождение детей (да и на процесс, который биологически к этому приводит, — секс).
Никакое искусственное оплодотворение принципиально ситуацию не меняло: все равно требовался донорский материал от двух родителей: яйцеклетка от женщины, сперма от мужчины. Теперь представьте исчезновение нужды в традиционном донорском материале, благо появится возможность получить сперматозоиды и яйцеклетки из стволовых клеток, в свою очередь получаемых из клеток кожи.
Там начинается удивительное: возможность стать родителем лет в 90, например, даже если ты ничего не замораживал, а тебе прямо сейчас приспичило. Кстати о заморозке — сейчас в мире немало людей в криокапсулах, и никто не знает, удастся ли когда-то их оживить как полноценный организм, сохранивший жизненные функции. Но вот шансы оживить отдельные клетки и получить стволовые — вполне реалистичны. А еще сперматозоиды можно получить не только из клеток кожи мужчины, но и из клеток кожи женщины.
To take this idea further, what if we made both eggs and sperm from the same person and used them to make embryos? Your ‘unibaby’ wouldn’t be a clone, but closer to you than your siblings.
Если все это хотя бы частично удастся реализовать, текущие разговоры на тему этических проблем ИИ покажутся детскими спорами :)) В прошлом году были проведены эксперименты на мышах, которые доказали, что метод работает, так что это не совсем досужие выдумки:)
https://www.sciencefocus.com/the-human-body/babies-without-sex
И еще о полезном и интересном чтиве. На русский язык перевели отличную книгу с обманчиво узкоспециальным названием «Мозг игрока». Впрочем, если задуматься, геймификация, явная и неявная, нынче вездесуща и популярна, и понимание того, как работают (или не работают) механизмы нашего мозга в «игровых» сценариях оказывается весьма универсальным знанием. Меня, как давнего большого поклонника Канемана, книга Селии Ходент особо порадовала: богатство наших когнитивных искажений отлично дополняется разнообразием ограничений нашей памяти, внимания, мотиваций — и не только.
Поэтому очередная колонка в Форбсе — про эту книгу.
https://www.forbes.ru/tekhnologii/507170-igry-razuma-o-cem-rasskazyvaet-ese-odna-poleznaa-kniga-pro-rabotu-nasego-mozga
Нет, я не буду писать про то, как Маcк подал в суд на OpenAI и персонально Сэма Альтмана за то, что компания обещала развивать ИИ на благо человечества, а в итоге развивает его на благо Майкрософта (и до кучи требует признать, что GPT-4 — это уже AGI). Прикольно, но уже отписались буквально все.
А вот про то, как Alibaba нежно потроллила OpenAI, что-то пишут мало, а оно изящно.
Сотрудники Institute for Intelligent Computing опубликовали работу, показывающую, как с помощью их технологии по статической картинке и аудиофайлу с голосом можно сгенерить очень реалистичное видео исполнения этой песни или с зачитыванием текста.
На видеопримере японка из сгенерированного SORA ролика очень артикулированно и с естественной мимикой произносит текст голосом Миры Мурати из OpenAI.
Вот исходная статья (видео для поста взято как раз из нее)
https://humanaigc.github.io/emote-portrait-alive/
А вот заметка про нее
https://mashable.com/article/alibaba-emo-ai-facial-animation
Видео в этой статье реально впечатляет: мы много уже видели роликов про человекоподобных роботов, довольно уверенно манипулирующих разными предметами, но на них на всех эти роботы кажутся то ли слегка заторможенными, то ли с похмелья. Здесь не так: скорость и плавность движений соответствуют ловкости нормального человека.
Ответов про программную сторону дела компания Sanctuary AI пока не дала, а вот на аппаратной стороне ответ немного неожиданный по нынешним стандартам: они отказались от электроприводов и перешли на гидравлику, хоть это и сложнее. Разработчики уверены, что it's the only technology that gives us a combination of three factors that are very important: obviously precision, but there's also speed and strength.
Интересно, получит ли этот подход развитие в нашем электрифицированном мире :)
https://newatlas.com/robotics/sanctuary-phoenix-autonomous-speed-hands/
Добрый вечер, увидел ваш пост про самокат, российская компания DPLabs сделала подобный почти два года назад (до 100км за 6.5 секунд), стоимость сравнима. Вот видео ссылки: https://www.youtube.com/watch?v=tkxg7iSXFWk, https://www.youtube.com/watch?v=yWnOgk9buCU, https://www.youtube.com/watch?v=an_ihTdAjHA
Читать полностью…Почти всё можно довести если не до абсурда, то как минимум до опасной черты ;))
Можно, оказывается, купить электросамокат с впечатляющей ценой $10 000, способный разгоняться больше чем до сотни км/час. Выглядит несколько устрашающе, хотя знаю людей, которые способны возбудиться.
Становится понятней, почему все-таки нужны регуляторы: при всей любви к гаджетам, оказаться рядом с этой штукой на трассе мне было бы не очень комфортно:)
https://youtu.be/5PydA6BjaEQ?si=f-aHF2SCKkX--jpf
(для предпочитающих читать восторги и характеристики в текстовом виде, а не слушать их в ролике — вот статья https://cleantechnica.com/2024/02/25/can-an-electric-scooter-be-too-fast-this-one-might-be/ )
Кстати, в интервью из предыдущего поста есть один интересный абзац, который рано или поздно возбудит алармистов.
Хуанг говорит про перспективы развития игровой индустрии и отмечает, что ИИ ее сильно изменит с помощью ACE, our Avatar Cloud Engine.
Комбинация легких моделей, дистиллированных из больших, с аватарами, чьи движения генерятся ИИ, позволит создавать в игре персонажей, которые embody the history, the context of the stories, and practically be able to interact with us. They will have vision, they’ll be able to see each other, they’ll be able to see us, and they’ll be able to interact with us.
Логично было бы, чтобы самосознание и прочие личностные характеристики первыми обрели эти виртуальные личности, а не обложенные со всех сторон подушками политкорректности и нейтральности ассистенты и агенты из классических приложений:))
(Картинка, чтоб не повторяться, показывает офис Nvidia, а не её главу)
О, сторонники тотальной электрификации добрались до энергоемких промпредприятий, где все еще сжигают углеводородное топливо, чтобы что-нибудь нагреть.
Электромобили уже не очень новинка, хотя и не сказать, чтобы процесс полной электрификации транспорта шел совсем гладко. Он, тем не менее, точно идёт.
А вот электрофабрика — слово, пока непривычное уху, и некоторые крупные компании хотят возглавить новое движение и сделать эту концепцию массовой. Например, консорциум химических компаний во главе с BASF собирается разработать электропечи, которые обеспечат нужную температуру в реакторах, где пока для нагрева используется сжигание газа.
Понятно, что в современной жизни многие правительства готовы в любую электрификацию/декарбонизацию вкладывать большие деньги. Так что скоро мы должны увидеть массу стартапов вокруг электрификации энергоемких производств, там куш побольше, чем с элетромобилями, а на электромобилях стартапы хорошо поживились.
https://www.economist.com/briefing/2024/02/15/first-electric-cars-next-electric-factories
По собственному опыту знаю, что Роблокс — не просто игровая платформа, и не только для детишек: это платформа коммуникационная (во времена ковида это было доказано экспериментально). В России, кроме всего прочего, это платформа еще и растущая, поэтому про нее почитать просветительский текст от эксперта очень полезно людям из разных коммуникационных областей — от HR до маркетинга и образования. А в экспертности автора я много раз убеждался лично, Ярик не случайно у меня и в подкасте был когда-то, мы не только по публикациям знакомы:)
https://vc.ru/marketing/1041868-roblox-dlya-brendov
На заре раскрутки термина “метавселенная” много было ссылок на Мэтью Болла: он неплохо пытался хоть как-то формализовать суть этого слова и основные параметры, которыми должно обладать нечто, претендующее так называться.
Сейчас он опубликовал эссе, которое полезно почитать ради исторического обзора модных нынче терминов (например, напоминалки, что не Apple придумал Spatial computing, а еще в начале 90-х, во времена до веба, этот термин был запущен в коммерческий оборот (а потом успешно забыт)).
Интересно следить, как менялись значения многих модных слов со временем, а люди, которых зачем-то пытались назначить провидцами, честно писали, что они были заняты making shit up, а не футурологией. (Это выражение - цитата из Нила Стивенсона по поводу его предвидений в Snow Crash.) Собственно, рассказанная в подробностях долгая история цифровых технологий через жизнь слов и концепций интересней ожидаемого от Болла вывода, что мы таки будем однажды жить в метавселенной:) Ради этой истории, а не финала, очень рекомендую эссе к прочтению.
Современное автомобильное производство кажется примером глубокой автоматизации и роботизации: все мы видели футуристичные картинки роботизированных сборочных линий. На самом же деле людей на автозаводах пока еще довольно много, а подчас и не хватает.
Но современная робототехника с ее успехами в области человекоподобных роботов эту проблему готова решить.
Мерседес-Бенц на своих заводах начинает использовать гуманоидных роботов Apollo производства Apptronik.
Mercedes plans to use robotics and Apollo for automating some low skill, physically challenging, manual labor—a model use case which we'll see other organizations replicate
https://www.pcmag.com/news/mercedes-hires-humanoid-robots-work-at-its-factories
🔥Разрешение получено: Starship полетит сегодня!
https://naked-science.ru/community/938299
Стартап Cognition, у которого в инвесторах Founders Fund и ИТ-крупняк, в свежем посте у себя в блоге заявил, по сути, что copilot — это, конечно, хорошо, но мало. Meet Devin, the world’s first fully autonomous AI software engineer.
Важнейшей особенностью разработчики считают возможность Девина учиться новому практически в человеческом режиме: After reading a blog post, Devin runs ControlNet on Modal to produce images with concealed messages for Sara, — то есть Девин овладел новой, ранее ему неизвестной, технологией и сумел ее правильно применить.
Хочется дождаться теперь отчета о работе всерьез гибридной команды, где совмнестно работают Девины и люди. Ну, и когда очередной стартап доберется до создания тимлидов.
https://www.cognition-labs.com/blog
Недавно рекомендовал здесь книгу “Мозг игрока”, утверждая, что рассмотренные там особенности работы нашего мозга крайне актуальны не только для геймдизайнеров. Вот грустный пример такой актуальности.
Медицинская аппаратура в больницах издает различные предупреждающие звуки. За смену медицинский персонал может слышать до 1000 звуковых сигналов. Однако исследования показывают, что, например, в реанимации лишь 15% сигналов клинически оправданы. В итоге у персонала наступает утомление и потеря чувствительности к этим сигналам; результат - больше сотни смертей в год из-за неверной реакции на тревожный сигнал. Дополнительную сложность для персонала вносит то, что в целях стандартизации тембр и другие характеристики сигналов от разной аппаратуры разных производителей звучат одинаково или похоже.
Все это — печальное следствие неучета разработчиками оборудования и стандартов особенностей и ограничений человеческого внимания. Многолетние исследования показали, что тщательный выбор характера звуков резко снижает когнитивную нагрузку и уменьшает усталость от их постоянного присутствия. Обогащение тембра, использование звуков наподобие ксилофона воспринималось испытуемыми намного лучше традиционных пищащих сигналов.
“These investigations revealed musical timbres can substantially reduce perceived annoyance without harming alarm learnability – offering a helpful step to improving alarm design while avoiding existing issues of excessive alarm sounds among medical devices”
Казалось бы, уж в этой многомиллиардной, жизненно важной индустрии должны проводить профессиональные UX-тесты, в том числе, акустические. Внимание дежурного врача или медсестры — слишком важная, жизненно важная штука.
Но нет :((
https://newatlas.com/health-wellbeing/musical-hospital-alarms-less-annoying/
Ох как в Apple поменяли свой публичный словарик:) Осенью прошлого года, когда анонсировали макбуки с новым чипом М3, вообще AI не упоминалось, только ML. Но потом сам Тим Кук начал произносить запретные слова — и понеслась.
Сегодняшний пресс релиз про новые MacBook Air все на том же М3 уже содержит целый раздел со скромным названием World’s Best Consumer Laptop for AI.
В нем я насчитал семь упоминаний AI в двух коротеньких абзацах.
И в общем, фиг бы с ним, но маркетологи любых технологических компаний за такими вещами следят и понимают: раз уж Apple сдался и начал ИИкать с такой интенсивностью, значит совсем уже без этого нельзя, ни пользователи, ни инвесторы не поймут-с.
Так что много мемов на эту тему превратятся в повседневную реальность, увы.
https://www.apple.com/newsroom/2024/03/apple-unveils-the-new-13-and-15-inch-macbook-air-with-the-powerful-m3-chip/
На неделе в Барселоне завершилось «крупнейшее мировое шоу» в области всякой мобильной техники и электроники, MWC. Не писал ничего про него, потому что все обзоры были несколько унылы. Видимо, все пребывают в непонятках, как оно с ИИ повернется: говорят, что будет революция и в области девайсов, но никто пока не знает, как именно она будет выглядеть.
Но вот, для приличия, краткая сводка в отличном канале;) /channel/techno_yandex/2344
Ну, а в качестве чтения на выходных могу порекомендовать эссе из The New Yorker. Предупреждаю, что оценят его сильно не все из моих читателей, для получения удовольствия надо знать, кто такие Станислав Лем и Филип К. Дик, а опыт общения с аудиториями помоложе показывает, что имена эти нынче мало кому известны.
Зато знающие оценят параллели между Электрибальдом Трулля и современными LLM:)
И грустную иронию истории, в которой Дик отрицал само существование Лема, считая, что это просто коллектив анонимных авторов, работающих по заказу коммунистической партии и писал доносы в ФБР — в то время как Лем считал его единственным достойным из американских фантастов.
А еще автор напоминает про четвертую главу “Суммы технологий”, где описан “усилитель интеллекта” как самообучающийся черный ящик:
“Ни он, этот усилитель, ни его конструктор
- никто вообще - совершенно не будет знать, как усилитель это делает, зато мы получим то единственное, чего добиваемся: нужные результаты.”
Надо заметить, Лема это не пугало:))
https://www.newyorker.com/science/elements/thinking-about-ai-with-stanislaw-lem
Словно подустав от гонки в областях текстов и картинок (в том числе, движущихся), техногиганты решили побаловать новинками из области генерации музыки. Ведь если текст, речь и иллюстрации уже можно легко нагенерить, то для пущего счастья инфлюенсеров и подкастеров неплохо бы еще иметь и музыкальное сопровождение, за которое не надо платить всяким белковым авторам и исполнителям.
И вот тут практически синхронно выступают с новостями Adobe и Google. Первые сообщают о Project Music GenAI Control — скромно описывая его способности: these new tools … aren’t just about generating audio—they’re taking it to the level of Photoshop by giving creatives the same kind of deep control.
Ну, а гугловый MusicFX DJ является развитием запущенного в прошлом году MusicFX и делает ровно то, что и положено диджею: позволяет микшировать сгенеренные ИИ треки. As you type in multiple prompts, MusicFX DJ will layer them together in a single composition, syncing each track like a DJ.
Пока лидеры ИИ-гонки активно разгребают скандалы и тушат пиарные пожары (недавний шедевральный способ от Google внести diversity во всё, включая историю, вызвал редкого масштаба резонанс), Apple традиционно немногословен, но совсем уж молчать на тему ИИ не может себе позволить даже он.
И поэтому Тим Кук начал произносить типично обтекаемые, но нетипично многообещающие слова типа
“the company will break new ground" в области генеративного ИИ в 2024 и даже "We believe it will unlock transformative opportunities for our users"
Остается надеяться, что WWDC, которая традиционна случатся в июне, внесет ясность. Хоть какую-то:)
https://www.macrumors.com/2024/02/28/tim-cook-apple-generative-ai-break-new-ground/
Вот и второй споткнулся. Подряд, причем: за несколько недель до этой посадки японский модуль кувыркнулся на Луне. И тоже сохранил работоспособность.
Но если всерьез, то изложенная в статье хронология событий, последовавших за отказом лазерного высотомера на посадочном модуле Odysseus от компании Intuitive Machines куда круче любых находок сценаристов, пишущих космические сериалы — очень рекомендую почитать подробности.
Жизнь богаче высокооплачиваемых фантазий. А сценаристов в частности и поэтому не жаль на ИИ побыстрей заменить :)
https://www.nytimes.com/2024/02/23/science/moon-lander-intuitive-nasa.html
Я здесь, и не только здесь, много раз грустил про нарастающую фрагментацию интернета, но избегал слов про суверенность: многих концепция суверенных государственных интернетов откровенно раздражает, чтоб не сказать бесит.
И вот Дженсен Хуанг, глава Nvidia, уверенно заговорил про суверенный ИИ. Для него, кстати, это не геополитическая теория, а бизнес-план компании, у которой квартальный оборот превышает 22 млрд долларов. И он имеет в виду не Россию, сюда ему карточки всё равно поставлять нельзя. Зато он уверенно говорит про практически весь мир, ибо countries are protecting the data of their users and companies are protecting data of employees through “sovereign AI,” where the large-language models are contained within the borders of the country or the company for safety purposes. Almost every country will do this.
А значит, каждой стране и каждой крупной компании понадобятся свои датацентры: they’re going to build the infrastructure. Of course, the infrastructure is hardware. But they don’t want to export their data using AI.
Это интересный поворот темы: появление ИИ и активизация его использования будет способствовать мощной фрагментации и моделей и датасетов; остальной интернет автоматически подтянется.
Непрошеный совет на длинные выходные:
В среду на Apple TV+ выложили три первые эпизода сериала Constellation (“Созвездие”). Такое впечатление, что Apple целенаправленно стремится среди стриминговых сервисов занять лидирующую позицию в области фантастики — и у них уже были неслабые заявки. Вот — очередная. Я сегодня не очень выспался, потому что все три смотрел, и теперь буду какое-то время дожидаться новые каждую среду:)) (в сезоне обещают 8 серий)
Отдельно доставляет микс МКС, Байконура и Звёздного городка с европейскими и штатовскими локациями:)
Рецензии, конечно, разные — от хвалебных до практически разгромных, вот примеры:
the show achieves a seamless blend of hard science fiction, action-based thrills, and psychological horror.
С другой стороны сокрушаются,
how little Constellation accomplishes in eight episodes, and how frustrating it can be to watch.
Лучше судить самим
А это просто красиво:)
Как робособачки работают в полиции или со спасателями, мы много раз видели, но вот им нашлось место и на самой сложной и большой экспериментальной установке, созданной земной наукой. Именно в силу сложности и громадности, на установках в CERN есть такие закоулки, куда никакой традиционный робот на колесиках не проберется, да и человеку с его ловкостью непросто (а подчас опасно: радиационный контроль в потенциально опасных зонах лучше вести без риска самому попасть под облучение).
И вот на супертехнологичной научной установке, где и так хватает разных сервисных роботов, появилась и робособачка, очень органично смотрится в этом окружении.
Технологический мир (и финансисты) ожидает чего-то феноменального от скорого очередного отчета Nvidia (для многих производимые ими GPU представляются единственной возможной аппаратной платформой для вычислений, используемых в ИИ-продуктах). Но вот, не успели еще все переварить достаточно сенсационные запуск Sora, как стали множиться сообщения о компании Groq (не путать с масковским ИИ, который оканчивается на k).
Эта компания не новичок в области создания специфического железа, но сейчас они заявили о резком ускорении ответа LLM, если для инференса использовать не привычные GPU, а их собственные LPU, Language Processing Units.
Два интересных момента:
1. Кажется, еще один шажок к тому, чтобы ИИ смог хорошо и быстро работать на обычных пользовательских устройствах
2. Эра ИИ порождает интереснейшие стартапы, бросающие вызов гигантам, не только в области софта:)
https://www.tomsguide.com/ai/forget-chatgpt-groq-is-the-new-ai-model-to-beat-with-blistering-computation-speed
(А вот сайт самой компании, там интересно! — https://wow.groq.com/why-groq/ )