То, что картинку папы в пуховике столь многие приняли за реальную фотку, понятно, хоть и немного удивляет, что среди этих принявших оказались те, кто заявляет, будто за версту чует генеративные картинки и никогда не поддастся обману. Интересней, на мой вкус, другой факт: этот успешно завирусивший фейк создал не дизайнер или опытный цифровой художник, а 31-летний строитель из Чикаго. У него смогли взять интервью — как раз оно по ссылке, и парень просо прикалывался.
“I’m trying to figure out ways to make something funny because that’s what I usually try to do. I try to do funny stuff or trippy art — psychedelic stuff. It just dawned on me: I should do the Pope. Then it was just coming like water: ‘The Pope in Balenciaga puffy coat, Moncler, walking the streets of Rome, Paris,’ stuff like that.”
И вот это говорит про демократизацию инструментов куда больше серьезных статей:)
https://www.buzzfeednews.com/article/chrisstokelwalker/pope-puffy-jacket-ai-midjourney-image-creator-interview
Сейчас такой поток стартапов, паразитирующих на интересе к ИИ, что мониторить кучу ежедневных анонсов не очень реально и не очень интересно. Но оказалось, что при таком подходе один очень важный и вполне интересный анонс я пропустил. Еще неделю назад Кай-Фу Ли, тот самый автор бестселлера «Сверхдержавы искусственного интеллекта» и по совместительству глава немалого инвестфонда, объявил о запуске новой компании с говорящим названием Project AI 2.0
Новость интересна потому, что с опытом и видением в области ИИ у этого человека все в полном порядке. С репутацией, позволяющей привлечь таланты, деньги и ресурсы — тоже.
Сайт Проекта так себе переведен на английский, но одна картинка достаточно понятна, чтобы представить, что понимается под версией 2.0 — как раз ее и использовал в этом посте. Так что последить за развитием этой компанании будет вполне интересно :)
https://pandaily.com/sinovation-ventures-chairman-kai-fu-lee-starts-new-ai-company/
Немножко надоело читать чужие тексты про то, что с ChatGPT и подобными ему продуктами делают студенты и как к ним (и продуктам, и студентам) относятся вузовские преподаватели.
Но — спасибо ИТМО! — можно собрать вместе и тех, и других и вместе поговорить, как вуз живет во времена ChatGPT и что во всем этом хорошего. Меня позвали помодерачить этот разговор, спасибо огромное; будет, надеюсь, интересно, а кому-то даже и полезно.
Заодно так мы начнем готовиться к традиционному осеннему YAC/e, проникаясь настроениями и приглядывая интересных спикеров:))
Присоединяйтесь во вторник 28 марта к трансляции, начало в 15-00, митап продлится часа полтора.
Лонгрид на выходные — подробное расследование журналистов Reuters на тему еще одного аспекта, не очень известного широкой публике, технологической войны Китая и США. Про санкции для технологических компаний типа Huawei, про старания запретить в Штатах TikTok, про запреты на поставку в Китай оборудования для производства микропроцессоров пишут много.
Но есть еще один инфраструктурный компонент глобального интернета — подводные оптоволоконный кабели, обеспечивающие связность сети. В этой индустрии несколько лет назад возникла и набрала вес китайская компания HMN Technologies Co Ltd. Три года назад она практически вышла победителем в борьбе за контракт на прокладку и обслуживание новой магистрали SeaMeWe-6 из Юго-восточной Азии в Западную Европу.
Но тут вмешались Штаты:) Как разными способами, пугая всех угрозой глобального шпионажа со стороны Китая, контракт в итоге передали американской компании — сюжет, достойный крутой экранизации. Но пока такой фильм не снят, читайте статью:)
https://www.reuters.com/investigates/special-report/us-china-tech-cables/
Я сюда только что перепостил свой же текст в этом канале пятилетней давности не случайно и не по ошибке.
Происходящее сейчас с продуктами OpenAI — прекраснейшая иллюстрация того, насколько актуальны и работоспособны идеи, изложенные в книге «Машина, платформа, толпа». Очень быстрая, почти мгновенная с точки зрения бизнеса, платформизация ChatGPT, целиком основанного на машинном обучении, — это просто модельный бизнес-кейс для будущих книг:)) Респект авторам книги!
Умеют некоторые в хлесткие заголовки и новые термины: “заря пост-поискового интернета” 🙂 Звучит красиво, но, с другой стороны, мы просто зря учились много лет разговаривать с поисковиками на жаргоне ключевых слов, а бинговский ИИ позволяет вернуться на десятилетия назад, когда в справочной ты задавал вопросы обычным разговорным языком. Оказалось, вернуться к этой древней практике приятно даже родившимся во времена развитого интернета:)
Читать полностью…Тут на неделе выступил главный производитель лопат в текущей золотой лихорадке Дженсен Хуанг, Nvidia CEO.
Он не только похвалился, что лично доставлял компоненты для того суперкомпьютера, на котором нынче учатся продукты OpenAI, но и отметил, что в его планы входит не только БигТех сделать полностью зависимым от своей продукции, но и любую индустрию, ибо машинное обучение нынче везде.
Вот кто б в начале века сказал, что в области процессоров производитель периферии может покуситься ключевую роль производителя центральных процессоров:)) Эпитет несколько потускнел.
…Тридцать лет мужик на посту начальника компании, которую сам же и основал. И явно не собирается никуда уходить, да и с чего бы при таких успехах. Кстати об обязательности ротации кадров, обновлении руководства и т.д. 🙂
So, I think for as long as I believe I can do that, I don’t know exactly for how long that’s gonna be, but 3 to 4 decades I’d say. Another 4 decades I’d be robotic and maybe another 3 to 4 decades after that. Hopefully, I get to enjoy this for a very long time.
Есть ощущение, что он не совсем шутит:))
Что Acer решил выпустить нечто AI-powered, не очень удивительно; AI — это нынче такой продающий префикс; грех сильной компьютерной фирме не воспользоваться. А вот что это нечто окажется электровелосипедом, меня несколько удивило.
Байк, кстати, выглядит достаточно красиво и неожиданно, в меру набит датчиками, процессорами и софтом, но обошелся без дисплея — вместо него есть док для смартфона, на котором все и будет отображаться. Чисто транспортные параметры тоже ничего для города (а это явно городская модель): 110 км пробега на одной зарядке, макс скорость 25 км/ч, батарея съемная и заряжается сутки.
Единственно, название модели произносить вслух в русскоязычной среде надо с осторожностью: ebii
https://www.cyclingweekly.com/products/computer-company-acer-is-making-an-ai-powered-bike-and-its-got-some-wild-features
Мультимодальность в каждый дом! Microsoft продолжает держать темп: вот только что они начали раскатывать в Bing и Edge возможность прямо в рамках чата генерить картинки с помощью DALL-E. Для тех, до кого не докатился обновленный чат, есть отдельный адрес https://www.bing.com/create где можно погенерить графику просто по запросу (пример результата -- на картинке в этом посте; prompt: geek girl amazed by Image Creator capabilities). Не до всех стран докатилось, может пригодиться VPN:)
Читать полностью…ModelScope Text-2-Video: Китайский опенсоурс разродился открытой моделькой для генерации видео по тексту
Это первая диффузионная text2video модель с открытым кодом и опуьликованными весами (1.7 млрд параметров).
Отдельный респект идет Шаттерстоку, данные с которого по всей видимотси использовались для тренировки модели 😂.
Чтобы запустить локально потребуется 16 GB RAM и 16 GB VRAM: инструкция. Пока генерит видео только 256x256.
Ну что, давайте побыстрее заполним интернет проклятыми видео!
Demo
Model weights
@ai_newz
Прекрасная статья, на которую Ваня Ямщиков ссылался, когда мы в воскресенье писали подкаст. Теперь, когда слова “большая языковая модель” уже почти все выучили, пришло время учить термины “мультимодальность” и “эмерджентность”:)
Про мультимодальность у меня уже было тут несколько постов, а вот эмерджентность, свойство сложных систем демонстрировать поведение и способности, которые ни отдельным элементам, ни малым их наборам не даны, нам еще подкинет сюрпризов.
“Despite trying to expect surprises, I’m surprised at the things these models can do” — замечает по этому поводу один из исследователей.
Если говорить совсем просто, то у больших моделей начинают проявляться свойства, которые никому никогда не приходило в голову связывать с анализом текстов, и потому от них правильно ожидать прорывов, которые отнюдь не планировались их создателями.
Оно пока выглядит как курьез, но в действительности любопытный эксперимент. В прошлом августе гонконгская игровая компания назначила директором своего отделения алгоритм, на всякий случай с именем: Тэнг Ю.
В задачи ИИ-директора входило: изучение верхнеуровневой аналитики и принятие решений на ее основе, анализ рисков, поддержание эффективной рабочей среды для кожаных мешков.
Явным плюсом руководителя нового типа являлись отсутствие зарплаты, бонусов, золотых парашютов и т.д.
Если судить по курсу акций компании в сравнении с индексом гонконгской биржи, руководитель справился: за полгода акции вели себя постоянно лучше индекса.
Без деталей, конечно, этот кейс анализировать сложно и восхищаться рано, но сам прецедент показывает, что не только рутинные функции при определенных обстоятельствах можно с успехом автоматизировать.
Впрочем, после нескольких месяцев опыта общения с продуктами на основе LLM, удивления особо и нет. Говорите, что эти модели склонны галлюцинировать и тем опасны? Вы просто мало общались с белковыми CEO:))
https://thehustle.co/should-we-automate-the-ceo/amp/
Пока в одних технологических компаниях обсуждают увольнения, оптимизации и падение акций, другие считают миллионы и миллиарды долларов где инвестиций, где капитализации. Первый квартал 2023 — безусловно, время золотой лихорадки вокруг ИИ. Поэтому невредно запомнить имена ИИ-единорогов среди стартапов (их уже немало) и посмотреть, куда инвесторы уже вложили 3.6 млрд долларов с начала года (речь только о США).
При этом помним, конечно, золотое правило про продажу лопат во время золотой же лихорадки.
https://thehustle.co/03172023-ai-startup-valuations/
Люблю повторять, что по образованию, богатому опыту и образу мыслей я экспериментатор. Когда меня учили на физтехе и в Курчатнике этим всерьез заниматься, периодически слышал на первый взгляд странную фразу «экспериментатор должен быть в меру ленив!». Не буду обсуждать ее разнообразную мудрость, которая не раз меня выручала. Последнее время я эти слова вспоминаю в другом контексте — в процессе чтения про все более популярные проекты из области геоинженерии, призванные спасти землю от потепления. Идеи варьируются от засеивания стратосферы всякой дрянью до разворачивания в точке Лагранжа между Солнцем и Землей колоссальных экранов для затенения Земли. Вот бы кто этих бодрых ребят поучил той мудрости :). https://www.greenbiz.com/article/debate-over-geoengineering-intensifying
Читать полностью…Битва титанов в реальном времени:) В ответ на запуск GPT-4 и обновление Bing’а Google открывает API к своей PaLM: a new developer offering that makes it easy and safe to experiment with Google’s large language models. Alongside the API, we’re releasing MakerSuite, a tool that lets developers start prototyping quickly and easily.
Хорошо, но все-таки пока ни одного массового публичного продукта. Гонка продолжается, но пока Google остается в роли догоняющего; хорошо хоть темп держит;)
Какой же интересный год нас ожидает!
https://developers.googleblog.com/2023/03/announcing-palm-api-and-makersuite.html
Увольнения нынче затрагивают не только технологические компании: Levi’s в прошлом году сократили 700 человек и собираются еще 800 отправить туда же (увольнения не касаются людей, непосредственно занятых в торговле и на производстве). Интересно, что на фоне этих сокращений компания объявляет о новациях в своей работе с моделями для рекламы. Чтобы предложить покупателям более персонализированный и инклюзивный опыт, Levi’s начнет использовать сгенеренные ИИ модели всех размеров, возрастов, телосложений и цветов кожи.
While AI will likely never fully replace human models for us, we are excited for the potential capabilities this may afford us for the consumer experience
Ну и в достижение поставленной цели сократить расходы на $100 млн эта инициатива свой вклад тоже должна внести:)
Ждем, когда к обиженным художникам и копирайтерам присоединятся профессиональные модели:)
https://www.pcmag.com/news/levis-will-use-ai-models-alongside-human-ones
Не так давно постил тут ссылку на великолепный текст Стивена Вольфрама о том, как устроены большие языковые модели. Со времени публикации того текста прошло немногим больше месяца - и вот Стивен публикует результат двух с половиной месяцев совместной работы команд OpenAI и Wolfram.
С самого начала Стивен сочетает слова “суперсилы” и “это лишь самое начало” 🙂
Благодаря плагину к ChatGPT у пользователя появился прозрачный доступ к Wolfram|Alfa: ChatGPT преобразует словесный запрос в запрос к Wolfram|Alfa, а получив ответ, пересказывает его словами и, при необходимости, иллюстрирует графикой.
There are lots of nontrivial things going on here, on both the ChatGPT and Wolfram|Alpha sides. But the upshot is a good, correct result, knitted into a nice, flowing piece of text.
Почитайте, очень впечатляющий текст, насыщенный крутыми примерами.
Хорошо, что Юваль Харари, на днях очередной раз нервно делившийся своими тревогами, не видел, на что способна языковая модель, которой дали доступ к языку математики и куче фактических данных, избавив ее от необходимости фантазировать там, где и без фантазий можно красиво ответить:)
И еще важнейший момент: The Wolfram plugin actually has two entry points: a Wolfram|Alpha one and a Wolfram Language one. А почему это важно — читайте статью, это не менее вкусное чтение, чем прошлый рекомендованный текст Стивена. Тут снова можно залипнуть на все выходные — и в итоге у вас закружится голова. И по делу:))
I see what’s happening now as a historic moment. For well over half a century the statistical and symbolic approaches to what we might call “AI” evolved largely separately. But now, in ChatGPT + Wolfram they’re being brought together. And while we’re still just at the beginning with this, I think we can reasonably expect tremendous power in the combination—and in a sense a new paradigm for “AI-like computation”
Умер Гордон Мур, сооснователь Intel, предсказавший принцип развития индустрии полупроводников.
Читать полностью…Я не раз здесь и в прочих местах хвалил и рекомендовал книгу Machine, Platform, Crowd - и вот отличная новость: прошло всего-то чуть больше года, и наше издательство МИФ сподобилось выпустить ее перевод на русский. Можно даже на сайте издательства оставить свою почту, чтоб получить извещение о выходе книги в свет.
https://www.mann-ivanov-ferber.ru/books/mashina-platforma-tolpa/?buytab=paperbook
Не буду повторяться, чем хороша книга, я еще год назад об этом писал относительно подробный текст
https://telegra.ph/Mashiny-platformy-lyudi-07-30
Вчерашние новости про плагины к ChatGPT показали, что у создателей есть видение, стратегии и планы — чего и близко нет у критиков, с апломбом обсуждающих якобы фундаментальные проблемы хоть недостоверности, хоть неокупаемости:)
We’re excited to build a community shaping the future of the human–AI interaction paradigm. пишут в блоге OpenAI, и они имеют право на эти громкие слова: таким шагом просто крутой сервис превращается в __платформу__, из чисто информационного становится там где надо вполне операционным благодаря партнерским плагинам (ведь понятно, для чего плагин, например, Expedia). А наличие уже работающих плагинов показывает, что идея не вчера родилась, а давно была в разработке как часть того самого стратегического плана создания новой платформы с возможностями, которых мы до конца не знаем, но впечатляют и уже известные. Уже руки чешутся попробовать, как выглядит связка с Wolfram, например:)
В двух совершенно разного толка и на разную аудиторию рассчитанных изданиях почти синхронно появилась статья (сначала в The Conversation, потом ее перепечатали в FastCompany) с нетривиальным нынче посылом: не то опасно, что большие языковые модели вдруг обретут сознание (им не светит), а то, насколько мы вольно или невольно занимаемся антропоморфизацией технологий ИИ.
Обе статьи объясняют массу тревог по поводу ИИ влияние поп-культуры — ну наконец-то:)) Я уж года три твержу на разных лекциях, что Терминатор больше принес вреда и паники, чем самые дурацкие запреты и формальные ограничения.
Но ведь иначе — если задуматься над сутью LLM — придется ужаснуться тому, насколько предсказуемы мысли людей, кажущиеся оригинальными и глубокими:)
Уж лучше верить в заговор ИИ:))
…the pressing question is not whether machines are sentient but why it is so easy for us to imagine that they are.
⚡️GitHub обновляет систему Copilot, интегрируя модель GPT-4 от OpenAI и добавляя поддержку чата и голоса. Новый Copilot X предлагает взаимодействие с чат-ботом, напоминающим ChatGPT, в редакторах кода. Благодаря этому чат-боту, Copilot сможет распознавать, объяснять код, рекомендовать изменения и исправлять ошибки. Copilot X предусматривает использование ИИ на каждом этапе разработки.
GitHub Copilot Chat может анализировать код на наличие уязвимостей, объяснять работу блоков кода и даже помогать в рефакторинге или добавлении комментариев. Copilot будет интегрирован с IDE, обеспечивая быстрый доступ к командам.
Система будет поддерживать голосовое управление через функцию "Hey, GitHub!" и использовать комбинацию моделей OpenAI для нового чата и существующих функций автодополнения. Обновленный Copilot также поможет с AI-генерированными ответами на вопросы о документации кода.
Новая система Copilot X будет изначально доступна только в приложениях Microsoft Visual Studio и Visual Studio Code, но планируется расширить на другие IDE в будущем.
Похоже, крутые новости каждый день - теперь норма🤓
https://www.theverge.com/2023/3/22/23651456/github-copilot-x-gpt-4-code-chat-voice-support
Как и следовало ожидать, в гонку сервисов по ИИ-генерации изображений включился Adobe: объявлено о бета-тестировании сервиса Firefly. Поскольку компания в первую очередь обслуживает коммерческий рынок, особо подчеркивается, что абсолютно все изображения, на которых нейросеть обучалась, лицензионно чисты и их использование в коммерческих продуктах не влечет юридических рисков. Так что как минимум с одним возражением против серьезного промышленного использованиия сгенерированных изображений, «это все плагиат, неэтично и юридически стрёмно» разобрались на практике.
https://petapixel.com/2023/03/21/adobe-firefly-is-a-text-to-image-generator-that-didnt-steal-your-work/
Сегодня (вторник 21-го марта) в 18-00 по Москве попробую новый жанр - участие в прямом эфире телеграмм-канала:)
что будет: дискуссия в прямом эфире
название: AI: внедрять нельзя игнорировать
где: в телеграм-канале Epic Growth /channel/epicgrowth
Кто не сможет посмотреть прямой эфир, но захочет взглянуть запись — обещают все через сутки выложить на EpicGrowthChannel">EpicGrowthChannel" rel="nofollow">https://www.youtube.com/@EpicGrowthChannel
Трёп Себранта
-=Выпуск 72=-
LLMs как герои 23Q1; готовимся встречать мультимодальность, эмбодимент и эмерджентность
На фоне уже который месяц не спадающего интереса к ChatGPT и прочим большим языковым моделям я снова позвал в Трёп любимого собеседника — Ваню Ямщикова. Много лет он занимается обработкой естественного языка и языковыми моделями не только как практик, но и как ученый. Потому и его взгляды на происходящее и его ожидания от будущего, да еще в задорном и полемичном стиле изложенные, — очень своевременное и очень освежающее слушание.
Ссылки на упоминавшиеся в разговоре публикации -- на основной странице подкаста
На Apple Podcasts
Здесь тоже файл, по традиции
Иногда природа создает такое, что не получилось придумать ни авторам технологических стартапов, ни даже генеративным алгоритмам:)
На острове Тринидад геологи обнаружили странные камни с цветными включениями; анализ показал, что эти цветные фрагменты — расплавленные и потом вплавившиеся в камни остатки синтетических рыболовных сетей, которые загрязненный океан выбрасывает здесь на берег. Для таких объектов уже даже существует название: по аналогии с конгломератами их называют пластигломератами.
Авторы ужасаются факту воздействия человека на геологию Земли, что выглядит странно по двум причинам:
Во-первых, деятельность человека, меняющая русла рек или создающая колоссальные карьеры, на геологию Земли влияет давно и намного сильнее.
Во-вторых, природный способ связывать пластик скорее должен радовать, чем пугать:)
Пятничное чтиво, приуроченное к выходу GPT-4.
"Поэты сорганизовали несколько митингов протеста и потребовали опечатать машину, но никто, кроме них, не обращал внимания на феномен. Редакции газет были даже довольны, поскольку Электрувер, писавший под несколькими тысячами псевдонимов сразу, представлял готовую поэму заданных размеров на любой случай, и эта поэзия, хоть и на заказ, была такого качества, что читатели раскупали газеты нарасхват, а улицы так и пестрели лицами, полными неземного блаженства, мелькали бессознательные улыбки и слышались тихие всхлипывания. Стихи Электрувера знали все; воздух сотрясали хитроумнейшие рифмы, а наиболее впечатлительные натуры, потрясенные специально сконструированными метафорами или ассонансами, даже падали в обморок; но и к этому был подготовлен титан вдохновения: он сразу же вырабатывал соответствующее количество отрезвляющих сонетов."
Если вы это не читали, то вам срочно сюда:
https://www.booksite.ru/fulltext/0/001/005/167/024.htm
Microsoft сегодня официально рассказал об интеграциях ИИ-решений от OpenAI в свои продукты. Компания продолжает использовать удачную и вполне прижившуюся метафору «второго пилота» — она как про то, чтоб сохранить за пользователем уверенность, что командир воздушного судна-то по-прежнему он. Итак, встречайте Microsoft 365 Copilot.
Местами, правда возникают вопросы. Очень круто и реалистично выглядит посыл «Люди в основном используют процентов 10 возможностей PowerPoint; Copilot даст им возможность использовать остальные 90». Чуть хуже выглядит капитан, знающий и умеющий в разы меньше помощника :)
Но сам по себе подход безусловно правилен, как ни назови, и перспективы улучшения работы многих миллионов пользователей офисного софта выглядят впечатляюще. Но куда сильнее может поменять жизнь, если приживется, Business Chat — универсальный личный помощник, работающий и с документами, и с сервисами (например, календарем), и с коммуникацией с другими людьми. Вот здесь пахнет не улучшением и ускорением, а большими изменениями рабочих процессов :)
https://www.microsoft.com/en-us/microsoft-365/blog/2023/03/16/introducing-microsoft-365-copilot-a-whole-new-way-to-work/
Любопытно, как Цукерберг переобувается на ходу:) Рассказывая на днях о сокращении 10 тыс. человек и закрытии 5 тыс незаполненных вакансий, он вроде бы подтвердил приверженность своему курсу на создание метавселенной как главную цель работы компании: именно метавселенная “remains central to defining the future of social connection”.
Но дальше оказывается, что в теме есть новый поворот: эту цель нельзя теперь достигать любой ценой, ибо деньги, инвестиции нужны на другое: “Our single largest investment is in advancing AI and building it into every one of our products”.
Видимо, все-таки уровень хайпа вокруг генеративного ИИ настолько солидно выглядит на фоне попыток сохранить интерес публики и инвесторов к метавселенной, что словарь приходится пересматривать:)
https://edition.cnn.com/2023/03/15/tech/meta-ai-investment-priority/
О! Обогащенный GPT-4 Bing пообещал мне в качестве новых возможностей демонстрацию рекламы в чатике:)) А все волновались что же будет с монетизацтей :)
Читать полностью…