Вчерашние новости про плагины к ChatGPT показали, что у создателей есть видение, стратегии и планы — чего и близко нет у критиков, с апломбом обсуждающих якобы фундаментальные проблемы хоть недостоверности, хоть неокупаемости:)
We’re excited to build a community shaping the future of the human–AI interaction paradigm. пишут в блоге OpenAI, и они имеют право на эти громкие слова: таким шагом просто крутой сервис превращается в __платформу__, из чисто информационного становится там где надо вполне операционным благодаря партнерским плагинам (ведь понятно, для чего плагин, например, Expedia). А наличие уже работающих плагинов показывает, что идея не вчера родилась, а давно была в разработке как часть того самого стратегического плана создания новой платформы с возможностями, которых мы до конца не знаем, но впечатляют и уже известные. Уже руки чешутся попробовать, как выглядит связка с Wolfram, например:)
В двух совершенно разного толка и на разную аудиторию рассчитанных изданиях почти синхронно появилась статья (сначала в The Conversation, потом ее перепечатали в FastCompany) с нетривиальным нынче посылом: не то опасно, что большие языковые модели вдруг обретут сознание (им не светит), а то, насколько мы вольно или невольно занимаемся антропоморфизацией технологий ИИ.
Обе статьи объясняют массу тревог по поводу ИИ влияние поп-культуры — ну наконец-то:)) Я уж года три твержу на разных лекциях, что Терминатор больше принес вреда и паники, чем самые дурацкие запреты и формальные ограничения.
Но ведь иначе — если задуматься над сутью LLM — придется ужаснуться тому, насколько предсказуемы мысли людей, кажущиеся оригинальными и глубокими:)
Уж лучше верить в заговор ИИ:))
…the pressing question is not whether machines are sentient but why it is so easy for us to imagine that they are.
⚡️GitHub обновляет систему Copilot, интегрируя модель GPT-4 от OpenAI и добавляя поддержку чата и голоса. Новый Copilot X предлагает взаимодействие с чат-ботом, напоминающим ChatGPT, в редакторах кода. Благодаря этому чат-боту, Copilot сможет распознавать, объяснять код, рекомендовать изменения и исправлять ошибки. Copilot X предусматривает использование ИИ на каждом этапе разработки.
GitHub Copilot Chat может анализировать код на наличие уязвимостей, объяснять работу блоков кода и даже помогать в рефакторинге или добавлении комментариев. Copilot будет интегрирован с IDE, обеспечивая быстрый доступ к командам.
Система будет поддерживать голосовое управление через функцию "Hey, GitHub!" и использовать комбинацию моделей OpenAI для нового чата и существующих функций автодополнения. Обновленный Copilot также поможет с AI-генерированными ответами на вопросы о документации кода.
Новая система Copilot X будет изначально доступна только в приложениях Microsoft Visual Studio и Visual Studio Code, но планируется расширить на другие IDE в будущем.
Похоже, крутые новости каждый день - теперь норма🤓
https://www.theverge.com/2023/3/22/23651456/github-copilot-x-gpt-4-code-chat-voice-support
Как и следовало ожидать, в гонку сервисов по ИИ-генерации изображений включился Adobe: объявлено о бета-тестировании сервиса Firefly. Поскольку компания в первую очередь обслуживает коммерческий рынок, особо подчеркивается, что абсолютно все изображения, на которых нейросеть обучалась, лицензионно чисты и их использование в коммерческих продуктах не влечет юридических рисков. Так что как минимум с одним возражением против серьезного промышленного использованиия сгенерированных изображений, «это все плагиат, неэтично и юридически стрёмно» разобрались на практике.
https://petapixel.com/2023/03/21/adobe-firefly-is-a-text-to-image-generator-that-didnt-steal-your-work/
Сегодня (вторник 21-го марта) в 18-00 по Москве попробую новый жанр - участие в прямом эфире телеграмм-канала:)
что будет: дискуссия в прямом эфире
название: AI: внедрять нельзя игнорировать
где: в телеграм-канале Epic Growth /channel/epicgrowth
Кто не сможет посмотреть прямой эфир, но захочет взглянуть запись — обещают все через сутки выложить на EpicGrowthChannel">EpicGrowthChannel" rel="nofollow">https://www.youtube.com/@EpicGrowthChannel
Трёп Себранта
-=Выпуск 72=-
LLMs как герои 23Q1; готовимся встречать мультимодальность, эмбодимент и эмерджентность
На фоне уже который месяц не спадающего интереса к ChatGPT и прочим большим языковым моделям я снова позвал в Трёп любимого собеседника — Ваню Ямщикова. Много лет он занимается обработкой естественного языка и языковыми моделями не только как практик, но и как ученый. Потому и его взгляды на происходящее и его ожидания от будущего, да еще в задорном и полемичном стиле изложенные, — очень своевременное и очень освежающее слушание.
Ссылки на упоминавшиеся в разговоре публикации -- на основной странице подкаста
На Apple Podcasts
Здесь тоже файл, по традиции
Иногда природа создает такое, что не получилось придумать ни авторам технологических стартапов, ни даже генеративным алгоритмам:)
На острове Тринидад геологи обнаружили странные камни с цветными включениями; анализ показал, что эти цветные фрагменты — расплавленные и потом вплавившиеся в камни остатки синтетических рыболовных сетей, которые загрязненный океан выбрасывает здесь на берег. Для таких объектов уже даже существует название: по аналогии с конгломератами их называют пластигломератами.
Авторы ужасаются факту воздействия человека на геологию Земли, что выглядит странно по двум причинам:
Во-первых, деятельность человека, меняющая русла рек или создающая колоссальные карьеры, на геологию Земли влияет давно и намного сильнее.
Во-вторых, природный способ связывать пластик скорее должен радовать, чем пугать:)
Пятничное чтиво, приуроченное к выходу GPT-4.
"Поэты сорганизовали несколько митингов протеста и потребовали опечатать машину, но никто, кроме них, не обращал внимания на феномен. Редакции газет были даже довольны, поскольку Электрувер, писавший под несколькими тысячами псевдонимов сразу, представлял готовую поэму заданных размеров на любой случай, и эта поэзия, хоть и на заказ, была такого качества, что читатели раскупали газеты нарасхват, а улицы так и пестрели лицами, полными неземного блаженства, мелькали бессознательные улыбки и слышались тихие всхлипывания. Стихи Электрувера знали все; воздух сотрясали хитроумнейшие рифмы, а наиболее впечатлительные натуры, потрясенные специально сконструированными метафорами или ассонансами, даже падали в обморок; но и к этому был подготовлен титан вдохновения: он сразу же вырабатывал соответствующее количество отрезвляющих сонетов."
Если вы это не читали, то вам срочно сюда:
https://www.booksite.ru/fulltext/0/001/005/167/024.htm
Microsoft сегодня официально рассказал об интеграциях ИИ-решений от OpenAI в свои продукты. Компания продолжает использовать удачную и вполне прижившуюся метафору «второго пилота» — она как про то, чтоб сохранить за пользователем уверенность, что командир воздушного судна-то по-прежнему он. Итак, встречайте Microsoft 365 Copilot.
Местами, правда возникают вопросы. Очень круто и реалистично выглядит посыл «Люди в основном используют процентов 10 возможностей PowerPoint; Copilot даст им возможность использовать остальные 90». Чуть хуже выглядит капитан, знающий и умеющий в разы меньше помощника :)
Но сам по себе подход безусловно правилен, как ни назови, и перспективы улучшения работы многих миллионов пользователей офисного софта выглядят впечатляюще. Но куда сильнее может поменять жизнь, если приживется, Business Chat — универсальный личный помощник, работающий и с документами, и с сервисами (например, календарем), и с коммуникацией с другими людьми. Вот здесь пахнет не улучшением и ускорением, а большими изменениями рабочих процессов :)
https://www.microsoft.com/en-us/microsoft-365/blog/2023/03/16/introducing-microsoft-365-copilot-a-whole-new-way-to-work/
Любопытно, как Цукерберг переобувается на ходу:) Рассказывая на днях о сокращении 10 тыс. человек и закрытии 5 тыс незаполненных вакансий, он вроде бы подтвердил приверженность своему курсу на создание метавселенной как главную цель работы компании: именно метавселенная “remains central to defining the future of social connection”.
Но дальше оказывается, что в теме есть новый поворот: эту цель нельзя теперь достигать любой ценой, ибо деньги, инвестиции нужны на другое: “Our single largest investment is in advancing AI and building it into every one of our products”.
Видимо, все-таки уровень хайпа вокруг генеративного ИИ настолько солидно выглядит на фоне попыток сохранить интерес публики и инвесторов к метавселенной, что словарь приходится пересматривать:)
https://edition.cnn.com/2023/03/15/tech/meta-ai-investment-priority/
О! Обогащенный GPT-4 Bing пообещал мне в качестве новых возможностей демонстрацию рекламы в чатике:)) А все волновались что же будет с монетизацтей :)
Читать полностью…Отличный вариант художественно-технологического микса: канал /channel/science_art_at_least_once_a_week в телеграме, где рецензии на art&science проекты пишет ChatGPT:) Технологическая подложка вся описана на гитхабе: https://github.com/andreygetmanov/science_art_at_least_once_a_week
Читать полностью…В городе Остине в Техасе проходит мероприятие SXSW, впервые с 2019 года в офлайновом формате. Для тусовки, которая совмещает элементы фестиваля, конференции, шоу и славится очень бодрой атмосферой, онлайн-версии времен пандемии не смогли послужить достойной заменой, и вот теперь участники оттягиваются. SXSW славится именно визионерством и фокусом на трендах и новациях, поэтому интересно проследить, что там было на этот раз в фаворе.
Из трех больших тем, которые журналисты выделили после первых дней, одна очевидна, вторая предсказуема, а вот третья меня несколько удивила:)
1. Как организовать счастливую совместную жизнь людей и ИИ
2. Пора отделить мух от котлет в развитии web3 и начать работать над доказавшими жизнеспособность технологиями web3, не оглядываясь на сдувшийся хайп вокруг концепции
3. терапевтические и общественные перспективы психоактивных веществ
Учитывая, что Техас известен жесткостью законов в отношении наркотиков, последняя тема особенно пикантна.
https://www.thedrum.com/news/2023/03/13/you-wanted-ai-you-got-ai-sxsw-2023s-3-biggest-trends
Последние сутки нет недостатка в комментариях и аналитике на тему краха SVB, Silicon Valley Bank. Есть масса публикаций разной степени подробности; вот изложенный общедоступным языком и очень подробный рассказ в оригинале и его перевод на русский.
Но хочется обратить внимание на одну особенность этого крупнейшего со времен 2008-го года краха, которую не сразу видно за техническими деталями и не лучшими финансовыми решениями.
Журналисты CNBC правильно поймали и подчеркнули, что имел место случай самострела или самосбывающегося пророчества, отягченный современными быстрыми коммуникациями внутри профессиональных сообществ.
Во многом крах спровоцировали те самые инвестфонды и прочие крупные инвесторы, которые и накачивали клиентскую базу SVB. За 48 часов паника среди того самого сообщества, которое 40 лет усиленно взращивало банк и полагалось на его услуги, его же и убила.
“This was a hysteria-induced bank run caused by VCs,” Ryan Falvey, a fintech investor at Restive Ventures, told CNBC. “This is going to go down as one of the ultimate cases of an industry cutting its nose off to spite its face.”
На русский эта идиома примерно переводится как «назло бабушке отморожу уши, руки, ноги и вообще все жизненно важные органы». Но удивительно наблюдать каких эпических пропорций может достичь такое желание у вроде бы разумных и управляющих миллиардными капиталами людей.
История из серии «умелые ручки» — но в мире гаджетов. Apple не случайно гордится функцией «спутниковый sos» в последнем айфоне, но как быть, если смартфон не настолько продвинутый, а ты завяз в снегу во время снежной бури на лесной дороге, по которой никто не ездит и вообще она закрыта для транспорта? И вдобавок в этой глухомани всё плохо с сотовым покрытием?
Находчивый любитель дронов не растерялся: записал сообщение с описанием ситуации, привязал смартфон к дрону, который удачно оказался в машине, — и просто погнал дрон вверх.
Сработало: где-то на высоте смартфон поймал сеть и отправил сообщение из очереди, друг его получил и связался со спасателями, те пробились на своей технике к любителю дронов и приключений и даже по дороге еще одного бедолагу спасли, которому не хватило то ли дрона, то ли смекалки.
Никакой морали, просто добрая весенняя история под выходные, на которые опять обещают погодные выкрутасы.
https://petapixel.com/2023/03/09/man-stranded-in-a-snowy-forest-ties-his-phone-to-a-drone-to-summon-help/
Умеют некоторые в хлесткие заголовки и новые термины: “заря пост-поискового интернета” 🙂 Звучит красиво, но, с другой стороны, мы просто зря учились много лет разговаривать с поисковиками на жаргоне ключевых слов, а бинговский ИИ позволяет вернуться на десятилетия назад, когда в справочной ты задавал вопросы обычным разговорным языком. Оказалось, вернуться к этой древней практике приятно даже родившимся во времена развитого интернета:)
Читать полностью…Тут на неделе выступил главный производитель лопат в текущей золотой лихорадке Дженсен Хуанг, Nvidia CEO.
Он не только похвалился, что лично доставлял компоненты для того суперкомпьютера, на котором нынче учатся продукты OpenAI, но и отметил, что в его планы входит не только БигТех сделать полностью зависимым от своей продукции, но и любую индустрию, ибо машинное обучение нынче везде.
Вот кто б в начале века сказал, что в области процессоров производитель периферии может покуситься ключевую роль производителя центральных процессоров:)) Эпитет несколько потускнел.
…Тридцать лет мужик на посту начальника компании, которую сам же и основал. И явно не собирается никуда уходить, да и с чего бы при таких успехах. Кстати об обязательности ротации кадров, обновлении руководства и т.д. 🙂
So, I think for as long as I believe I can do that, I don’t know exactly for how long that’s gonna be, but 3 to 4 decades I’d say. Another 4 decades I’d be robotic and maybe another 3 to 4 decades after that. Hopefully, I get to enjoy this for a very long time.
Есть ощущение, что он не совсем шутит:))
Что Acer решил выпустить нечто AI-powered, не очень удивительно; AI — это нынче такой продающий префикс; грех сильной компьютерной фирме не воспользоваться. А вот что это нечто окажется электровелосипедом, меня несколько удивило.
Байк, кстати, выглядит достаточно красиво и неожиданно, в меру набит датчиками, процессорами и софтом, но обошелся без дисплея — вместо него есть док для смартфона, на котором все и будет отображаться. Чисто транспортные параметры тоже ничего для города (а это явно городская модель): 110 км пробега на одной зарядке, макс скорость 25 км/ч, батарея съемная и заряжается сутки.
Единственно, название модели произносить вслух в русскоязычной среде надо с осторожностью: ebii
https://www.cyclingweekly.com/products/computer-company-acer-is-making-an-ai-powered-bike-and-its-got-some-wild-features
Мультимодальность в каждый дом! Microsoft продолжает держать темп: вот только что они начали раскатывать в Bing и Edge возможность прямо в рамках чата генерить картинки с помощью DALL-E. Для тех, до кого не докатился обновленный чат, есть отдельный адрес https://www.bing.com/create где можно погенерить графику просто по запросу (пример результата -- на картинке в этом посте; prompt: geek girl amazed by Image Creator capabilities). Не до всех стран докатилось, может пригодиться VPN:)
Читать полностью…ModelScope Text-2-Video: Китайский опенсоурс разродился открытой моделькой для генерации видео по тексту
Это первая диффузионная text2video модель с открытым кодом и опуьликованными весами (1.7 млрд параметров).
Отдельный респект идет Шаттерстоку, данные с которого по всей видимотси использовались для тренировки модели 😂.
Чтобы запустить локально потребуется 16 GB RAM и 16 GB VRAM: инструкция. Пока генерит видео только 256x256.
Ну что, давайте побыстрее заполним интернет проклятыми видео!
Demo
Model weights
@ai_newz
Прекрасная статья, на которую Ваня Ямщиков ссылался, когда мы в воскресенье писали подкаст. Теперь, когда слова “большая языковая модель” уже почти все выучили, пришло время учить термины “мультимодальность” и “эмерджентность”:)
Про мультимодальность у меня уже было тут несколько постов, а вот эмерджентность, свойство сложных систем демонстрировать поведение и способности, которые ни отдельным элементам, ни малым их наборам не даны, нам еще подкинет сюрпризов.
“Despite trying to expect surprises, I’m surprised at the things these models can do” — замечает по этому поводу один из исследователей.
Если говорить совсем просто, то у больших моделей начинают проявляться свойства, которые никому никогда не приходило в голову связывать с анализом текстов, и потому от них правильно ожидать прорывов, которые отнюдь не планировались их создателями.
Оно пока выглядит как курьез, но в действительности любопытный эксперимент. В прошлом августе гонконгская игровая компания назначила директором своего отделения алгоритм, на всякий случай с именем: Тэнг Ю.
В задачи ИИ-директора входило: изучение верхнеуровневой аналитики и принятие решений на ее основе, анализ рисков, поддержание эффективной рабочей среды для кожаных мешков.
Явным плюсом руководителя нового типа являлись отсутствие зарплаты, бонусов, золотых парашютов и т.д.
Если судить по курсу акций компании в сравнении с индексом гонконгской биржи, руководитель справился: за полгода акции вели себя постоянно лучше индекса.
Без деталей, конечно, этот кейс анализировать сложно и восхищаться рано, но сам прецедент показывает, что не только рутинные функции при определенных обстоятельствах можно с успехом автоматизировать.
Впрочем, после нескольких месяцев опыта общения с продуктами на основе LLM, удивления особо и нет. Говорите, что эти модели склонны галлюцинировать и тем опасны? Вы просто мало общались с белковыми CEO:))
https://thehustle.co/should-we-automate-the-ceo/amp/
Пока в одних технологических компаниях обсуждают увольнения, оптимизации и падение акций, другие считают миллионы и миллиарды долларов где инвестиций, где капитализации. Первый квартал 2023 — безусловно, время золотой лихорадки вокруг ИИ. Поэтому невредно запомнить имена ИИ-единорогов среди стартапов (их уже немало) и посмотреть, куда инвесторы уже вложили 3.6 млрд долларов с начала года (речь только о США).
При этом помним, конечно, золотое правило про продажу лопат во время золотой же лихорадки.
https://thehustle.co/03172023-ai-startup-valuations/
Люблю повторять, что по образованию, богатому опыту и образу мыслей я экспериментатор. Когда меня учили на физтехе и в Курчатнике этим всерьез заниматься, периодически слышал на первый взгляд странную фразу «экспериментатор должен быть в меру ленив!». Не буду обсуждать ее разнообразную мудрость, которая не раз меня выручала. Последнее время я эти слова вспоминаю в другом контексте — в процессе чтения про все более популярные проекты из области геоинженерии, призванные спасти землю от потепления. Идеи варьируются от засеивания стратосферы всякой дрянью до разворачивания в точке Лагранжа между Солнцем и Землей колоссальных экранов для затенения Земли. Вот бы кто этих бодрых ребят поучил той мудрости :). https://www.greenbiz.com/article/debate-over-geoengineering-intensifying
Читать полностью…Битва титанов в реальном времени:) В ответ на запуск GPT-4 и обновление Bing’а Google открывает API к своей PaLM: a new developer offering that makes it easy and safe to experiment with Google’s large language models. Alongside the API, we’re releasing MakerSuite, a tool that lets developers start prototyping quickly and easily.
Хорошо, но все-таки пока ни одного массового публичного продукта. Гонка продолжается, но пока Google остается в роли догоняющего; хорошо хоть темп держит;)
Какой же интересный год нас ожидает!
https://developers.googleblog.com/2023/03/announcing-palm-api-and-makersuite.html
На фоне сегодняшнего объявления о выпуске GPT-4 интересно почитать, на каком железе эти модели обучают; становится понятней, почему очень немного компаний могут себе это позволить, а остальные будут пользоваться готовыми моделями и писать для них обвес; пре- и постпроцессинг и прочие рюшечки.
Десятки тысяч Nvidia A100 GPU, которые сейчас апгрейдят до Nvidia H100. В 2019 Microsoft не просто инвестировала 1 млрд, но начала строить суперкомпьютер для OpenAI, которого при всей мощи облака Azhure раньше у компании не было. Проект обошелся в “несколько сотен миллионов долларов”. Масштаб железа впечатляет.
А ссылочка про запуск GPT-4, например, вот, если кто-то еще не прочитал.
⚡️Вот и первые новости о генеративном ИИ от Google:
Google добавляет новые функции искусственного интеллекта в свои приложения, такие как Google Docs и Gmail, чтобы упростить написание и обобщение текста, а также создание изображений, аудио и видео для презентаций. Это сделано для того, чтобы не отставать от Microsoft и ChatGPT. Пока будет доступно в закрытом бета-тесте в США, но обещают дать общий доступ до конца этого года.
https://www.theverge.com/2023/3/14/23639273/google-ai-features-docs-gmail-slides-sheets-workspace
Лента технологических новостей продолжает распухать от заметок так или иначе связанных с ChatGPT; как точно замечено на днях в одном тексте, so far the hype train shows no sign of slowing down.
К счастью, иногда на фоне унылых списков типа “5 советов школьнику как улучшить успеваемость с помощью ChatGPT” встречаются и красивые продуктовые находки.
Вот, например, не самый могучий бренд умных часов и трекеров активности Amazfit умудрился первым вкрутить интеграцию с ChatGPT в свой продукт; теперь у часиков можно спросить советы по улучшению своих тренировок, самочувствия и вообще. Для Apple Watch существует подобное внешнее приложение, а тут все нативненько. Из видео неясно, впрочем, насколько глубокие беседы можно теперь вести с собственными часами — или только про фитнес:)
Немножко мрачняка на темы VR. Я и раньше любил повторять, что глобальные продажи на уровне 10 млн устройств в год выглядят несерьезно на фоне миллиардов пользователей смартфонов, т.е. VR остается (и в ближайшее время останется) сугубо нишевой историей. В ответ приходилось слышать, что экспоненциальный рост тем и прекрасен, что за несколько лет поможет на порядки увеличить охваты.
Вот только с экспонентой, которую рисовали разнообразные аналитики, недавно возникли проблемы.
В 2022 по сравнению с 2021 произошло резкое сокращение, а не новый рост продаж устройств, по данным IDC. Другие аналитики об этом еще с декабря писали, опираясь на предварительные данные.
Конечно, сторонники метавселенной как светлого виртуального будущего не обескуражены, и утверждают, что уже в следующем году рост станет феноменальным, что подключится Apple, другие новые производители и новые рынки, которые еще не вошли во вкус. Все чаще вместо виртуальных миров начинают говорить про смешанную реальность.
Но в целом запахло пивотом:) Это нормальный путь развития; но интересно, кто куда свернет:)
Уже и культовые мультики превратились в практичекий курс по использованию ChatGPT в личной жизни :)) У South Park в их свежей серии Deep Learning.
Круто получилось уже потому, что до безобразия реалистично при всей традиционной едкости.
А один наблюдательный подписчик мне подсказывает, что дополнительный прикол содержится в Википедии, где ChatGPT указан как соавтор серии.
Ссылку на просмотр серии не дам, но она уже доступна в том числе и с отличным русским переводом:)