Wai.Sale: AI решения для sales команд, повышающие прибыль бизнеса Обсудить → @mikwiseman
Дайджест wAI_1/25
С Новым годом и Рождеством, дорогие подписчики! Год полон событиями: в 2024м я поучаствовоал и выиграл в нескольких хакатонах, в том числе в Сан Франциско, запустил проект - AI-продукт для усиления sales команд, и канал подрос со 130 до 1300 человек. Желаю вам созидательного и яркого 2025го!
Новости
- Google анонсировала Jules - AI тул, который будет править код за разработчиками, позволяя сфокусироваться на более креативных задачах. На сегодня уже больше 1/4 кода в Google пишется с помощью AI
- Nvidia выпустила дешевый SuperComputer - на котором можно запускать модели ИИ. Стоит он 249$
- OpenAI обсуждает запуск собственного робота-гуманоида
Статьи
Исследователи обсуждают, что делать с тем фактом, что данные для обучения LLM, несмотря на огромный объём информации, конечны. Фей Фей Ли считает, что надо использовать данные из смежных сфер, например, данные о геноме. А Ян ЛеКун выступает за подход с использованием видео и приводит пример, что человек за 4 года обрабатывает столько визуальной информации, сравнимой с 170 000 лет информации, если бы воспринимать её через чтение.
Инстурменты
Expert tips to start working with NotebookLM
https://blog.google/technology/ai/notebooklm-beginner-tips
AI-лаборатория
Алекс и Глеб из @ai_mind_set запускают новые потоки лабораторий (записывали с ребятами подкаст). Я участвовал в одной из них, поэтому это не реклама, а рекомендация из личного опыта.
Первая лаборатория про создание AI-продуктов — AI Mindset VI: стартует 21 января. Участвовал в этой лабе у ребят в начале 2024 года, и мне очень понравилось: материал собран с теорией плюс практикой, и главное пробованием прямо на лабе инструментов в диалоге с участниками, что, на мой взгляд, является единственно правильным подходом для подачи знаний по AI.
Вторая лаборатория про управление знаниями — ⛓ AI mindset [knowledge]: Obsidian и AI, стартует 13 января. Думаю, что задача управления знаниями в век ИИ — одна из важнейших. После лабы научитесь:
- cтроить персональную базу знаний в Obsidian
- интегрировать AI-инструменты в свою систему работы
- создавать персональных AI-ассистентов на основе ваших данных
- автоматизировать сбор и обработку информации
Горячо рекомендую!
Новая версия wai.zone: поиск информации о человеке для знакомства
Вышла новую версию Wai.Zone, в котором можно дать ссылку на LinkedIn человека, и получить:
⁃ summary информации про него
⁃ публикации этого человека
⁃ ссылки на соц сети (LinkedIn, Facebook, Twitter, etc)
⁃ интересные человеку темы, которые можно поднять в диалоге
⁃ ИИ пишет адресное сообщение для коннекта в LinkedIn
В новой версии
- fun mode: генерируется картинка вместо аватарки и собирается информация в ироничном режиме
- добавил шеринг профиля
- улучшил работу ИИ
- добавил русскую и английскую версии
Сценарии использования:
- подготовка к продажам: собрать инфу к sales-звонку о потенциальном клиенте
- рекрутинг: получить полное представление о потенциальных кандидатах
- расширение сети контактов: прочитать быстро summary о человек
- fun mode: посмеяться над генерациями в смешном режиме и пошарить друзьям
Сервис доступен по адресу https://www.wai.zone/ru для русской версии и https://www.wai.zone для английской.
P.S. Сервис Wai.zone - мини демонстрация, что мы можем делать для B2B продаж с помощью ИИ сервиса Wai.Sale: полностью автоматизировать весь процесс продаж и в разы увеличить число лидов (искать их и писать им с помощью ИИ), писал об этом тут
Вышло моё интервью для Алекса и Глеба из проекта @ai_mind_set, где мы поговорили про ИИ в разработке и про то, как совмещать гуманитарный и технический подход к созданию продуктов.
Приятно было вспомнить прошлые проекты, например Нейростилиста, и обсудить про победы на хакатонах и 48 часовые спринты. Отдельная радость - ощущение сходимости не только в интересе к Искусственному интеллекту, но и душевной беседе.
Слушать:
Youtube — Все площадки
Дайджест wAI_50/24
Теперь буду вести в дайджесте три рубрики - новости, статьи и полезные инструменты (ИИ и не только).
Новости
OpenAI запустила 12 релизов за 12 дней перед Рождеством - каждый день делают новый анонс. Уже анонсировали и выложили в доступ chatgpt o1 pro, доступную по подписке за 200$/месяц, которая может использовать больше вычислительной мощности и подходит, например, для решения сложных задач в программировании и биологии.
Также вышла наконец долгожданная Sora - модель, генерирующая видео.
Стартап World Labs, основанный пионером в области искусственного интеллекта Фей-Фей Ли (писал о ней тут), представил свой первый проект — AI-систему, способную преобразовывать одномерное изображение в интерактивные 3D-сцены. Хотя многие AI-системы могут превращать фотографии в 3D модели, уникальность разработки World Labs в том, что созданные сцены интерактивны и поддаются модификации.
В ту же тему - DeepMind, исследовательская организация в области ИИ, принадлежащая Google, представила новую модель Genie 2, способную генерировать "бесконечное" количество играбельных 3D миров. Похоже, нас ждёт революция в гейминге.
Создатели Ai Pin - носимого Ai устройства (про него писали, например, тут), выпустили CosmOS - AI-операционную систему для носимых устройств
Статьи
Текст от от Foundation Capital - описывают трансформацию программного обеспечения с "программного обеспечения как услуги" к "услуге как программному обеспечению". Про то, как происходит переход к экономике агентов ИИ, которые коллаборируя друг с другом и человеком, дают на порядок больший результат. На эту же тему наш проект, про него писал тут - позволяет за счет ИИ агентов получить продажи, как если бы вы наняли группу сейлов - людей, но за стоимость одного сейла.
Инструменты
Персонализованные поздравления от Санта Клауса
Google LLM Notebook - можно чатиться со своими документами и создавать из них подкаст,
Такое же запустили в elevenlabs (ios, android) - в их приложении также можно себе собрать подкаст из pdf или сайта
Это же можно сделать в моем боте @wairocks_bot (получить озвучку и суммаризацию веб страниц и текстов)
Инструмент от Google: LLM, заточенная специально для обучения, спрашивайте у нее вопросы и получаете информацию в виде, адаптированном для обучения
@wisemantalks
AI для продаж: wai.sale
Любой бизнес сталкивается с необходимостью организовывать продажи. В этом правиле нет исключений - нет продаж, нет бизнеса.
Я давно мечтал о сервисе, который возьмет на себя всю не самую приятную часть с подбором лидов: поиском лидов, холодными контактами и письмами - и такими, чтобы лиды еще их открывали - то есть с персональным сообщением каждому. На это у меня лично уходили десятки часов в неделю.
Мы решили эту боль в сервисе wai.sale. Wai - это AI для Sales команд. Работает это так:
1) С помощью ИИ wai.sale находит подходящих лидов по вашему запросу и собирает о них подробную информацию
2) На основе этой информации создает индивидуальные сообщения и автоматически рассылает их по всем доступным каналам (mail, linkedin, vk, facebook, whatsapp, etc)
3) Далее система собирает обратную связь, улучшает рассылки и предоставляет подробную аналитику
Подробнее можно посмотреть на лендинге wai.sale и в презентации. Пишите @wisemik, чтобы наладить в своем бизнесе поток продаж: клиент сейчас из разных сфер, это и облачный хостинг, и финтех, и логистика
Мой прогноз на 2025й год про AI
1) Выйдет +1 массовый AI Hardware, который соберёт больше миллиона продаж
2) Появится как минимум +1 новая компания стоимостью больше миллиарда долларов, в которой будет работать не больше 3 человек, включая основателей и сотрудников, и сотен AI агентов и утилит для поддержания работы
3) Больше 80% sales отделов компаний из S&P 500 будут на ежедневной основе использовать AI сотрудников для осуществления продаж
Новости технологий wAI_48/24
1) На IEEE Spectrum вышла интерактивная статья "Where's My Robot?" — можно посмотреть историю гуманоидов в формате динамичного сторителлинга.
2) У Anthropic — в их детище Claude, главном конкуренте ChatGPT, можно задавать стиль, в котором будет вестись общение. Из классного — можно подгрузить пример желаемого стиля в виде документа, и AI сам определит нужный стиль.
3) CEO Nvidia, Jensen Huang (недавно писал про него в посте), предсказывает скорое изменение баланса спроса — сейчас львиная доля приходится на так называемый pre-train, когда модели проходят этап предобучения. И Jensen считает, что вскоре будет все больше спроса на так называемый inference — то есть запуск обученных моделей по запросам к ним (например, когда вы пишете в ChatGPT запрос — это inference).
@wisemantalks
Третий персонаж - это Фей-Фей Ли
Профессор Принстонского университета, она вдохновлялась работами Ирвинга Бидермана - который утвреждал, что в среднем человек распознают от 30 000 разных объектов физического мира. И Фей Фей Ли тогда решила, а что если разметить вообще все объекты, встречающиеся в мире, и сделать из этого такой огромный и качественно собранный набор данных? Ведь тогда получится дать машинам в качестве входных параметров массив данных совершенного иного порядка!
Энтузиазм уперся в математический рассчет - если как Ли изначально планировала размечать этот датасет дюжине студентов Принстона, даже при всей возможной оптимизации процесса на это уйдет по меньшей мере 18 лет работы. Но тогда Ли узнала про Amazon Mechanical Turk (AMT) - сервис, через который можно было подключать руки для разметки по всему миру, в любом нужном в моменте объеме и заметно дешевле студентов Принстона. Ли посчитала, что с AMT процесс займет около двух лет - и началась работа.
Спустя два года результат был получен, вручную размечено 14 000 000 картинок. Ли вдохновенно подала заявку на выступление на конференцию по компьютерному зрению. Это же фантастика, такого объема набора данных для тренировки не было никогда ранее за всю историю! Когда пришел ответ от конференции, Ли была подавлена: им предложили разместиться всего лишь с постером с описанием проекта в холле конференции - даже не на второстепенной сцене! Вызывано это было тем, что к тому моменту (2009 год) большинство исследователей разорчаровались в поплуярных ранее нейросетях и считали их пыльным пережитком прошлого. А для других трендовых тогда технологий по типу векторных машин такие объемы данных особо не требовались.
Но Ли продолжала верить в свой проект и начала проводить соревнования по использованию ImageNet для распознавания картинок. В 2010 году в конкурс вписвалось 11 команд. Победители этого года исполтзовали популярную тогда Supportive Vector Machine. В 2011 было даже меньше участников, и лучшая из команд опять использовала Supportive Vector Machine - при этом результат был не сильно лучше прошлогодней.
Тут настал момент, когда даже сами Ли задалась вопросом - а верная ли была ставка на ImageNet? Не пора ли смирится и признать, что все критики из индустрии, так холодно встретившие ее детище, были правы и заняться чем-то еще? Но Ли все-таки решила провести конкурс еще разок.
И в 2012м году ситуация кардинально поменялась. Конкурс выиграла команда Джеффа Хинтона с его студентами - Алексом Крижевсим и Ильей Суцкевером с их проектом AlexNet. Они использовали CNN - Convolutional Neural Networks - ту же технологию, которую задолго до этого применил Ян ЛеКун, тоже ученик Хинтона.
AlexNet предстаили на конференции, на которую приехала Фей-Фей Ли (она почувствовала важность момента и решила все-таки ехать, хотя изначально думала отказаться от приглашения, потому что недавно родила ребенка), на которой был и Ян ЛеКун.
Когда Алекс Крижевский выстпуил, Ян ЛеКун был в восторге: “Это доказателтсво!” - сказал он тогда -“без сомнения это поворотоный момент в истории компьютерного зрения”.
Photo: Wired magazine
Первый персонаж - это Джеффри Хинтон
В 1950е годы исследователи впервые пришли к идее попробовать алгоритм, названный нейронными сетями - но быстро потеряли интерес, потому что простые нейронные сети не показывали достаточного результата, а для глубоких нейронных сетей не было ни соответствующих вычислительных мощностей, ни понимания как эффективно их обучать.
Но Джеффри Хинтон заинтересовался ими и захотел копать дальше. Не встречая ни интереса ни одобрения от научной среды, Джефф в период с 1976 до 1986 сменил 4 унивесритета: Sussex University, the University of California San Dirgo (USCD), UK Medical Research Council и наконец в Carnegie Mellon, где он стал профессором в 1982м.
Хинтон придумал алгоритм тренироваки глубоких нейронных сетей в 1986, ключевая идея которго была в том, чтобы начинать с последнего слоя сети и потом переходить на предыдущие слои. Алгоритмом заинтересовались некоторые исследователи, и так Хинтон познакомился с молодым ресерчером их Франции - Яном ЛеКуном. Ян адаптировал идею Хитнона и создал алгоритм, распознающий рукописные цифры - и создал так хорошо - что банки по всей Америке начали использовать его для распознавания цифр на чеках. ЛеКун и другие исследователи решили попробовать алгоритм для более сложных изображений, но тогда не получилось. Нейросети опять вышли из моды и уступили место другим алгоритмам, но Ян ЛеКун не преставал в них верить - и вера вознаградилась, правда многими годами позднее.
Photo: Geoffrey Hinton - Linda Nylind / Eyevine via Redux
Новости технологий wAI_46/24
То, что больше всего обсуждали за последнюю неделю: похоже, что снижается скорость прироста навыков ИИ методом, который привел к скачку от ChatGPT 3 к ChatGPT 4. OpenAI ищет новые стратегии, как можно улучшать модели. И тут, как я вижу, может быть три направления: то, что мы видели в модели o1-preview от OpenAI — так называемая chain of thought, то есть цепочка рассуждений. Моделям дают время подумать, выстраивать цепочку рассуждений, как это делает человек.
Второе — это создание агентов. Такой агент уже запустила компания Clade под названием computer use, который может управлять вашим компьютером, например, заказать билеты на самолет по промпту. Свою подобную систему OpenAI собирается запустить в начале 2025 года.
И третье направление — это получение большего контекста о человеке, например, за счет носимых устройств. Прототип такого устройства я создал на выходных: на видео я паяю его на основе компонента Seeed Studio со встроенным AI-чипом (и далее разработал для него backend часть с агентом и llm).
Планирую сделать из него носимое AI-устройство, как раз с целью иметь больше контекста о пользователях и, например, автоматически делать саммари встреч, давать советы о проведенных встречах глазами, например, Илона Маска, Стива Джобса или Эйнштейна (такой портативный advisory board).
И много всего любопытного публиковали на неделе про роботов:
Ресерчеры из UC Berkeley и ETH Zurich собрали робота, убирающего стол от пролитых жидкостей за $250. Робот с двумя роботизированными руками, общей стоимостью всего $250, использует LangChain с OpenAI. Так дешево получилось благодаря повсеместному распространению Open Source - любой может взять и собрать своего мини-робота, опираясь на открый исходный код плюс инструкции по сбору железа.
Если хочется собрать более серьезного гуманоида, который будет быстро обучаться убираться, делать погрузки, играть на пианино, то можно в домашних условиях собрать такого за $108,000. Исследователи из Stanford University подготовили для этого инструкцию и каталог с оборудованием для заказа в рознице.
@wisemantalks
Выкатили новую версию бота по саммаризации аудио, веб страничек, генерации картинок и общения с ИИ - Wai Rocks!
В нём из нового:
- поддержка больших файлов для транскрибации
- новая модель для генерации картинок (Stable Diffusion 3.5)
- умный саммаризатор ссылок — можете отправить ссылку, и он сделает summary (даже по большим статьям), предоставит текст в PDF и сделает аудио подкаст
А ещё Wai Rocks может:
- Общаться в свободном формате, просто пишите текст, ИИ вам ответит
- Генерировать видео по изображению
- Суммировать видео с YouTube
- Обсуждать ваши вопросы на основе предыдущих взаимодействий
Части пользователей прошлых версий отправлю доступ в личку, а также на следующей неделе будет публичный релиз, в нём появится ещё пачка полезных функций.
Для доступа ставьте ❤️🔥 и пишите ➕ в комментах, вышлю доступ и буду благодарен за обратную связь!
Я выиграл 1-е место сразу в двух номинациях на хакатоне EthGlobal в Сан-Франциско! С проектом BenderBite - это AI сотрудник, с которым можно:
- обсуждать идеи проектов, и он, обученный на базе прошлых хакатонов и проектов, даёт точные советы, что лучше использовать в своих проектах, а что нет
- делать ставки на проекты - и если угадали, кто победит, то BenderBite выплачивает угадавшему сумму с мультипликатором, и BenderBite автоматически процессит все деньги (с библиотекой Circle) - от получения до расчётов и выплат. Это всё сделано на хакатоне и работает, хоть и не в продакшн релизе
- автоматически, с помощью смарт-контракта, регистрировать для своих проектов поддомены в зоне .eth (через ENS)
- находить себе друзей на хакатоне (BenderBite предлагает нужный контакт через XMTP сообщения).
Планирую всё это использовать в своих рабочих проектах, в частности, в AI-боте и мессенджере Wai.
Итого:
- два первых места среди 1000+ участников, что особенно лестно, с учётом того, что большинство участвовало командами до 5 человек, а я - соло (и это лестно финансово, так как призы за первые места не придётся делить с другими 5-ю тиммейтами)
- 0 часов сна за 42 часа
- 24 часа непрерывного кодинга в 4-х направлениях работы - двух фронтендов (Vue.js + отдельно TypeScript для мессенджера), бэкенда на Python и смарт-контрактов на Solidity
- 30 000+ километров и более 30 часов чистого пути в воздухе (практически кругосветное путешествие - летел в СФ через Стамбул из Москвы и обратно в Москву через Сеул)
- куча новых знакомств и контактов, в этот раз было много знакомств, многие люди подходили сами знакомиться (благо на хакатоне участники из 70+ стран)
- сдвиг времени сначала на -10 к Москве в Сан-Франциско и потом на +16 к Сан-Франциско в Сеуле.
🥇🥇Wai Wai Wai! Win Win Win!🥇🥇
P.S. А еще хакатон проходил в офигительном Palace of fine arts, и за это отдельный респект EthGlobal. И когда выходил в 4 часа утра пройтись по СФ, какие же там были огромные звёзды!
Wiseman News #41/24
Tesla презентовала роботов Optimus. На презентации роботы делали коктейли и взаимодействовали со зрителями. Пока что, скорее всего, ими управляли люди, но инновация заключается в гибкости и конструкции "скелета" (больше гибкости в движениях). Компания нацелена на выпуск миллиарда роботов — как в 20-м веке почти в каждом домашнем хозяйстве были телевизоры, так в 21-м веке в каждой семье будет свой робот. Он/она/оно будет наливать кофе, менять белье и гулять с собакой.
На этой же презентации показали Роботакси — футуристичный Cybertruck без руля и педалей, самоуправляемое такси с себестоимостью поездки $0.3 за милю (у "человеческого" такси себестоимость около доллара).В 2025 в запускается Техасе, и в 2027 "глобально" (то ли в других штатах, то ли в других странах тоже). И показали киберавтобус - также без водителя, стоимость 0.5$ за милю.
Все, как в картинках киберпанк-футуристических фильмов. В этих продуктах совпали все сильные стороны Маска: любовь не только к софту, но и к железу (в отличие от большинства айтишников), обожание научной фантастики и особенно занятия её воплощеним в жизнь.
Из того, что меня зацепило больше всего - это интеграция машинного и физического мира: Теслы уже и так сейчас собирают огромные массивы данных из поездок, дообучаясь на них. Роботы, роботакси и робоавтобусы будут собирать еще больше данных, и вот тут-то и придёт сингулярность.
Тем временем Нобелевскую премию по химии и по физике получили за ИИ-проекты (за deep learning нейронные сети). По физике награды удостоились Джон Дж. Хопфилд и Джеффри Э. Хинтон «за фундаментальные открытия и изобретения, которые сделали возможным машинное обучение с использованием искусственных нейронных сетей». По химии Нобелевку присудили Дэвиду Бейкеру, а также Демису Хассабису и Джону Джамперу из Google DeepMind за создание модели AlphaFold2, способной предсказывать сложные структуры белков.
И в понедельник 14.10 намечается релиз AI продукта, которым я горю последние несколько недель: отправится в бета тест проект W.Ai - следите за обновлениями в канале.
@wisemantalks
Запустил новую версию бота Wize Ai, и теперь бот как швейцарский нож, может примерно всё!
Судите сами, вот что он умеет:
- Общаться в свободном формате, просто пишите текст, ИИ вам ответит
- Делать анализ резюме под вакансию и наоборот, подсвечивая сильные и слабые стороны
- Анализировать запись собеседования, подсвечивая моменты, которые можно улучшить
- Получить текст из аудио и сделать краткое содержание
- Генерировать видео по изображению текста
- Создать краткое содержание текста или статьи по ссылке
- Суммировать видео с YouTube
- Генерировать изображения по вашему описанию
- Извлекать и очищать текст с веб-страницы
- Искать информацию по заданной теме
- Генерировать аудиоверсию текста
- Генерировать песню по запросу
- Обсуждать ваши вопросы на основе предыдущих взаимодействий
Если хотите бесплатный бета-тест бота, ставьте 🔥 и пишите в комментариях ➕
Дайджест wAI_52/24
Новости
Главная новость недели - OpenAI анонсировала новую модель ИИ - o3. Она получила рейтинг 2727 на Codeforces - наравне с топовыми разработчиками мира (вошла в топ-200, те уже среди лучших 200 программистов всего мира) - и решила большую часть задач из ARC AGI — теста, предназначенного для определения, обладает ли модель достаточным интеллектом, чтобы называться AGI. Хотя пока она тратит значительные средства на токены для выполнения задач, результаты впечатляют.
Изменение подхода к работе с ИИ по мнению Ильи Суцкевера. Илья считает, что подход к работе с искусственным интеллектом изменится, поскольку мы приближаемся к исчерпанию «невосполнимого» ресурса — огромного количества данных в интернете. Практически все существующие модели обучены на имеющихся данных, а новые данные поступают недостаточно быстро. Илья приводит аналогию с мамонтами: у них был мозг значительно больше человеческого, но только у человека относительно массы тела мозг выше, чем у всех животных. По его мнению, сейчас эра мамонтов, когда доминируют массы, но скоро наступит пора, когда в мире ИИ главным станет точность интеллекта.
Автономные автомобили Waymo превосходят человеческих водителей. Автономные машины Waymo продолжают превосходить людей в снижении ущерба имуществу и повреждений при столкновениях, как показало недавнее исследование, проведённое в сотрудничестве со страховой компанией Swiss Re. В этом исследовании были проанализированы страховые претензии с 25,3 миллионов миль, проеханных автономными автомобилями Waymo в Финиксе, Сан-Франциско, Лос-Анджелесе и Остине. Сравнение проводилось с инцидентами, связанными с водителями-автомобилями, на основе обширной базы данных Swiss Re, содержащей более 500 000 претензий с 200 миллиардов миль.
Саудовская Аравия использует роботов для строительства мегаполиса Neom. Используют технологии робототехники для улучшения процесса строительства свого амбициозного проекта мега-города в пустыне Neom - он является краеугольным камнем стратегии Саудовской Аравии по переходу экономики от зависимости от нефти к туризму, поскольку глобальная зависимость от ископаемых видов топлива уменьшается. Среди ключевых проектов Neom — мегаполис Line и небоскрёбы-двойники Epicon, каждый из которых требует огромного количества материалов и ресурсов для строительства.
Статьи
Платформа Genesis ускоряет обучение роботов. В статье рассказывается о платформе Genesis, новой системе компьютерной симуляции, которая позволяет роботам тренироваться в симулированной реальности в 430 000 раз быстрее, чем в реальном мире. Платформа Genesis, разработанная группой исследователей во главе с Чжоу Сянем из Университета Карнеги-Меллона, ускоряет расчёты физики до 80 раз быстрее, чем существующие симуляторы роботов. Это позволяет нейронной сети, управляющей роботами, за короткие часы фактически пройти десятилетия обучения, осваивая такие задачи, как подъем предметов, ходьба или манипулирование инструментами.
Инструменты
Sora - генерация видео из картинок и из текстового запроса (нужен американский VPN) - для владельцев базового аккаунта OpenAI ближайшие дни безлимитная возможность генерации видео
wAI.zone: поиск информации о человеке для знакомства. По ссылке на профиль в linkedin, facebook или twitter можно получить summary информации про человека, публикации этого человека, интересные человеку темы, которые можно поднять в диалоге, а также ИИ пишет адресное сообщение для коннекта в LinkedIn. Это мини версия-демонстрация сервиса Wai.Sale: в нем можно полностью автоматизировать весь процесс продаж (поиск лидов и написание им писем) - и таким образом в разы увеличить число продаж, писал об этом тут
@wisemantalks
Мысли модели
Современные модели ИИ последнего поколения, такие как o1 от OpenAI, используют chain of thought — цепочку рассуждений, аналогичную человеческому мышлению. Можно видеть, как иногда модель переключает язык во время размышлений, переходя с русского на английский и другие языки.
Авторы статьи "Training Large Language Models to Reason in a Continuous Latent Space" задумались: а что если модели отойти от человеческого языка и думать в собственном латентном пространстве — внутреннем представлении, не привязанном к естественным языкам? Такой подход показ эффективность в том числе при решении математических задач и логических рассуждений.
Почему это важно?
Человеческое мышление использует не только слова, но и образы, абстрактные понятия и другие формы представления информации. Мы до конца не знаем как именно работает мышление, и в том числе поэтому действуем из некоего немного искаженного пространства - учим модель мыслить, не до конца понимая, как мыслим мы сами. Обучая модель мыслить в латентном пространстве, позволяем ей использовать более гибкие и мощные способы обработки информации, что приводит к более точным и эффективным результатам.
Связь с языком ботов
Это напоминает случай с ботами, которые, общаясь между собой, начали оптимизировать свой язык, и в какой-то момент их общение стало непонятно людям, но понятным самим ботам. Хотя боты не создавали полноценный новый язык, а лишь оптимизировали общение для выполнения задач, этот пример показывает, как ИИ может находить собственные способы эффективной коммуникации.
Интересно, как происходит процесс взаимного обучения - обучая модели подходам к размышлениям, мы делаем и модели умнее, и мы, возможно, поймем больше о том, как сами мыслим?
Дайджест wAI_51/24
Новости
Вышла в релиз Sora — генерация видео от OpenAI (видео к посту сгенерированно в ней). А также OpenAI представила Advanced Video Mode — теперь модели можно подавать поток видео с компьютера, и она будет давать ответы, опираясь на него. И еще анонсировали доступность OpenAI Search, в том числе в бесплатном доступе — можно установить поиск по умолчанию. Подробнее
Компания Google представила свой новый квантовый чип Willow, который, по заявлению компании, значительно превосходит по скорости самый мощный в мире суперкомпьютер. Это достижение позволяет рассматривать возможность создания полезного квантового компьютера
Статьи
Текст про 15 причин, когда стоит использовать ИИ, и 5 причин, когда не стоит. Например, ИИ подходит для анализа больших текстов, но не стоит заменять полностью обучение (может быть полезен как ассистент, но знания и навыки он за нас полностью не впишет)
Инструменты
Транскрипты youtube видео с LLM. Транскрипт также можно бесплатно сделать в моем боте @wairocks_bot
@wisemantalks
Новая версия wai.zone: поиск информации о человеке для знакомства
Опубликовал новую версию Wai.Zone, в котором можно дать ссылку на LinkedIn человека, и получить:
⁃ summary информации про него
⁃ ссылки на соц сети (LinkedIn, Facebook, Twitter, etc)
⁃ публикации этого человека
⁃ темы, которые можно поднять в диалоге и которые будут интересны человеку
⁃ ИИ пишет адресное сообщение для коннекта в LinkedIn, в котором учтен контекст информации о человеке
В новой версии:
- делается summary статей человека
- добавил блок интересов человека
- улучшил работу ИИ
Сервис доступен по адресу https://www.wai.zone/
Сервис Wai.zone - небольшая демонстрация того, что мы можем делать для B2B продаж с помощью ИИ сервиса Wai.Sale: по сути полностью автоматизировать весь процесс продаж и в несколько раз увеличить число лидов для вашего бизнеса, писал об этом тут
Выпустили новую версию бота Wai Rocks
Что умеет бот:
- саммаризация аудио
- саммаризация веб страничек
- саммаризация роликов на youtube
- генерация аудио подкастов
- общения с ИИ в свободном формате
- генерация картинок
В новой версии:
- улучшены навыки обработки информации
- улучшены навыки саммаризации
- добавлена мультиязычность
Бот доступен по адресу @wairocks_bot
Новости технологий wAI_49/24
1) CEO Salesforce Marc Benioff считает, что ИИ агенты усиляют, а не заменяют людей - в частности в продажах
2) Компания Perplexity (ИИ поисковик), основанная Aravind Srinivas, подумывает о выходе на рынок аппаратного обеспечения. Srinivas объявил в twitter о намерении разработать устройство стоимостью менее 50 долларов, которое сможет "надежно отвечать" на вопросы с использованием голосового ввода
3) Австралийский банк за счет применения ИИ снизил уровень мошенничества на 30%, а также сократил время ожидания на линиях колл-центров на 40%
@wisemantalks
Поиск информации про человека для знакомства
Часто бывает, что не понятно с чего начать диалог: когда вы рассказываете про свой продукт новому для вас человеку, и просто когда знакомитесь для расширения круга знакомств. Если искать информацию на LinkedIn или в интернете, это не быстро, и часто до этого не доходят руки.
Мы запустили сервис Wai.Zone, которому можно дать ссылку на LinkedIn человека, и получить:
⁃ summary информации про него
⁃ ссылки на соц сети (LinkedIn, Facebook, Twitter, etc)
⁃ публикации этого человека
⁃ темы, которые можно поднять в диалоге и которые будут интересны человеку
⁃ ИИ пишет адресное сообщение для коннекта в LinkedIn, в котором учтен контекст информации о человеке
Также есть возможност кастомизации сообщений на основе ваших интересов и того, что вы хотели бы обсудить с чловеком.
P.S. Основной же проект - это B2B Wai.Sale, ИИ для Sales команд. Работает b2b версия так:
Поиск лидов по запросу под ICP (либо берем из вашей базы) ->
Дообогащает данные по лидам через API ->
С помощью ИИ проводит скоринг лидов ->
Пишет гиперперсонализованные сообщения лидам ->
Проводит outreach через разные каналы ->
Ответивших лиды заносит в ваше CRM (либо в google docs)
Пишите @wisemik чтобы интегировать в вашу sale команду
Фей-Фей Ли не придумала, как использовать нейросети для изображений, не изобрела видеокарты. Но она сделала набор данных, без которых взлет ИИ был бы невозможен, и несмотря на безразличие и критику годами шла вперед. Джеффри Хинтон десятилетиями занимался нейросетями, встречая в академических кругах недоумение, пока только многие годы спустя они показали результат. Nvidia Дженсена Хуанга в 2012м году оцениваласть меньше чем в 10 миллиардов $, инвесторы компании переживали, акции в 2008 упали на 70%. Сейчас компания самая дороая в мире и стоит больше 3 триллионов долларов из-за бешенного спроса на видеокарты для обучения ИИ (чтобы оценить масштаб - сейчас крупные компании даже арендуют атомные реакторы, чтобы запитать энергией эти десятки тысяч видеокарт). И если бы хотя бы один из этих трех потерял веру и опустил руки - неизвестно, где был бы ИИ сейчас.
Чему нас учит опыт этой троицы? Что истина старая как мир, но все-равно до сих пор работающая - если все люди идут в одном направлении, скорее всего это направление в чем-то неверное. Конвенционализм позволяет развивать уже придуманное, но рано или поздно встречает потолок. Уж не повторение ли ситуации мы видим сейчас, когда все больше ставка делается на LLM, хотя уже тот же Илья Суцкевер и многите другие исследователи говорят, что достигнут потолок в скорости обучения старыми методами и эта скорость снижается?
Возможно, настало время появиться новой троице (или двоице, или четверице - как пойдет)) - которая предложит свой подход, отличный от того, что принят в мейнстриме?
Второй персонаж - Дженсен Хуанг, в народе прозванный “куртка” за свою бессменную кожанку
Центральный игрок всех компьютеров - это так назваемый CPU, Central Processing Unit. Для приложений типа Microsoft Office или для ОС Windows отлично подходит его архитектура последоватлеьных вычислений. Но не для игр.
Дженсен и его компания Nvidia первыми придумали так называемые GPU - Graphic Processing Unit. В них множество мальниких по сути своей cpu делают кучу параллельных вычислений - что оказалось в разы эффективнее для задачи построения изображений в трехмерном пространстве, особенно когда это надо делать в реальном времени.
Дженсен Хуанг и его команда задумались тогда, а где еще кроме гейминга можно применить GPU? И в 2006 году опубликовали технологию CUDA. Она позволяла исследователям запускать вычисления параллено на множестве графических ядер. Тогда у Дженсена не было в голове идеи, что это будет технология именно для нейростей - он хотел дать исследователям инструмент, который позволит делать эффективные вычисления. Но анонс CUDA ждала холодная встреча. В 2008 что называется рынок порешал в числах - на Wall Street акции компании упали аж на 70%.
Но тут платфоромой Cuda заинтересовался Джеффри Хинтон, и он со всоей командой студентов - Алексом Крижевским и Ильей Суцкевером купилили две GTX 580, на которых запустили обучение нейрости AlexNet.
Photo: Michael M. Santiago—Getty Images
Как сошлось три гения и получился ИИ, каким мы его сейчас видим, или о важности веры в свои идеи
По мотивам поста Тимоти Ли на Understanding Ai.
Уже многие знают историю Airbnb и их веры в проект, когда в течение больше чем года основатели вкладывали все свои силы в проект, встречая полное непринятие его инвсеторами - после 140 с чем-то питчей они получили сплошь отказы, в лучшем случае вежливые, в худшем разгромные. Но ребята не сдавались и сейчас мы знаем, к чему привела их вера, компания оценивается больше чем в 100 миллиардов долларов и прололжает расти, поменяв полностью как мы путешествуем и подвинув таких гиагантов как booking.
Но не менее интересна сага об искуственном интеллекте и людях, без которых был бы невозмоден бум на ИИ, который мы сейчас наблюдаем. Не было бы ни OpenAI, ни полного переворта всех без исключения индустрий - без вклада трех человек, которые как и в свое время основатели Airbnb - не получали одобрения от сообщества или вовсе получали критику в течение несколких лет или даже десятков лет, прежде чем сошлись все три вектора вместе и привели к невиданному успеху.
Расскажу о них далее отдельными постами.
Новости технологий wAI_45/24
1) Вышел Claude Computer Use — возможность ИИ управлять компьютером как человек. Модель может двигать курсором, скроллить, вбивать текст в поля для ввода. Пока что всё работает довольно сыро, но перспектива большая как для бизнеса (например, реализовать ручное тестирование ПО через Computer Use), так и для пользователей.
2) Google анонсировал Jarvis — ИИ-агент для Google Chrome (computer-using agent). Релиз предварительно запланирован на август. Он сможет взаимодействовать с интерфейсом Google Chrome и, например, заказать вам билет на самолёт.
3) OpenAI купила домены Chat.com и ai.com. Первый за стоимость около 15 миллионов долларов в акциях компании.
4) Google отчиталась, что не меньше 25% кода в корпорации пишет ИИ. Для компании масштаба Google это огромный показатель, и он только растёт.
5) МГУ в коллабе с Neiry представили крысу с ИИ. Крыса по имени Пифия правильно отвечает на вопросы про квазары, миелиновые оболочки, язык Python и день рождения Альберта Эйнштейна за счет интгрированного в мозг ИИ импланта.
@wisemantalks
Новости технологий wAI_44/24
Октябрь богат на эссе о роли и рисках ИИ. Свое выпустил Dario Amodei - CEO Anthropic, объясняя, почему его иногда воспринимают как ИИ-пессимиста. Дарио считает, что важно как развивать ИИ, так и обеспечивать безопасность - и что важно, чтобы был голос из индустрии, говорящий о потенциальных опасностях.
Похожую мысль транслирует Юваль Ной Харари в своем новом эссе. Юваль предлагает идею, что ИИ надо воспринимать как инопланетный разум, со всеми потенциально огромными плюсами для человечества и такими же огромными рисками.
В следующих постах подробнее разберу эти эссе.
Rex Woodbury написал статью “Вторая 100-миллиарднодолларовая AI компания”, предрекая, что это будет B2C, а не B2B компания. Он считает, что сейчас большинство сфокусировано на B2B в AI, а ниша B2C ярких стартапов пока относительно свободна.
На днях выйдет новая версия Wai Rocks - большой апдейт b2c мультфункционального бота, следите за обновлениями.
С этой статьей интересным образом перекликаются заметки Sarah Tavel – она видит огромный риск для стартапов в сфере ИИ: все более мощные игроки типа OpenAI, Google DeepMind и Anthropic со временем, скорее всего, захотят выйти и на рынок приложений ИИ. Как с этим предлагает бороться Sarah? Как минимум проводить мысленный эксперимент: основателю стартапа задавать себе вопрос, а что будет с моим стартапом, когда условный OpenAI достигнет уровня GPT-5-6-7, превышающий человеческий IQ в большинстве сфер?
А про B2B AI стартапы: вышел обзор Wharton об использовании GenAI в корпорациях – рост числа компаний, применяющих GenAI в своей работе, невероятный, от 37% в 2023-м до 72% в 2024-м.
Если вы еще не применяете или хотите применять больше, пишите нам – у нас в Wai Group есть 4 ИИ B2B AI продукта: AI для Sales, для Employee/Customer Support, AI для HR и для маркетинга.
Вышел новый робот-доставщик от компании Serve Robotics. Это компания, которая ранее запартнерилась с Wing для осуществления доставок роботами, а затем дронами. В робота встроен модуль NVIDIA's Jetson Orin, который в несколько раз оптимизирует скорость принятия решений роботом. Ждем сообщений от доставок роботами – “Ваша пицца выехала / вылетела / выпорхнула / а вот уже и у вас, приземлилась в столовой”.
Boston Dynamics вместе с Toyota Research Institute анонсировали, что внедряют AI: LBM (по аналогии с LLM - Большие Языковые Модели, LBM – Большие Поведенческие Модели) в своих роботов Atlas. Таким образом, роботы эффективно обучаются практически без взаимодействия с объектами реального мира, чтобы потом сразу начать выполнять задачи – например, жарить вам блины или отжиматься от пола (см. видео к посту, image's credit: Boston Dynamics).
До этого была презентация роботов Optimus от Tesla (которые пока что управлялись человеками, задача была показать гибкость роботов) - роботы наливали коктейли в баре и танцевали. А также показали быстробегающего в кроссовках китайского робота Start1. Бегает уже почти как человек – 12.8 км/ч, видимо, все благодаря кроссовкам или благодаря 275 триллионам операций в секунду.
Запустился стартап Arcade AI, в котором можно не только сгенерировать себе желаемое украшение (например, ожерелье), но и изготовить его и получить в физическом мире. Ожидаем новых старапов печати модной и гиперперсонализованной одежды и предметов мебели.
Запускаю бета-тест нового продукта: W . ai, или просто Wai (вай эай!).
Wai — это будущее финансов, AI и обмена информацией между людьми и машинами.
Wai — это мессенджер с нативно встроенными AI и финансовыми функциями.
В Wai можно общаться с друзьями и Искусственным Интеллектом в едином интерфейсе. Благодаря блокчейну вы сможете быстро и удобно переводить деньги друзьям и оплачивать запросы к сотням AI прямо в приложении.
Wai умеет создавать summary, генерировать изображения и видео, делать выжимки из роликов на YouTube, вести интеллектуальные беседы и многое другое.
Сейчас для бета-теста доступна веб-версия. В будущем мы планируем добавить сотни новых AI-агентов, платформу для интеграции сторонних ботов (в формате appstore для ботов), вывод средств на внешние кошельки и модули для бизнеса.
Wai, Wai, Wai!
Для участия в бесплатном бета-тесте ставьте ❤️🔥 и пишите ➕ в комментариях.
Wisemik News #40/2024
Много всего про OpenAI и на последок про летающую роботележку.
1) OpenAI: прошла презентация новинок. Из самого интересного: теперь доступна модель speech-to-speech для создания голосовых агентов, позволяющая интегрировать диалоги с ИИ в приложения и сервисы.
2) OpenAI: становится Closed. Компания переходит от некоммерческой структуры к for-profit организации. Контекст такой: изначально Альтман и Илон Маск задумывали OpenAI как альтернативу DeepMind, которую купила Google, с целью создания открытого искусственного интеллекта. Но позже планы поменялись, и теперь меняется и структура.
3) OpenAI: рекордный раунд инвестиций. Компания привлекла $6,6 миллиарда, что повысило её оценку до $157 миллиардов. Это рекордный раунд инвестиций в области ИИ. OpenAI сообщает о 250 миллионах пользователей по всему миру.
4) Летающая тележка для супермаркета. В Сеульском Национальном Университете представили паряющую в воздухе роботележку, которая считывает информацию об окружающей среде и упрощает ее перемещение в пространстве.
Wise News 39/24
1) Вышла новая World Model от 1X - компании производства домашних роботов. World Model - это такая цифровая модель мира для более быстрого обучения роботов. Примечательно, что они пишут как одну из причин публичной публикации большого числа моделей - желание поскорее перейти к экспонинциальному росту прогресса в роботехнике. Приближаем реальность, где роботы приносят в кровать наш утренний какао.
2) Youtube анонсировала ИИ в своих продуктах - чтобы было веселее пилить shorts на youtube. Не отстает Snap - выпустили свою ИИ, преобразующую текст -> видео. А чтобы уже точно ИИ снимал кино не хуже человека, Джеймс Кэмерон вошел в совет директоров Stablitlity AI
3) Подвтердились слухи, что Johny Ive вместе с Sam Altman работают над новым ИИ-девайсом. Джони Айв - соратник Стива Джобса, дизайнер стоявший у истоков iPhone, вместе с несколькими другими ex-Apple сотурдниками работают вместе с Сэмом над новым проектом - грядет AI-phone?
4) OpenAI напомню выпустила карманного доктора наук для каждого, OpenAI o1. И дала инструкции как лучше с этим карманным доктором наук вести диалог
5) Sam Altman написал манифест. Основная идея - что AI даёт доселе нереальные возможности, и то что грядет эра всеобщего процветания
6) А настоящее поле битвы разворачивается вокруг энергетики. Чтобы запитать растущие аппетиты AI нужны все более мощные электростанции. Например, Microsoft уже скупает закрытые атомные электростанции