wisemantalks | Unsorted

Telegram-канал wisemantalks - Wiseman Talks

1510

Wai.Sale: AI решения для sales команд, повышающие прибыль бизнеса Обсудить → @mikwiseman

Subscribe to a channel

Wiseman Talks

ИИ новости недели №36/24

1) Стивен Вольфрам считает, что философия играет ключевую роль в понимании вызовов, которые ставит искусственный интеллект. В статье он подчеркивает важность осмысления философских вопросов, связанных с этикой и управлением ИИ, отмечая, что решения о "правильных" действиях ИИ по своей природе являются философскими. Вольфрам видит необходимость привлечения философов к обсуждению будущего ИИ и полагает, что с развитием технологий мы вступаем в новую "золотую эру" философии, где на первый план выходят фундаментальные вопросы о природе и управлении ИИ.

2) Amazon представил Amazon Q, GenAI-ассистента для разработки программного обеспечения, чтобы упростить процесс обновления базового ПО, например, переход на новые версии Java. Благодаря новой функции трансформации кода, время обновления приложений до Java 17 сократилось с 50 дней разработчиков до нескольких часов. Это позволило компании сэкономить около 4500 человеко-лет работы.

3) В статье Билл Гейтс рассказывает о применении компьютерного зрения для борьбы с малярией. Новое приложение VectorCam, разработанное учеными из Университета Джонса Хопкинса, позволяет быстро и точно идентифицировать виды комаров, которые переносят малярию, с помощью смартфона и специального объектива. Это значительно упрощает работу местных специалистов, ускоряя сбор данных и позволяя оперативно реагировать на изменения. Такими темпами можно победить малерию на Земле, считает Гейтс.

4) Исследователи Техасского университета разработали искусственный интеллект (ИИ), который смог предсказать 70% землетрясений в ходе семимесячного испытания в Китае. Алгоритм обучался на сейсмических данных и смог точно предсказать местоположение и силу 14 землетрясений в радиусе 200 миль от их фактического эпицентра. Этот результат считается прорывом в области прогнозирования землетрясений с использованием ИИ и может значительно улучшить готовность к стихийным бедствиям в будущем.

P.S. На видео коты-философы обсуждают ИИ-будущее

Читать полностью…

Wiseman Talks

Новостная ИИ-среда

Midjourney теперь доступен в веб-версии, но появилась конкуренция в лице Ideogram 2.0. Midjourney, популярный сервис для генерации изображений, теперь доступен в веб-версии для всех пользователей. Одновременно с этим вышла новая версия конкурирующего продукта — Ideogram 2.0. Подробный обзор того, как использовать эти сервисы, можно найти в моем видео на YouTube.

Waymo представила новую генерацию роботакси. Waymo, дочерняя компания Alphabet, анонсировала шестую генерацию своей технологии беспилотных автомобилей, интегрированную в электромобили Geely Zeekr. Новая система способна функционировать в более широком диапазоне погодных условий при снижении числа используемых камер и датчиков, что уменьшает стоимость производства. Waymo продолжает масштабировать свои услуги по всей территории США, где уже выполняется около 50 000 платных поездок в неделю, главным образом в Сан-Франциско.

Google DeepMind публикует обзор исследований по безопасности ИИ. Команда AGI Safety & Alignment из Google DeepMind опубликовала обзор своих последних исследований в области безопасности и выравнивания искусственного интеллекта. Основные направления включают усиленный надзор, интерпретируемость и анализ угроз, связанных с передовыми моделями, которые применяются в последних моделях от Google.

Законопроект регулирования ИИ SB 1047 AI Safety Bill порождает бурные обсуждения. В Калифорнии продолжается обсуждение законопроекта SB 1047, который направлен на регулирование разработки ИИ. Законопроект предполагает обязательные протоколы безопасности для ИИ-моделей, проведение независимых аудитов и строгие меры по соблюдению, включая значительные штрафы за нарушение. Законопроект скоро будет вынесен на финальное голосование в Сенате. У законопроекта есть как противники, например, OpenAI, которые считают, что это ограничит развитие, так и сторонники, включая Илона Маска, поддерживающего инициативу.

P.S. На фото Московское роботакси made by Midjourney + Runway Gen3-Alpha

Читать полностью…

Wiseman Talks

Вышел новый отчет компании a16z (Andreessen & Horowitz) про Топ-100 ИИ потребительских проектов. a16z выпускает такой отчет раз в пол года, последний раз отчет был в марте 2024.

Основные выводы из отчета:

1) Стремительно появляются все новые ИИ сервисы. Больше 30% процентов копаний в отчете появились впервые.

2) Творческие инструменты лидируют. Более половины популярных веб-приложений связаны с созданием или редактированием контента, особенно в сферах видео и музыки. Из 12 новых в отчете компаний, 58% связаны с творчеством.

2) Конкуренция среди больших моделей растет. Хотя ChatGPT по-прежнему занимает лидирующие позиции, его конкуренты, такие как Perplexity и Claude, набирают популярность.

3) Мобильные приложения используют для редактирования контента. Пользователи предпочитают редактировать фотографии и видео с помощью ИИ на мобильных устройствах.

4) Новые категории. Появились приложения, ориентированные на эстетику и знакомства, такие как LooksMax и RIZZ, которые помогают пользователям прокачивать внешний вид и взаимодействие на платформах знакомств.

5) Discord как предиктор успеха. Популярность приложений на платформе Discord может предсказать их будущее признание на вебе и в мобильных приложениях.

Из того отдельно отметил как интересное: проект Luzia, который начинал как надстрйока над ChatGPT для Whatsapp и Telegram - бот с таргетом на Испанскую и Португальскую аудиторию, вышел как приложение и занял 25 место.

Итого из отчета следует несколько успешных сейчас стратегий: если у вас есть дюжина миллиардов, сделать конкурента ChatGPT, либо выпустить утилиту, помогающую с креативностью, либо что-то вокруг дейтинга, или выбрать относительно узкую ЦА (например, испанский рынок).

Читать полностью…

Wiseman Talks

Вышла новая статья Lenny Rachitsky "Time management techniques that actually work" про эффективность. Lenny предлагает десять методов управления временем, которые автор использует ежедневно. Я тоже их применяю, и добавил от себя еще две техники.
1. Используйте календарь для задач. Вместо отдельного списка задач записывайте их как события в календаре. Это помогает структурировать ваш день и избежать забывания важных дел. Я обычно использую комбинацию приложений Things (личные задачи) + Notion (коммандные задачи).
2. Правило двух минут. Если задача занимает меньше двух минут, выполните её сразу, вместо того чтобы добавлять в список дел.
3. Ведите список "ожидаемых задач". Записывайте, что и от кого вы ждете, чтобы не забыть об этом и своевременно напомнить другим.
4. Записывайте 1-3 ключевые задачи на день. Начинайте день с определения главных задач, которые нужно выполнить, и фокусируйтесь на них. Ключевой вопрос: какая есть задача на сегодня, что если я ее сделаю и не сделаю остальные, то день прошел успешно?
5. Выделяйте время на глубокую работу. Регулярно блокируйте время для сосредоточенной работы без отвлечений.
6. Минимизируйте встречи утром: Старайтесь планировать встречи на вторую половину дня, чтобы утро посвятить продуктивной работе.
7. Режим "Не беспокоить". Включайте его на всех устройствах для максимальной концентрации.
8. Переводите встречи в асинхронное общение. Вместо встреч постарайтесь решить вопросы по электронной почте.
9. Используйте виртуального помощника. Делегируйте рутинные задачи, чтобы освободить время для важной работы. Можно комбинировать асситсента-сотрудника и AI-ассистента. В частности можете использовать написанного мной ИИ-агента для расшифровки аудиозаписей в текст Sobir.Ai, а также агента для личной базы знаний Wise.Ai.
10. Чаще говорите "нет". Оценивайте, насколько предлагаемая задача важна, и не беритесь за то, что не способствует вашим ключевым целям.
Эти советы помогут вам управлять своим временем более эффективно и справляться с задачами без стресса и перегрузки.
11. Ведите учет времени. Записывайте, на что вы расходуете время, и потом в конце недели рефлексируйте, что хотите поменять в следющей.
12. Занимайтесь спортом и следите за сном. Это то, что отличает нас от AI: наличие тела. Без спорта эффективность падает, и про достаточне количества сна важно не забывать.

Читать полностью…

Wiseman Talks

Будут ли нужны продакт менеджеры и творческие професии в эру ИИ?

В своей статье “How AI will impact product management” Ленни Рачицкий приводит результаты опроса о том, какой навык искусственный интеллект заменит у продакт-менеджеров в первую очередь. Большинство считает, что это будут коммуникативные навыки. Однако Ленни и я уверены в обратном: ИИ больше всего повлияет на стратегические (и исторически наиболее ценные) навыки управления продуктом, такие как разработка стратегии, формирование видения, выявление новых возможностей и постановка целей.

Ленни пишет статью в разрезе работы продакт-менеджеров, но считаю, что также верно для любых творческих профессий в эру ИИ.

Какие навыки Ленни считает важными для развития в первую очередь

1) Коммуникация и влияние: В условиях, когда AI берет на себя аналитическую работу, продакт-менеджеры будут сосредоточены на взаимодействии с заинтересованными сторонами и командой. Становится важным умение убеждать и проявлять эмпатию.

2) Креативность и продуктовая интуиция: AI может предложить множество вариантов решений, но выбрать лучший из них и адаптировать его к контексту организации — это задачи, которые требуют от продакт-менеджера креативности и интуиции.

3) Управление командой и мотивация: Человеческий фактор остается решающим в продуктивной работе команды. PM должен быть тем самым “клеем”, который соединяет всех участников процесса, создавая условия для успешного взаимодействия между людьми и технологиями.

4) Адаптивность и обучение: Поскольку AI продолжает развиваться, PM придется постоянно адаптироваться к новым инструментам и методологиям. Быстрая обучаемость и способность интегрировать новые технологии в рабочий процесс станут неотъемлемой частью профессии.

Ленни также приводит яркий пример: люди не перестали играть в Go после того, как компьютер победил в этой игре человека. Напротив, они начали искать новые стратегии и вышли на другой уровень игры. То же самое произойдет и с проектами: продакт-менеджеры будут еще более востребованы, чем раньше, и смогут запускать продукты на ином уровне благодаря ИИ.

Читать полностью…

Wiseman Talks

Самое интересное из статьи Lenny Newsletter "How should you monetize your AI features?"

Фокус компаний смещается с внедрения AI повсюду на стратегическую монетизацию. Рынок AI продуктов все еще неразмеченная территория, поэтому выигрывают те, кто сможет эффективно тестировать новые стратегии монетизации.

Существует две основные стратегии монетизации AI:

1. Прямая монетизация:
- Отдельный AI продукт:
Создание отдельного ai продукта (пример - chatgpt, github copilot)
- Дополнение за отдельную плату: Добавление AI-функций за отдельную плату (notion ai, loom ai)
- Повышение цены: Повышение цены на продукт с включением новых AI-функций (Figma).

2. Косвенная монетизация:
- Интеграция в существующие пакеты: Включение AI-функций в существующие пакеты без изменения цены (Shopify).

Прямая монетизация в большинстве случаев более выигрышная, так как позволяет собирать статистику о том, насколько AI-функционал нужен пользователю. Пользователь голосует за него монетой.

Статистика использования стратегий такая:

- 59% компаний включают AI-функции в существующие пакеты.
- 23% компаний предлагают AI-функции как дополнение за отдельную плату.
- 18% компаний создают автономные AI-продукты.

Ценообразование для AI-продуктов следует основным принципам, аналогичным не-AI продуктам, опираясь на три ключевых фактора:

1. Понимание потребностей клиентов:
- Какую пользу приносит AI-функция клиентам.
- Важность AI-функции для клиентов.
- Ожидаемый ROI (возврат инвестиций) от использования AI.

2. Цены конкурентов:
- Анализ цен на аналогичные AI-функции у ближайших конкурентов.

3. Затраты:
- Учет затрат на разработку, поддержку и использование AI-функций, включая вычислительные мощности, хранение данных и безопасность.

Нестандартную монетизацию из крупных игроков пока внедрил только Intercom - клиент платит только за разрешенные задачи.

В заключение хочу добавить, что большинство игроков сейчас выбирают путь монетизации через подписку, что действительно самое понятное для пользователей-людей, но не для агентов ИИ: и вот в этом плане интересно, как развернется монетизация продуктов ИИ для агентов (на картинке фантазия Midjourney про такой рыночек для AI-агентов в киберпанк среде)

Читать полностью…

Wiseman Talks

Новости недели

Неделя выдалась жаркая на число анонсов новых моделей ИИ. Даю выжимку самого главного.

1) OpenAI представила GPT-4o mini — наиболее экономичную модель. GPT-4o mini обеспечивает 82% точности, стоимость использования: 15 центов за миллион входных токенов и 60 центов за миллион выходных токенов (примерно в 30 раз дешевле GPT-4o mini). Модель поддерживает текстовые и визуальные задачи с окном контекста 128K токенов и до 16K выходных токенов за запрос, уже можно применять в своих проектах. Правило тут такое - попробовать более дешевую модель, и если не хвататет интеллекта - уже переходить к более дорогим.

2) Meta анонсировала Llama 3.1, самую продвинутую модель ИИ с открытым исходным кодом. Новая модель поддерживает контекст длиной до 128 тысяч символов и восемь языков (русского официально нет, но де факто он есть). Llama 3.1 405B - огромная модель на 405 миллиардов парметров, по качеству сравнима с GPT-4o, флагманской моделью OpenAI. Запустить на ноутбуке не получится, менее требовательны к железу модели на 8 и 70 миллиардов параметров. Это отличная новость, потому что дает большую степень вариативности, что можно делать с моделями - так как они с открытым исходным кодом.

3) OpenAI запустила SearchGPT, прототип новых функций поиска с использованием ИИ. OpenAI таки вышел в сфкеру поиска и наступает на пятики Google и Perplexity. Прототип сотрудничает с издателями и позволяет им управлять своим отображением и контентом. Пока будет дотсупен прототип, ли учшее из него войдет как функционал в ChatGPT.

4) Французский ИИ проект Mistral AI представила Mistral Large 2 — новую версию флагманской модели. Она улучшена в генерации кода, математике, рассуждениях и поддерживает множество языков (включая русский) и 80+ языков программирования. Mistral Large 2 имеет 123 млрд параметров и контекстное окно 128k, обеспечивает высокую производительность и точность (84.0% на MMLU). Пока что модель доступна по лицензии для некомерческого использования.

5) Китайский проект Kling по генерации видео по описанию и по входной картинке стал доступен по всему миру. Среднее время генерации видео составляет около 5 минут за клип в 5 секунд. Таким образом появилось уже несколько проектов, конкурирующий с все еще не доступной публично OpenAI Sora: Luma Labs, Runway Gen-3 Alpha, и теперь Kling.

На видео Groq (проект по быстрой работы с моделями ИИ, так называемый inference на максималках) сверх быстро генерирует ответ на вопрос, что такое Fine Tuning, при этом используется модель Llama из новости #2.

Читать полностью…

Wiseman Talks

Pivots у стартапов

🔍 Ленни сделал разбор ярких pivot-ов (резких изменений идей) стартапов.

Статистика:
- 33% b2b и 20% b2c стартапов сделали pivot до нахождения большой идеи.
- Компании успешно делают pivot с b2c на b2b, но никогда наоборот.
- 25% сделали pivot меньше чем за 3 месяца после старта, в среднем - через год. Notion - через 4 года, а Lyft - через 5 лет.
- Многие из pivot-ов не имеют ничего общего с первоначальной идеей.
- Большая часть изменений идей произошла из-за фокуса основателей на конкретной идее или на технологии.
- Удивительно много (1/4) pivot-ов выросли из внутренних наработок команд, воспринимавшихся сначала как дополнение к основному бизнесу.

Например:
💬 Мессенджер Discord начинали с игры “Fates Forever”. Разработчик предложил развить технологию, которой заинтересовался во время разработки игры (pivot через год).
🤖 Hugging Face начинали с AI Тамагочи, пока не стали GitHub для моделей машинного обучения (pivot через 2,5 года).
📸 Instagram начинал как приложение для location check-ins. Обратили внимание, что пользователи любят одну конкретную фичу - делиться фото (pivot через год).
🐦 Twitter начинал как стартап для создания и шеринга пользователями подкастов, а через год после запуска Джек Дорси (экс-CEO экс-Twitter-а) собрал на хакатоне Twitter, каким мы его знаем сегодня.

Больше примеров тут.

Читать полностью…

Wiseman Talks

Kyle Poyar (Operating Partner at OpenView) опубликовал в блоге Ленни статью про контринтуитивные советы при построении AI-продуктов.

Он провел интервью с 20 успешными предпринимателями и продукт-менеджерами, которые занимаются AI-продуктами (Perplexity, Adobe, Intercom, Superhuman).

Публикую те советы, которые больше всего зацепили.

1) Начните думать иначе. Вместо того чтобы бояться, что GPT-5 убьет ваш продукт, думайте о том, как использовать прогресс в своих продуктах.
2) Собирайте данные. Ключевые зоны, в которых можно конкурировать: структурированные данные и интерфейсы, идеально вписывающиеся в уже имеющиеся рабочие процессы.
3) Давайте пользователям выбирать. Результат работы LLM не всегда совершенен, и хорошо давать пользователю возможность кастомизировать выдачу (а параллельно обучать промпты и пробовать новые модели, см. пункт 1).
4) Иногда скорость ответа решает. Выбирая между двумя продуктами, один из которых сразу даст пользователю желаемый контент, сгенерированный AI (например, заранее сгенерированный), и тем, что будет думать, скорость бывает решающей.

Итого:
- Думайте, как использовать рост generalized моделей: например, глубоко осмысляя технологию и далее интегрируя её в конкретные рабочие процессы компаний.
- Собирайте и структурируйте данные (даже если еще не интегрировали ИИ, потом пригодятся для обучения).
- Делайте гибкие интерфейсы, давая возможность выбирать.
- И быстрые.

Понравилась цитата: We’re excited about riding the capability curve of improving models, instead of fighting that progress.

Читать полностью…

Wiseman Talks

ИИ идет в кино (сага о Text-2-Video & Image-2-Video)

Этим летом ИИ решил стать новым Тарковским.

Не успел отгреметь шум от еще не вышедшей в публичный доступ Sora от OpenAI, как таки вышли text-to-video и image-to-video ИИ от Luma Labs, а еще анонсировали Runway Gen3 Alpha (обещают улучшеный контроль над генерацией с помощью дополнительный тулов - а пока можно потыкать Gen2, но по мне так с Luma Labs веселее).

У Luma Labs: 5 бесплатных генераций в день, по 5 секунд каждая. Жмешь "extend" - ролик продлевается еще на 5 секунд. Если повозиться с картинкой на входе и prompt, то получается уже почти как у Кубрика (ну почти).

Рекомендую пробовать комбинацию Midjourney -> Luma Labs. Ощутил себя Мышью в киберпанк будущем (prompt для Midjouney: "A mouse looking at the futuristic cyberpunk city at night, withn eon-lit streets, towering skyscrapers, glowing billboards, and flying cars overhead, view from ground level, very high detail", prompt для Luma: "a camera orbit around the mouse").

Но лично мне больше понравилось "оживить" реальную фотокарточку (не ИИ шную) Ив Сен Лорана и Сибил Бак в парижской квартире - 1995 год, сделанную Жан-Мари Перье.

Prompt для Luma #1: "Dancing Yves Saint Loran", Prompt для Luma #2 (extend): "Dancing with Lion".

А еще, вышла первая реклама игрушек с Sora для Toys R: ладно, еще не Тарковский, но все-равно сингулярность близко.

Читать полностью…

Wiseman Talks

ИИ в ритейле

В 2018 году я запустил свой первый проект с ИИ (еще до того как AI стал слышен из каждого ИИ-утюга). Мы взяли за основу гипотезу, что программисты не любят ходить по магазинам за одеждой, и обучили ML-модель для решения задачи подбора вещей. Проект (мы его назвали Loooook) подбирал за разработчиков одежду и дальше курьер привозил ее для примерки.

Тогда, в 2018м, мы вдохновлялись американским проектом Stitch Fix - многомиллиардная компания, с момента основания заложившая ИИ в основу. Я решил собрать подборку того, как можно исполтзовать ИИ в ритейле в 2024м (с тех пор прошло кажется несколько вечностей в плане развития технологий). В нее, конечно же, вошла и Stitch Fix.

1) Персонализация пользовательского опыта. Использование ИИ для создания персонализированных рекомендаций товаров значительно увеличивает продажи. Пример Amazon: благодаря ИИ увеличил свой доход на 35%. Stitch Fix: 43 миллиона комбинаций товаров, показыаемых клиентам ежедневно, у которых описание сгенерировано с помощью GenAI (с учетом профиля пользователя).

2) Генерация картинок для товаров. Coca-Cola использовала генеративный ИИ для создания праздничных открыток и других визуальных материалов, что позволило создать более 120,000 изображений за 11 дней и значительно повысить вовлеченность пользователей.

3) Виртуальные ассистенты. Sephora внедрила чат-бота на основе ИИ, который предоставляет персонализированные советы по уходу за кожей и косметике. Это увеличило конверсию на сайте на 11% и средний чек на 15%.

Каждый из кейсов можно интегрировать, конечно, не только в ритейл: пишите @wisemik, поговорим про ИИ для вашего проекта

Читать полностью…

Wiseman Talks

Запустил бота, который генерирует стихи в стиле Есенина, Бродского и Маяковского.

Опробовал для него разные подходы машинного обучения: In Context Learning (показывал в прошлых постах как в этом подходе получается генерить поэзию в стиле Бродского), RAG и Fine Tuning моделей на корпусах стихов поэтов. Пока в боте используется OpenAI API, скоро добавлю дообученные модели.

Тестируйте, делитесь сгенерированными стихами в комментариях!

Читать полностью…

Wiseman Talks

Бот для расшифровки и автоматического создания конспектов встреч по аудиозаписям — Voice Summary AI Sobir .ai — зарелизен! В текущей версии бота вы можете:

- Расшифровывать аудиозаметки, голосовые записи, записи встреч в Zoom и диктофонные записи.

- Создавать краткие конспекты, адаптированные под размер и тип заметки. Бот автоматически подстраивается, чтобы предложить наилучший формат конспекта, будь то длинная встреча или личные заметки.

- Есть поддержка больших аудиофайлов встреч.

Чтобы получить доступ к боту, пишите в комментариях — поделюсь доступом

Читать полностью…

Wiseman Talks

НейроБродский/84

Сегодня ДР Иосифа Бродского, 84 года! В честь ДР поиграем в поэтический тест Тьюринга. Некоторые иp этих стихов авторства Иосифа Бродского, некоторые - ИИ (с техникой in context learning 0-shot, 1-shot, и many-shot).

Голосуйте в комментах, где Бродский, а где Нейробродский, в формате: номер стиха, и Н - нейробродский, Б - Бродский.

Читать полностью…

Wiseman Talks

Личный ИИ ассистент знаний

Запустил бета версию нового проекта Wise.Ai — персонального агента знаний. Ему можно отправить текст, ссылку на сайт либо ссылку на youtube, и он сделает из них summary в виде текста и в виде аудио, а также сохранит в вашу личную базу знаний. Также Wise.Ai позволяет с помощью ИИ находить информацию в личной базе знаний и отвечать на уточняющие вопросы на ее основе.

В следующих версиях планирую добавить:
- возможность сгенерировать подкаст из нескольких тектстов
- дать выбирать голос для сгенерированного подкаста
- продвинутуые фильтры и поиск
- web версию, чтобы просматривать свою базу знаний.

Мы уже делаем системы с ИИ для Employee Support и Customer Support для корпораций - если интересно обсудить сотрудничество, пишите.

Чтобы получить доступ к боту, пишите «➕» в комментариях — поделюсь доступом, и жду вашу обратную СВЯЗЬ.

@wisemantalks

Читать полностью…

Wiseman Talks

Многое отзывается в статье-выжимке из интервью со-основателя и ex-CEO Google Эрика Шмидта ("Eric Schmidt’s AI prophecy: The next two years will shock you").

Оснонвая идея: мы входим в эру беспрецендентых возможностей, когда человек сможет один запускать за считаные часы-дни продукты, на которые раньше требовались годы и команда.

Беспрецедентная неопределенность. Эрик Шмидт меняет свое мнение о развитии ИИ каждые шесть месяцев, что подчеркивает быстрое развитие этой области. Шмидт изначально считал, что малые модели ИИ могут соперничать с крупными (и проинвестировал в несколько таких проектов), но за последние полгода изменил свое мнение, теперь поддерживая идею о важности крупных моделей.

Беспрецедентная скорость. Шмидт обсуждает комбинацию больших контекстных окон, ИИ-агентов, которые могут учиться и улучшаться сами, и возможности преобразования текста в действия. Он считает, что эти технологии могут иметь более значительное влияние на мир, чем социальные сети. Эти технологии позволят создавать сложные приложения и программы буквально за минуты, что ускорит в разы изменения в различных отраслях - и главное изменят саму парадигму, как строятся продукты.

Беспрецедентные потрясения. Шмидт приводит пример, что в весьма не отдаленно будущем можно будет попросить ИИ создать копию TikTok и далее за час попросить довести её до вирусного состояния. И если копия TikTok не зайдет, попросить ИИ создать и продвинуть следующую идею. Это иллюстрирует огромный потенциал ИИ для сверх быстрых изменений и создания новых продуктов.

Беспрецедентный масштаб. Шмидт отмечает, что для лидирующих компаний потребуется инвестировать от $10 до $300 миллиардов, что также подразумевает огромные энергетические затраты, которые могут изменить геополитические альянсы.

Летя вслепую. Шмидт признается, что даже для него, как ветерана индустрии, изменения происходят слишком быстро, чтобы за ними успеть.

Остается довериться потоку изменений и адаптировавшись к новой реальности запускать новые проекты пачками!

Читать полностью…

Wiseman Talks

Новостная ИИ-среда

1. У компьютера появится нос. Компания Osmo, занимающаяся искусственным интеллектом, работает над технологией, которая позволит компьютерам распознавать и воспроизводить запахи, аналогично тому, как современные ИИ генерируют изображения и звуки. Эта идея восходит к концепции «Smell-O-Vision» 1960-х годов, но с куда более широкими и важными применениями. Идея заключается в том, что без ИИ было бы крайне сложно синтезировать и распознавать запахи, потому что малейшее изменение в молекулярной структуре может кардинально изменить запах. Например, одно изменение в молекуле может превратить аромат розы в запах протухшего яйца. Osmo надеется, что технология поможет не только развитию сферы развлечений, но и найдет более серьезные применения, например, в медицине. К примеру, есть надежда, что система научится распознавать раковые клетки по запаху и таким образом будет обнаруживать заболевание на самой ранней стадии.
2. А ужин будет сервировать робот-гуманоид. Unitree Robotics выпустила новое видео, демонстрирующее обновленную версию своего человекоподобного робота G1 стоимостью $16,000. Этот робот, предназначенный для массового производства, впечатляет своими возможностями, включая прыжки, танцы, преодоление препятствий различной высоты и способность сохранять равновесие при столкновениях. В компании надеются, что благодаря низкой стоимости и широким функциональным возможностям G1 сможет привлечь внимание не только исследователей и разработчиков, но и коммерческих пользователей, включая тех, кто ищет роботизированного помощника для домашних нужд (например, чтобы сервировать ужин).
3. OpenAI забанила иранских ботов, генерирующих комментарии и политические новости. Правда, даже до бана посты, сгенерированные ботами, не имели популярности.
4. Запросы к ИИ от OpenAI и Anthropic стали дешевле. За счет кеширования запросов при правильной настройке можно экономить до 90%. Например, если вы в каждом запросе ранее передавали большой контекст, такой как книга или исходный код, теперь его можно закешировать.
5. Арена ИИ-моделей для русского языка. Можно проголосовать и посмотреть рейтинг лучших моделей. Топ в целом стандартный (модели от OpenAI и Google), но в числе лидеров есть и модели российского производства.
6. Вышла новая модель для быстрой генерации видео от Runway. Gen-3-alpha-turbo генерирует видео по тексту или изображению до 7 раз быстрее и делает это весьма качественно. Видео картинки к посту длиной в 10 секунда как раз сгенерированы им меньше чем за 30 секунд.

Читать полностью…

Wiseman Talks

AI новости недели №33/2024

1. Японская компания Sakana AI представила полностью автоматизированную систему научных открытий, названную The AI Scientist. Система способна выполнять весь цикл научного исследования — от генерации идей до написания научных статей — без участия человека. Теперь написание научных статей становится намного доступнее, что наверняка замотивирует людей создать публикацию с помощью ИИ, на которую они бы не решились из-за сложности. Однако возникает новая задача — справиться с грядущим наводнением статей, сгенерированных ИИ, которые будут подаваться в научные журналы.

2. В июле 2024 года в мире стоматологии произошло историческое событие: автономный робот-дантист, управляемый ИИ, впервые самостоятельно провел процедуру на человеке. Разработанная компанией Perceptive система использует 3D-сканер для создания подробной модели ротовой полости и планирует операцию на основе полученных данных. Первое испытание включало подготовку зуба под коронку, которую робот выполнил всего за 15 минут, что в восемь раз быстрее, чем обычно требуется человеку.

3. Запустилась новая модель AI от компании Илона Маска xAI — Grok-2, которая находится на уровне лидеров рынка. Хотя она и не достигает уровня GPT-4o, Claude 3.5, Sonnet или Gemini 1.5 Pro, Grok-2 вошла в число передовых языковых моделей. В настоящее время она занимает 4-е место в рейтинге LMSYS, но поскольку Grok-2 находится на стадии бета-тестирования, xAI, вероятно, планирует дальнейшие обновления, чтобы продвинуться на вершину. Сейчас пользователи 𝕏 (Twitter) с подпиской Premium и Premium+ могут попробовать Grok-2 mini, а вскоре станет доступен и Grok-2. Оба варианта также будут доступны разработчикам через API. Похоже, на рынке больших ИИ-моделей намечается пентархия: Gemini от Google, ChatGPT от OpenAI, Claude от Anthropic, Llama от Facebook и теперь Grok от xAI/Илона Маска.

4. Google недавно анонсировала ряд новых ИИ-функций для устройств Android и Pixel, основанных на их модели Gemini, с целью сделать телефон еще умнее. Теперь на устройствах Pixel появится Gemini Nano — локальная версия ИИ, обеспечивающая более быстрые и приватные функции, такие как автоматическое создание заметок о звонках, библиотека скриншотов с возможностью поиска и Pixel Studio для генерации изображений прямо на устройстве. Таким образом, Google конкурирует с Apple Intelligence (так Apple назвали свой AI), и AI скоро станет доступен миллиардам человек.

5. Flux, новая модель генерации изображений от стартапа Black Forest Labs (основанного выходцами из другого ИИ-проекта по генерации изображений Stable Diffusion), быстро завоевывает популярность и конкурирует с Midjourney. Одним из ключевых преимуществ Flux является его открытый исходный код и возможность работы на обычных ноутбуках, что делает его доступным для широкой аудитории. В отличие от Midjourney, который требует мощного облачного сервиса, Flux можно запустить на хорошем игровом ноутбуке.

P.S. На видео первая в мире операция человека-дантиста на роботе, как его представляют ChatGPT (промпт) + Midjourney (картинка) + Luma Labs (видео)

Читать полностью…

Wiseman Talks

AI новости недели

Илон Маск строит самый мощный кластер ИИ и хочет, чтобы xAI был лучшим по всем параметрам к концу 2024 года, при этом борьба за данные пользователей продолжается: xAI собирает данные людей в Твиттер (Х), причем отменить согласие непросто.

Не только пользователи обеспокоены приватностью, Евросоюз включился в регуляцию ИИ:
1 августа 2024 года в ЕС вступил в силу Акт об искусственном интеллекте (AI Act). Закон направлен на ответственное развитие ИИ: AI Act вводит единые правила для всех стран ЕС, основанные на оценке рисков:
• Минимальный риск: Спам-фильтры и видеоигры не имеют обязательств.
• Риск специфической прозрачности: Чат-боты должны информировать пользователей что они ИИ.
• Высокий риск: Медицинские приложения и подбор персонала должны соответствовать строгим требованиям.
• Недопустимый риск: например, ИИ для социального рейтингования запрещено (как противоречащее базовым правам человека).

На фоне таких серьезных диалогов широко обсуждается девайс Friend: кулон, который носится под сердцем и слушает все, что вы говорите, и поддержит вас в нужную минуту.

Обсуждается, конечно же, вопрос с приватностью, а еще говорят про домен friend.com, который был куплен за 1.8 миллионов долларов. И также вопросы из зала от психологов: а не перестанут ли люди общаться с другими людьми. Про человеческое и ai общение дискурс похож на обсуждения вокруг сервиса Character.ai (в котором люди общаются с ИИ персонажами, в том числе с ИИ психологами).

Кстати, выходца из Google, Noam Shazeer, основателя Character.ai, Google захантил обратно, купив его компанию за 2.5 миллиарда долларов (Noam один из авторов статьи "Attention is All you need" - одной из ключевых работ, положивших начало развитию современных моделей больших языковых моделей, LLM).

P.S. На видео Data Center на Марсе, как его представляют ChatGPT (промпт) + Midjourney (картинка) + Luma Labs (видео)

Читать полностью…

Wiseman Talks

Запрограммировал бота, в котором можно генерить поэзию в стиле Байрона, Блейка и Пушкина по заданным словам, и получать NFT, сгенеренную по мотивам выбранной поэзии. Пользуйтесь на здоровье, вот вам пример в стиле Уильяма Блэйка (и собранное по мотивам NFT - запрос был Love, NFT, Robots)

"In twilight's grasp, where shadows play,
Among the giants made of clay,
With circuits keen and senses bright,
The robots wake to endless night."

Читать полностью…

Wiseman Talks

Я выиграл на Хакатоне EthGlobal в Брюсселе, занял 1е место! 🏆 Расскажу, как это было)

Хакатон - от сочетания hack (программировать) и марафон, и это такой хакерско-предпринимательский марафон длиною в выходные.
В пятницу проходят воркшопы, где можно узнать про технологии и про критерии победы.

Примерно в 9 вечера начинать программировать - что я и сделал и продолжил до 6 утра в воскресенье с малюсеньким перерывом на дрёму (этакий программистский рейв).

Проходит в огромном пространстве, вмещающим почти 2000 участников хакатона (именно оффлайн, только такой формат участия возможен) - хакеры съехались из 70 стран.

Я сделал проект Llama Rally - это ИИ агенты, взаимодействующие на блокчейне с финансовым процессиногом за хорошую работу и всяческой верификацией. Другими словами: если вам нужен ИИ для заказа билетов, для поиска информации в интернете, для summary текстов, то на Llama Rally вы можете найти лучших - причем сам код агентов заложен в смарт контракт на блокчейне, и агент получает криптовалюту (usdc) за качественно проделанную работу.

Я люблю формат хакатона, потому что он - качалка для мозга. Чтобы успеть решить задачу и выиграть, мозгу надо работать на максимум и в разных направлениях - тут тебе и код писать, и про продукт думать (поэтому я считаю что хакатон - именно предпринимательски-хакерский марафон, а не просто хакерский). И с людьми общаться, собирать обратную связь по проекту.

Я заметил, что к вечеру субботы даже думать начал на английском, видимо мозг так решил резко оптимизировать мыслительный процесс, чтобы не было издержек времени на перевод мыслей в слова)

Как итог - за выходные сделал продукт, который дальше буду развивать как самостоятельный проект, накаченный мозг, новые связи, ну и радость победы)

Читать полностью…

Wiseman Talks

Web3 & Ai & Личный агент знаний

Запустил бота Wise.Ai, который выступает как личный агент знаний. Ему можно дать статью - ссылкой или текстом: бот из них сделает выжимку самого главного. Еще он может менять модальность контекста - даёте ему текст, а он из него делает аудио подкаст. А также умеет в поиск по статьям и материалам, которые вы в него закинули, и по ним давать ответы на уточняющие вопросы.

Верю в синергию Web3+Ai, поэтому в этом проекте использовал не только Ai, но и Web3 стэк - создал Smart-контракт для функции создания выжимки из статей, и сами запросы к Ai происходят on chain (а compute - off chain).

Под капотом:
OpenAI + Corcel - для работы с Ai
Galadriel - для работы с Web3
Spider - для скрэпа web-содержимого статей и для последующего создания выжимки.

А еще, люблю добавлять Easter Eggs в проекты, для Wise.Ai сделал такой: если в тексте статьи есть слово Vitailik, то бот напоёт вам статью.

Пользуйтесь на здоровье, в tg: @web3samurai_bot, пока что основной язык - английский, но если будет достаточно запросов - то добавлю русский.

Читать полностью…

Wiseman Talks

ИИ для продактов

Больше 57% Product Manager-ов используют GenAI в своей работе ежедневно, и больше 85% хотя бы раз в неделю, говорит опрос от Lenny Rachitsky.

За последний год мы стали свидетелями интеграции ИИ в ежедневную работу продактов. Две статьи Ленни, опубликованные с интервалом примерно в год, наглядно демонстрируют эту эволюцию: в статье "How to use ChatGPT in your PM work" Ленни еще зовет регистироваться в ChatGPT, а в статье “How to use Perplexity in your PM work" 9% людей, которые ответили что редко используют ИИ в работе уже немного выглядят белыми воронами.

В статьях Ленни описывает, как продакты применяют AI для работы. Ленни трижды пишет: “лучший способ подготовиться к этому быстро приближающемуся будущему – это действовать на практике. Поэтому попробуйте один из этих запросов сами.”

Давайте разберемся, как именно инструменты помогают PMs в их задачах - на примере запросов к Perplexity.

Понимание и разработка стратегии роста
Объяснение основ growth accounting для продуктового менеджера
Анализ эволюции реферальной программы Dropbox. Почему она сработала?

Поиск бенчмарков
Какой средний показатель открытия push-уведомлений на Android и iOS?
Объяснение опроса product-market-fit по Рахулу Вохре

Исследование рынка
Стратегия вывода на рынок AI от Notion
Как Airtable переводит пользователей на корпоративный план?

Изучение лучших практик
Список методов мозгового штурма для продуктовых менеджеров
Как Spotify использует фреймворк Jobs to Be Done?

Оценка популярных инструментов
Сравнение аналитических инструментов: Amplitude, Mixpanel и Posthog. Включает ключевые особенности, существующих клиентов, точки дифференциации и отзывы пользователей.
Самые популярные инструменты для локализации приложений

Понимание технического жаргона
Объяснение DAU/MAU
Что такое Kubernetes?

Пробуйте на практике, тем более Perplexity в базовой версии бесплатен (а еще и работает норм без VPN в России, что редкость)

Читать полностью…

Wiseman Talks

Зарелизил новую версию telegram бота Ai Sobirai, и выложил его в Open Source

Напомню, что умеет бот:
- делает транскрипт аудио заметок и встреч;
- создает summary аудио встреч.

Что нового:
- провел полный рефакторинг кода - теперь транскрипты больших аудио записей и встреч делаются в много раз быстрее;
- добавил отправку транскрипта встречи в txt файле прямо в чат;
- выложил исходный код в open source по лицензии MIT - если надо, можете развернуть у себя на сервере.

Для доступа к боту и по вопросам как развернуть на своем серваке пишите @wisemik

Напомню, что в TechAviv Agency мы запускаем ИИ для банков (писал об этой ветке тут), ритейла (писал тут), и другими направлениями (AI & mobile & web dev + design)

Читать полностью…

Wiseman Talks

Докрутил модель - так что текст генерируется теперь шикарно, добавил в бота генерацию войса (с милым акцентом), и еще прикрутил картинки по мотивам стиха.

Шаббат Шалом!

Читать полностью…

Wiseman Talks

Вышел подкаст о культуре и технологиях, про наш проект Любовные письма (мобильные приложения, в которых можно гулять по Петербургу и слушать письма Гумилева Ахматовой, Маяковского Брик и письма современных Петербуржцев - приложения были сотни раз упомянуты в СМИ и заняли первые места в рейтинге).

Из необычного: презентация приложений проходила в Петербургском особняке - ни разу ни до ни после не видел, чтобы презентация digital проекта прошла в замке

Читать полностью…

Wiseman Talks

1) Выбрасывая на берег

Выбрасывая на берег словарь,
злоречьем торжествуя над удушьем,
пусть море осаждает календарь
со всех сторон: минувшим и грядущим.
Швыряя в стекла пригоршней янтарь,
осенним днем, за стеклами ревущим,
и гребнем, ослепительно цветущим,
когда гремит за окнами январь,
захлестывая дни, -- пускай гудит,
сжимает сердце и в глаза глядит.
Но, подступая к самому лицу,
оно уступит в блеске своенравном
седому, серебристому венцу,
взнесенному над тернием и лавром!


2) Сквозь шепот листвы

Сквозь шепот листвы и скрип половиц,
Сквозь скрежет ключей и пенье синиц,
Сквозь снежную мглу и солнечный луч -
Мой голос летит, глотая созвучья.
Плыву по волнам бескрайних равнин,
В горниле страстей судьбою храним.
На каждом шагу разлуки страшась,
Молюсь в темноте пред ликом пространств.
И память, как луч, пронзает висок,
И жизни моей обрывки - песок,
Что ветер времен развеял вокруг.
И я в темноте - беззвучный мой звук.
Но голос летит, все дальше, вперед,
Туда, где рассвет надежду зажжет,
Где сердцу покой обещан, как дар.
И гаснет в ночи мой траурный фар.


3) Петербургский блюз

Странный город, где тьма нависает,
Где Нева, словно стон, вдаль плывет,
Где история в камне оседает,
А душа от тоски лишь поет.

Здесь дворцы овеяны ветром,
И каналы хранят тихий стон,
А над шпилем Адмиралтейства где-то
Вьется чайкой последний поклон.

Люди здесь, словно тени, проходят,
В серых буднях плывя без следа,
Ищут истину, но не находят,
В этом мире, где тлеет звезда.

Петербург, ты мой город печальный,
Где душа обретает покой,
Где мой стих, словно дождь проливной,
Омывает печалью твой зной.

Но я знаю, что завтра настанет,
Новый день, озаренный рассветом,
И душа из оков одиночества встанет,
Встретив утро крылатым поэтом.

P.S. В подарок Иосифу Александровичу скоро соберу бота, который будет стучаться к fine-tuned модели, обученной на всех стихах поэта

Читать полностью…

Wiseman Talks

McKinsey составила отчет об использовании GenAI в различных индустриях, и выделила несколько основных точек применения - в разрезе потенциала автоматизации, а также экономической составляющей (см график).

По следам этого отчета собрал реальные кейсы использования ИИ в корпорациях, сегодня расскажу про задачу маркетинга и виртуальных ассистентов.

1) Маркетинговые рассылки: задача про улучшение показателей маркетинговых кампаний и увеличение среднего чека и общего объема продаж за счет более точно таргетинга.

Решение: выделение сегментов пользователей с помощью AI; написание маркетинговых текстов специально для этих сегментов с помощью GenAI.

Пример: банк Morgan Chase, в 5.5x увеличился click rate на рекламные объявления.

2) Виртуальные ассистенты: задача ускорения и улучшение качества взаимодействия с клиентами, сокращение костов на отдел поддержки.

Решение: предоставление консультаций и помощи клиентам через виртуальных ассистентов.

Пример: шведский fintech проект Klarna - заменила 700 сотрудников call центра на решение с ИИ.

Если хотите поговорить про то, как использовать ИИ в бизнесе - welcome на консультацию

Читать полностью…
Subscribe to a channel