Новое медиа от создателей @GPT4Telegrambot. Мы пишем просто и понятно о мире искусственного интеллекта и нейросетей. Редактор @tombuzinsky
🎥 Сам себе режиссер с Runway
Runway представила новую функцию video-to-video для модели Gen-3 Alpha. Теперь можно создавать ролики на основе других видео, в том числе снятых пользователями.
🆕 Что умеет новая модель
🔘 Менять стили. К загруженному видео можно применить стилистику знаменитых фильмов или конкретных жанров. Например, как в аниме или хорроре.
🔘 Добавлять и менять объекты. Функция позволяет заменить фон, добавить анимацию к статичным кадрам. Удобно для смены времени года или создания загадочной атмосферы.
🔘 Вставлять промежуточные сцены. Модель может добавить дополнительную сцену или эффект для перехода между кадрами, например, slow motion.
📝 Как пользоваться
1️⃣ Зайдите в личный кабинет Gen-3 Alpha, выберите video-to-video и загрузите ролик, с которым будете работать.
2️⃣ Напишите в текстовом промпте все, что хотите изменить на видео: укажите обстановку, какие объекты должны быть в кадре и как они двигаются. Также вы можете прописать движения камеры, эффекты анимации и настройки по цветам. Ключевое слово titles добавляет на видео двигающиеся титры.
3️⃣ Скачайте полученное видео.
👍 Попробовать новую функцию от Runway можно тут. Gen-3 Alfa доступна пользователям с подпиской от $15 в месяц.
Больше по теме:
Руководство по созданию видео в Runway Gen-3
Создаем видео «как в кино» в Runway Gen-3
Runway готовится запустить API для своих моделей
#Runway #news @hiaimedia
🌍 ИИ научился создавать игры с открытыми мирами
Китайский холдинг Tencent представил GameGen-O — революционную ИИ-модель для создания открытых миров в видеоиграх (когда персонаж свободно передвигается по игровому пространству без четких сценариев). Это первый шаг к генерации таких игр, как Tomb Rider или Red Dead Redemption.
🤪 Как устроена модель
GameGen-O использует датасет, собранный из более чем 150 игр и включающий свыше 4 000 часов видеоконтента. Этот обширный набор данных тщательно обработали с помощью уникальной системы сортировки и добавления комментариев к конкретным сценам.
⁉️ Как обучалась GameGen-O
GameGen-O обучают в два этапа. Сначала модель генерирует игровой контент по текстовому описанию. Затем проходит настройка с использованием сети InstructNet. На этом этапе модель учится не только создавать игровые сцены, но и реагировать на интерактивные команды пользователя. Она генерирует следующие кадры видео в ответ на инструкции вроде «персонаж должен пойти направо». Таким образом появляется игровой мир.
💫 Можно ли уже создать готовую игру?
Хотя GameGen-O пока создает только короткие видеоролики, а не полноценные игры, разработчики уже могут использовать ее для быстрой генерации прототипов и тестирования игровых элементов.
👀 Посмотрите видеообзор на GameGen-O тут.
Больше по теме:
Можно ли создать видеоигру с помощью генеративного AI?
#games @hiaimedia
🥵 ИИ поможет городам справиться с жарой
От аномальной жары в мире ежегодно погибает до полумиллиона человек, а лето 2024-го года стало самым теплым на планете за всю историю наблюдений. Больше всего достается жителям мегаполисов, где образуются так называемые тепловые острова. Эти зоны нагреваются сильнее других и затем отдают тепло, из-за чего температура растет еще сильнее.
Исследовательская лаборатория Google представила набор ИИ-инструментов, чтобы городские службы могли эффективнее защищать жителей от жары.
⚛️ Heat Resilience
Модель умеет находить самые уязвимые для экстремальных температур районы. Для этого ИИ анализирует спутниковые и аэрофотоснимки мегаполисов, учитывает данные по средним летним температурам и уровню жизни местного населения. Сервис тестируют в 14 городах США.
🌴 Tree Canopy
Инструмент выявляет участки, где не хватает растительности, и заранее предупреждает о рисках «тепловых островов». Tree Canopy используют в 2000 городах по всему миру.
🏠 Сool Roofs
Система изучает местность и рекомендует районы, где следует заменить крыши на «прохладные». Они отражают солнечный свет, из-за чего здания нагреваются не так сильно. Сервис помогает снизить электропотребление в жару на 27%. Сool Roofs готовятся запустить в 11 городах, включая Нью-Йорк, Нэшвилл и Мельбурн.
👍 Польза
Алгоритмы не только определяют самые опасные участки, но и заранее просчитывают изменение средней температуры поверхности, если принять меры. Такие расчеты помогут градостроителям планировать пространства городов с учетом изменения климата
Больше по теме:
ИИ научился предсказывать наводнения
Как ИИ помогает тушить пожары
#news @hiaimedia
📣 Привет, друзья! Самое интересное за 37-ую неделю 2024 года из мира ИИ в нашем воскресном дайджесте.
ГЛАВНЫЕ НОВОСТИ
💻 OpenAI выпустила модель o1 и ее уменьшенную версию o1-mini. Модель, ранее известная как Strawberry 🍓, обдумывает ответы, рассуждает и решает сложнейшие задачи по физике, математике и программированию.
📱 Apple показала iPhone 16 с ИИ-функциями. Это первый «яблочный» смартфон со встроенной системой Apple Intelligence.
ОБНОВЛЕНИЕ БОТА
🔴 Новые модели OpenAI o1 уже в @GPT4Telegrambot. Советы по использованию здесь.
СОХРАНИТЕ — ПРИГОДИТСЯ
🙂 Loopy — нейросеть для реалистичной анимации лиц по фото и аудио. Она оживляет лицо, создавая точные движения губ, глаз, бровей и головы.
ПОЧИТАТЬ
❓ Почему искусственный интеллект спасет мир? Пять прогнозов от одного из главных идеологов Кремниевой долины Марка Андриссена.
😅 Проект Sid — целый мир в Minecraft, населенный ИИ-агентами. Цивилизация со своей культурой, политикой и религией.
🔥 Как ИИ помогает тушить пожары, определяя самые уязвимые для пожаров регионы в режиме реального времени.
👍 Hume AI — первый ИИ с эмпатией. Он слушает, распознает 48 эмоций и отвечает с учетом вашего настроения.
ПОСЛУШАТЬ
🎙️ Кто переизобрел радио? Лидер The Black Eyed Peas запустил радио с ИИ-ведущими и обратной связью слушателей.
ПОИГРАТЬ
❓ Квиз про ИИ — «Все только начин-AI-тся!» в нашем квиз-боте. Каждую неделю победителей ждут призы.
ПОСМОТРЕТЬ
📱 Лучшие доклады TED про ИИ за год. Подготовили для вас подборку свежих выступлений об искусственном интеллекте.
Отличного окончания недели!
#AIweek | @hiaimedia
💻 Новые модели OpenAI o1 уже в @GPT4Telegrambot
Вчера OpenAI представила o1 — новую версию своего ИИ. Протестируйте o1 в нашем боте:
🔴 OpenAI o1 — модель для решения сложных задач, которая рассуждает и обдумывает ответ, подобно человеку. Показывает результаты на уровне доктора наук в математике, физике, химии.
🔴 OpenAI o1-mini — быстрая и экономичная версия, особенно хороша для программирования.
Как пользоваться?
1️⃣ Подключите пакет «GPT-4o + OpenAI o1» в разделе /premium
2️⃣ Выберите модель в /settings
🔴 @GPT4Telegrambot — бот №1 для работы с нейросетями в Telegram: пишет тексты и код, переводит, решает задачи по математике и физике, работает с документами, создает изображения и музыку.
#OpenAI @hiaimedia
📱 OpenAI представила новую ИИ-модель — o1
OpenAI анонсировала новую серию моделей ИИ под названием o1, предназначенных для решения сложных задач путем углубленного анализа и рассуждений.
Ключевые особенности
➡️ Разработана для более длительного «обдумывания» проблем перед ответом, подобно человеку
➡️ Демонстрирует улучшенные способности в области науки и программирования (сравнение с GPT-4o в комментариях)
➡️ Показывает результаты на уровне студентов PhD в задачах по физике, химии и биологии
➡️ Достигла 83% правильных ответов на отборочном экзамене Международной математической олимпиады, в то время как GPT-4o решила только 13% задач.
Кому уже доступна?
Модель доступна пользователям платной версии ChatGPT Plus, а также разработчикам, имеющим доступ к API 5 уровня.
Версия o1-mini
OpenAI также представила уменьшенную версию o1-mini, которая на 80% дешевле o1 и особенно эффективна для задач программирования.
Выпуск o1 знаменует собой значительный шаг вперед в развитии искусственного интеллекта, способного к сложным рассуждениям и решению комплексных задач.
Лимиты
🔴 o1-preview — 30 сообщений в неделю
🔴 o1-mini — 50 сообщений в неделю
#OpenAI #news @hiaimedia
🚴 Я буду долго гнать ИИ-велосипед
Немецкая компания Radlabor выпустила киоск Smartfit Q2 для подбора велосипеда с помощью ИИ. Разработчики говорят, что это первая подобная система. Киоск уже получил награду на выставке Eurobike 2024, а продажи велосипедов в магазине, где его установили, выросли на 20%.
✔️ Весь процесс занимает до пяти минут, а погрешность измерений не превышает 2 мм.
Как это работает?
1⃣ Сотрудник магазина вводит параметры клиента — рост, вес, пол — и указывает модель велосипеда, например, горный или городской.
2⃣ Затем нужно снять обувь и измерить длину внутренней стороны ног с помощью стика, похожего на палку для прыжков.
3⃣ На основе этих данных и 10 фотографий клиента ИИ создает каркасную модель тела.
4⃣ Затем система предлагает велосипеды с подходящим размером рамы, рекомендует идеальную высоту сидения и руля.
База Smartfit Q2 насчитывает 120 марок велосипедов и более 50 000 моделей. Сам киоск занимает меньше 1м².
Источники: New Atlas, Smartfit
#news @hiaimedia
📱 Блогер-миллионник Марина Могилко про AI в своей работе
Для нашего бесплатного курса «Нейрограмотность» блогер и предприниматель Марина Могилко записала урок про использование нейросетей, которые помогают ей создавать контент для миллионов подписчиков 👀
В уроке вы узнаете, как:
🔘 быстро создать короткие видео для Shorts из длинных влогов и трансляций
🔘 анализировать большие объемы информации
🔘 создать аватар, который будет говорить на всех языках мира
🔘 упростить монтаж видео
🔘 оптимизировать работу с GPTs
▶️ Урок от Марины Могилко
🔵 Курс «Нейрограмотность»
Есть ли среди наших читателей блогеры?
❤️ — Да, я блогер со стажем
🤓 — Только начинаю блог
😎 — Мне просто нравится тут
🎙 ГОВОРЯЩИЕ ГОЛОВЫ
Loopy — это новая ИИ-модель Audio2Video для создания реалистичной анимации лиц на основе аудиоданных. Система использует одно изображение и аудиофайл, чтобы оживить лицо, создать точную и выразительную мимику. Нейросеть воспроизводит не только движение губ, но и передает эмоции через движение бровей, глаз и головы.
Основные возможности
➡️ Поддержка различных аудиостилей. Loopy умеет адаптировать движения к разным аудиофайлам, будь то спокойная речь или эмоциональное пение.
➡️ Работа с боковыми профилями. В отличие от других технологий Loopy справляется с анимацией даже для изображений, где лицо повернуто в профиль. Работает, но не идеально.
➡️ Вымышленные герои. Отлично оживляет персонажей аниме и художественные изображения, что расширяет возможности использования в анимации и видеоиграх.
❗️Loopy пока нет в открытом доступе.
Из доступных нейросетей для анимации лиц рекомендуем попробовать генератор Hedra.
Источник
Еще по теме:
EMO — нейросеть от Alibaba, которая может научить любую фотографию говорить или петь
VASA — гиперреалистичный говорящий аватар
Создай своего цифрового двойника с помощью нейросети HeyGen
#news @hiaimedia
❓ Решаем AI-квизы 2.0
Привет, друзья!
Продолжаем гимнастику для ума с нашим квиз-ботом в Telegram.
Сегодня для вас новый квиз про искусственный интеллект «Все только начин-AI-тся!».
⤴️⤴️⤴️
Победителей недели, как всегда, ждут призы от PARTYstation и подписка на @GPT4Telegrambot.
Кто сыграл — рассказывайте впечатления и делитесь рекомендациями.
❤️ — интересно
😎 — слишком просто
🙉 — слишком сложно
⤵️⤵️⤵️
Для тех, кто пропустил — здесь первый квиз «Вместо Тьюринга».
🤔 Наш канал для любителей интеллектуальных игр и интересных фактов: @PARTYstation_Quiz
#Quizbot @hiaimedia
🎙️ КТО ПЕРЕИЗОБРЕЛ РАДИО?
Лидер группы The Black Eyed Peas Уильям Адамс, известный как will.i.am, запустил AI радио. RAiDiO.FYI — это интерактивная медиаплатформа, где слушатели могут общаться с AI ведущими и настраивать контент по своему вкусу.
🎤 Интерактивные AI ведущие
У каждой станции — свой AI ведущий, который приветствует слушателя по имени, обсуждает темы и включает музыку. Чтобы подключиться к беседе, нужно нажать кнопку и задать вопрос, например: «Кто продюсировал эту песню?» — и сразу получить ответ.
В отличие от других музыкальных сервисов с рекомендациями, вроде AI DJ от Spotify, AI радио делает акцент на разговорном контенте и обратной связи слушателей.
Станции доступны в приложении FYI, которое музыкант запустил в 2020 году. Каждая станция существует как «проект» в приложении. Весь контент, включая сценарий, музыку и другие материалы, загружается в виде «мегапромпта». AI ведущие имеют доступ к актуальной информации из проверенных источников.
Скоро не только ведущие станций, но и сама музыка будет сгенерирована AI
Певец, продюсер и инвестор Уильям Адамс
📚 Новая книга Харари: «Nexus: Краткая история информационных сетей от Каменного века до ИИ»
10 сентября 2024 года в свободную продажу поступит новая книга Юваля Ноя Харари, одного из самых известных историков и футурологов наших дней.
В 2016 году вышла моя книга Homo Deus, в которой я рассказал о некоторых опасностях, которые несут человечеству новые информационные технологии.
С момента выхода книги темпы изменений только ускорились, и власть действительно переходит от людей к алгоритмам. Многие сценарии, которые в 2016 году казались научной фантастикой — например, ИИ, способные создавать произведения искусства, имитировать человеческое поведение, принимать за нас важнейшие жизненные решения и знать о нас больше, чем мы сами, — в 2024 году уже стали реальностью.
Фрагмент из книги «Nexus»
🖥 Можно ли создать видеоигру с помощью генеративного AI?
Модель от Google DeepMind — Genie — использует текстовый промпт и нарисованный от руки эскиз или фотографию для создания классических 2D-игр вроде Super Mario Bros. Означает ли это, что геймдизайнеры останутся без работы или индустрия геймдева станет доступной даже для тех, кто не имеет опыта и образования? Разобрались, как устроены модели text2game.
📱 Как устроена Genie
Genie обучили на 30 000 часах видео с 2D-играми. Модель анализировала, как положение персонажа на экране зависит от действий игрока, и на основе этого создавала последовательность кадров, которые складываются в уровни. Главный минус: игра генерируется со скоростью один кадр в секунду (у современных игр этот параметр — 30–60 кадров в секунду).
🖥 GameGAN
NVIDIA тоже использовала видеоданные для обучения AI-модели GameGAN. Но к ним разработчики добавили информацию о нажатых во время игры кнопках. Однако такое наложение тегов на видеокадры требует больших затрат, а это ограничивает возможный объем данных для обучения. Тем не менее, у GameGAN хорошо получаются простые игры вроде Pac-Man.
Обе модели — Genie и GameGAN — исследовательские проекты. У обычных пользователей нет возможности их протестировать.
🇨🇦 Astrocade AI — генератор игр
Astrocade AI — это стартап (поддерживается фондом NVIDIA), развивающий мобильное приложение для генерации игр с помощью простых текстовых запросов. Достаточно ввести команду, например, «сгенерировать платформер с персонажем, который прыгает», и AI создаст все необходимые элементы игры. Затем ее можно отредактировать с помощью нового промпта, например, «хочу, чтобы костюм персонажа был красного цвета, и чтобы во время прыжка он совершал кувырок».
Astrocade AI — это еще и сообщество: готовую игру можно опубликовать в открытом доступе, чтобы другие пользователи могли протестировать ее или доработать. Посмотрите скриншоты из разработок первых пользователей приложения ⤴️
Подробнее о технологии Astrocade AI рассказал специалист по машинному обучению Андрей Куренков в подкасте о text2game-моделях.
❗️ Интересный факт: должность директора по стратегическому развитию в компании занимает Фей-Фей Ли, «крестная» AI.
Записаться в лист ожидания, чтобы протестировать Astrocade AI можно тут.
Еще истории о роли AI в играх:
📱 Как AI тренирует киберспортсменов?
🎮 Как появились NPC AI: неигровые персонажи с собственным мнением
😵💫 GameNGen — первый игровой движок на основе нейросети
AI оставит создателей игр без работы?
😎 — сомневаюсь
🎃 — уже очень скоро
#games @hiaimedia
🔖 Сохраняем мануал: как озвучить видео с ElevenLabs
🔈 ElevenLabs запустили обширную библиотеку с готовыми звуками, состоящую из 39 категорий на любой случай. Их можно скачать или сгенерировать с нуля по текстовому промпту. Это отличный инструмент для создания видеоконтента.
Как пользоваться?
1️⃣ Зарегистрируйтесь на ElevenLabs;
2️⃣ В разделе Sound Effects введите текстовый промпт;
3️⃣ Нажмите Generate Sound Effects;
4️⃣ Четыре варианта озвучки готовы — их можно скачать.
В библиотеке ElevenLabs можно подобрать готовые звуки: от городского шума до озвучки фильмов ужасов. Еще в ней есть такие эффекты, как «хлопанье двери» или «треск огня».
👉 Попробовать можно здесь.
Из РФ доступно через VPN.
Еще по теме:
⚫️ ElevenLabs запустили студию дубляжа — теперь можно редактировать озвучку
⚫️ Руководство по созданию видео в Runway Gen-3
⚫️ CapCut — сам себе режиссёр с помощью ИИ
Вы создаете видеоконтент?
❤️ — да!
😎 — только смотрю
#manual #elevenlabs @hiaimedia
🔖 Сохраняем мануал: как расшифровать встречу в ZOOM
tl;dv — это ИИ-сервис для записи и расшифровки видеозвонков в Google Meet, Zoom и Microsoft Teams. Название tl;dv происходит от аббревиатуры too long; didn’t view, которую шутливо можно перевести, как «слишком долго — не стал смотреть». Теперь у коллег не будет оправданий, если они упустили важную информацию.
Как пользоваться?
1️⃣ Зарегистрируйтесь на сайте tl;dv;
2️⃣ Скачайте приложение для компьютера Zoom или Google Meet;
3️⃣ Начните видеозвонок и tl;dv автоматически присоединится для записи и расшифровки;
4️⃣ Готовая расшифровка будет на сайте в разделе meetings.
После завершения встречи вы можете редактировать запись, удалять ненужные части и создавать короткие клипы, посвященные конкретным темам. Также можно настроить автоматический обмен ссылками на записи через Slack или по электронной почте.
ИИ-функции
⚫️ Moment Summaries. tl;dv автоматически выделит ключевые моменты и создаст резюме.
⚫️ Meeting Notes. Сервис создаст подробные заметки по встрече.
⚫️ Ask tl;dv. После встречи вы можете задать ИИ до 10 вопросов, например: «Что обсуждали по поводу бюджета?» ИИ выдаст ответит, используя расшифровку.
✅ У сервиса более 1 млн пользователей, он поддерживает свыше 30 языков, включая русский.
Ссылка: https://tldv.io
Каким приложением вы пользуетесь для видеозвонков?
❤️ — ZOOM
😎 — Google Meet
👍 — Microsoft Teams
🙈 — только живое общение
#manual @hiaimedia
🎬 Итоги первого международного фестиваля ИИ-короткометражек
Параллельно с 81-м Венецианским кинофестивалем в Италии прошёл Reply AI Film Festival — первый конкурс короткометражек, в создании которых участвовал ИИ. Тема фестиваля — «Искусственные истории, человеческие сердца».
Более 1000 авторов из 59 стран представили свои работы на суд жюри. Заявки принимались в 4 категориях: повествование (38%), документальные фильмы (36%), экспериментальное кино (14%) и пилоты (12%).
💯 В состав жюри вошли режиссёр Роб Минкофф, известный по мультфильму «Король Лев», продюсер Адам Кулик и Пол Трилло, автор первого музыкального клипа, снятого с помощью Sora от OpenAI. Всего — 11 человек.
🥇 Главный приз достался фильму To Dear Me режиссёра Жизель Тонг. В центре картины — воспоминания молодой женщины о разводе родителей и одиночестве матери. Фрагмент фильма можно посмотреть в ролике к посту ⬆️
🥈 Второе место заняла короткометражка российского постановщика Егора Харламова — One Way.
Фильмы-призёры и работы других финалистов, можно посмотреть на сайте фестиваля.
Источники: Forbes, Business Wire
Еще по теме:
Объявлены победители AI Film Festival
AI Summer: что посмотреть этим летом
«Волшебник AI»: фильм про AI, созданный AI
#news @hiaimedia
🎊 День рождения @hiaimedia и 100 000 звездочек для вас
Друзья! Сегодня, 17 сентября, мы празднуем день рождения нашего канала.
Ровно год назад мы создали медиа для умной аудитории про AI, нейросети, стартапы и людей, которые их развивают.
⭐️ 100 000 ЗВЕЗДОЧЕК
Мы разыграем 100 тысяч gpt4telegrambot/stars">Telegram Stars в честь дня рождения. Их получат 200 случайных подписчиков наших каналов. Розыгрыш начнется сейчас. Результаты в пятницу в 12.00. Следите за новостями!
🗓 ЗА ЭТОТ ГОД МЫ:
🟡 Опубликовали 1137 постов про AI на самые интересные темы #news
🟡Подготовили более 70 инструкций о том, как пользоваться нейросетями #manual
🟡Выпустили 50 дайджестов #AIweek
🟡Запустили каналы на 5 языках:
🇷🇺 574 000 читателей на русском
🇬🇧 250 000 на английском
🇪🇸 40 000 на испанском
🇸🇦 10 000 на арабском
🇧🇷 новый канал на португальском
Мы благодарны вам за внимание, просмотры, лайки, комментарии и то, что вы остаетесь с нами все это время 👍
Редакция Hi, AI!
#деньрождения
🚸 В школу на роботакси
Waymo, дочерняя компания Alphabet, предложит подросткам пользоваться роботакси, при этом родители смогут следить за поездками. Новая программа называется Waymo Teen.
💡 Как появилась идея
Некоторые родители в Сан-Франциско уже вызывают своим детям Waymo, хотя самостоятельные поездки разрешены с 18 лет. Они нарушают правила из-за страха отпускать ребенка на автобус и недоверия обычным таксистам.
Waymo Teen фактически призвана легализовать уже существующую практику. Этот шаг совпадает с аналогичной инициативой от Uber. Сервис Uber for Teens позволяет пассажирам в возрасте 13-17 лет заказывать такси и еду под надзором родителей.
💵 Подписка на 16 поездок в Waymo Teen будет стоить от $150 до $250 в месяц.
Сегодня роботакси Waymo работает в Сан-Франциско, Лос-Анджелесе, Финиксе и Остине.
Как думаете, что безопаснее для ребенка?
❤️ — такси с водителем
😎 — я за беспилотное такси
Источник
Еще по теме:
🚕 Waymo — беспилотное такси
#news @hiaimedia
📱 Лучшие доклады TED про ИИ за год. Часть 1.
Мы подготовили для вас подборку свежих выступлений TED об искусственном интеллекте. Они сделают выходные не только приятными, но и полезными.
1️⃣ Что такое ИИ вообще?
⏰ 22 минуты
🎙 Спикер: Мустафа Сулейман
Генеральный директор Microsoft AI и сооснователь DeepMind предлагает посмотреть на ИИ как на партнера в нашей жизни. Сулейман уверен, что искусственный интеллект радикально изменит наш подход к решению глобальных проблем в разных сферах.
2️⃣ ИИ поможет каждому стать программистом
⏰ 15 минут
🎙 Спикер: Томас Домке
Генеральный директор GitHub рассказывает, как искусственный интеллект сделал программирование доступным каждому. Благодаря ИИ можно создавать софт, выражая идеи словами.
3️⃣ ИИ соединит цифровой и физический миры
⏰ 10 минут
🎙 Спикер: Анима Анандкумар
Профессор Caltech и бывший старший директор по исследованиям в области машинного обучения в NVIDIA рассказывает о своих работах. Их цель — объединить цифровой и физический миры. Для этого команда Анандкумар создала нейронные операторы — ИИ, обученные на мельчайших деталях реального мира.
#AITED | @hiaimedia
🏦 Настоящий студент откладывает домашку на последний момент
Используйте нейросеть от Сбера GigaChat для проверки своей работы на опечатки и другие ошибки. ИИ принимает файлы в формате pdf или txt. Прикрепите свой документ и кратко опишите задачу. За экспресс-вычиткой текстов сюда ⬅️
#Реклама
Hume AI — первый ИИ с эмпатией
Нью-Йоркский стартап Hume AI бывших исследователей Google представил первый в мире голосовой ИИ с эмоциональным интеллектом (EQ). Весной компания привлекла $50 млн инвестиций и выпустила недавно обновленную версию — Empathic Voice Interface 2 (EVI 2).
Эмпатическая большая языковая модель (eLLM) работает на базе Claude 3 Haiku от Anthropic. Ее обучали не только на текстах, видео и аудио, но и на данных 10-летних исследований в области EQ.
🤔 Как это работает
В демо-версии Hume AI есть опция Start Call. Нажав на эту кнопку, можно выбрать одного из шести ИИ-ассистентов, поговорить с ним или с ней на любую тему и получить обратную связь о своем настроении. Сервис бесплатный.
У каждого виртуального собеседника свой характер, темперамент и манера речи. Весь разговор сразу преобразуется в текст. Пока сервис поддерживает только английский язык.
Модель умеет распознавать 48 основных эмоций по фото, видео и тональности голоса.
👍 Польза
Беседа с ботом от Hume AI очень похожа на общение с живым человеком. ИИ перестает говорить, когда его прерывают, и внимательно слушает, соблюдая естественные паузы в разговоре. А главное, бот реагирует с эмпатией: он улавливает изменения в тоне, ритме, тембре голоса и подстраивается под контекст диалога.
В результате, собеседник получает обратную связь с указанием трех основных эмоций, например, радость, скепсис и чувство вины.
Применение
🔴 эмпатичные ИИ-ассистенты и домашние роботы-помощники;
🔴 улучшение качества колл-центров;
🔴 модерация и аналитика обсуждений в соцсетях и переговоров;
🔴 маркетинг и UX-исследования;
🔴 гейминг и технологии VR и AR;
🔴 здравоохранение — скрининг ментального здоровья и обучение ботов-психологов.
ИИ-модели от Hume AI находятся в открытом доступе и могут подключаться к любой LLM и приложению.
Больше по теме:
Интервью с основателем Hume AI Аланом Коэном
#startup @hiaimedia
🔥 Как ИИ помогает тушить пожары
Ежегодно от лесных пожаров погибают сотни людей, а из-за изменения климата число жертв и ущерб только растут. В 2023 году в мире горело более 12 млн гектаров земель и глобальный ущерб от пожаров превысил $4 млрд.
Технологии на базе ИИ помогают спасателям заранее определять самые уязвимые для пожаров регионы и в разы быстрее реагировать на возгорания.
❤️🔥 Как это работает
Испанский стартап Technosylva использует инструмент на базе машинного обучения Wildfire Analyst. Он создан на огромном датасете, который включает информацию о пожарах в конкретном регионе за последние 30 лет. Это спутниковые снимки NASA, сведения о погоде, типах ландшафта, растительности, содержании CO2 в атмосфере и уровне влаги в почве.
Программа каждый день проводит более полумиллиарда симуляций и выявляет риски в режиме реального времени. Спасатели уже использовали эту ИИ-платформу в 30 000 пожарах. Сервис применяют в 11 странах.
Инструменты ИИ просеивают горы данных, что позволяет ответственным за тушение пожаров принимать более обоснованные и своевременные решения, высвобождая при этом больше времени для общения и координации действий
Майк Паволонис, физик
❓ Почему ИИ спасет мир?
В своей новой книге «Nexus» Юваль Харари упоминает эссе Марка Андриссена «Почему ИИ спасет мир».
Марк Андриссен — американский предприниматель и влиятельный инвестор с состоянием $1,8 млрд. Из-за безграничной веры в светлое технобудущее его называют главным идеологом Кремниевой долины и гением технологий. Андриссен сыграл ключевую роль в развитии Интернета, создав в 1990-х годах первый популярный веб-браузер Mosaic. Является соучредителем венчурного фонда Andreessen Horowitz (a16z).
Наступила эра искусственного интеллекта, и люди сходят с ума. К счастью, я здесь, чтобы сообщить хорошие новости: ИИ не уничтожит мир, а, наоборот, может его спасти.
Марк Андриссен, инвестор
Разговор с чуткой дружественной машиной действительно может поддержать способность справляться с невзгодами. А медицинские чат-боты с искусственным интеллектом уже более чутки, чем их коллеги-люди.
😅 Целый мир в Minecraft, населенный AI-агентами
Проект Sid — амбициозный эксперимент по моделированию цивилизации AI-агентов с собственной культурой, традициями, политикой и даже религией.
🤖 Как возникла идея
Исследователи команды Altera занимались вопросом «очеловечивания» AI и создания идеальных цифровых аватаров. Для этого они наблюдали, в чем именно проявляется человечность, как люди ведут себя в разных ситуациях. И как перенести эти знания на цифровые модели. Разработчики смоделировали в Minecraft сообщество Sid — деревню, населенную AI-агентами.
Ученые создали симуляции тысяч AI-агентов, «живущих» вместе в одном цифровом пространстве. Оказалось, что большие «популяции» агентов ведут себя иначе, чем группы из нескольких алгоритмов. Они создают свои законы, иерархии взаимодействия, экономику и религию. AI-агенты даже создали собственную конституцию, записали ее и договорились об общем мироустройстве.
🤏 Человечность — в способности говорить
Чтобы сделать AI-агентов более «человечными», исследователи научили их вести реалистичные диалоги, зависящие не только от предыдущих реплик, но и от отношений между агентами. Для этого в поведение алгоритмов встроили модели социального мира. А наличие у агентов 3D-сущностей в мире Minecraft сделало взаимодействие аватаров еще и пространственным.
Разработчики наблюдают, как AI-агенты договариваются и действуют в нестандартных ситуациях. Например, когда некоторые жители не вернулись в деревню до темноты, остальные — отложили свои дела, чтобы осветить путь к деревне, расставив свечи, и помочь потерявшимся найти путь домой.
Как пилотный проект, Sid предлагает больше вопросов, нежели ответов:
⚫️Как создавать агентов, которые позаботятся о развитии человека?
⚫️Как создавать машины, осознающие свои действия и их последствия?
⚫️Как мы можем масштабировать AI-цивилизацию?
Ответы на эти вопросы потребуют исследований и разработок, выходящих за рамки существующих парадигм.
Роберт Янг, соавтор проекта и нейробиолог
📱 Apple Intelligence: что нового появилось в iPhone 16
Apple представила на традиционной церемонии It's Glowtime новый iPhone 16, он стал самым мощным смартфоном с лучшей камерой из всех «яблочных» линеек. И главное — это первый телефон со встроенной AI-системой Apple Intelligence.
🍏 Новые AI-функции iPhone 16
Apple Intelligence потребовала от разработчиков создать более мощный и производительный чип для iPhone 16 и его Pro версии. Чип A18 получил увеличенную на 17% пропускную способность, а также вдвое большую производительность при работе с генеративными AI-моделями.
Мощный 16-ядерный процессор превратил iPhone 16 Pro в игровую консоль: на нем можно играть в требовательные к «железу» игры: например, Honor of Kings World или Resident Evil.
Что умеет Apple Intelligence в iPhone 16
🔴Умная камера с ChatGPT и обновленным механизмом управления: находит меню и отзывы, если пользователь сфотографировал вывеску ресторана, или добавляет в календарь концерт, на афишу которого наведен объектив. Благодаря трем камерам iPhone 16 Pro может создавать стереофото, которые эффектно выглядят в VR-гарнитурах. Кинорежим позволяет снимать реалистичные видео с «голливудским» уровнем визуализации.
🔴Умная сортировка и создание альбомов из фотографий и видео в библиотеке iPhone 16.
🔴Обновленная Siri может вести длинные разговоры, оперативно отвечать на вопросы и персонализировать рекомендации под пользователя: кино, музыки, покупки. Siri также научилась находить фото и видео по их описанию.
🔴Генерирование фото, видео и эмодзи по промпту.
🔴Редактирование и написание текста, в том числе имейлов.
Другие новинки от Apple
🕙 Apple Watch Series 10
🔴Новый чип S10 с четырехъядерным нейронным движком для множества «интеллектуальных функций».
🔴AI-алгоритмы для распознавания речи, перевода текста, подавления шума и работы с изображениями.
🎧 AirPods 4 и AIrPods Max
🔴Машинное обучение позволяет лучше принимать звонки без использования рук. При разговоре с Siri можно кивать, чтобы сказать «да», и трясти головой — если «нет».
🔴Режимы активного шумоподавления и «прозрачности», чтобы слышать улицу и разговоры без искажений. Специальная функция приглушает музыку, если пользователь начинает говорить с кем-то.
🔴Система для улучшения слуха для слабослышащих людей.
Еще об инновациях этого года от Apple:
📱 Apple представил AI-систему для своих устройств — Apple Intelligence
#news #apple @hiaimedia
📣 Привет, друзья! Самое интересное за 36-ую неделю 2024 года из мира ИИ в нашем воскресном дайджесте.
ГЛАВНАЯ НОВОСТЬ
💵 Стартап Ильи Суцкевера Safe Superintelligence Inc. привлек инвестиции в $1 млрд при оценке в $5 млрд. Илья основал SSI чуть больше двух месяцев назад, чтобы создать безопасный для человечества суперинтеллект.
НАУЧНЫЕ ДОСТИЖЕНИЯ
🧠 Органоидный интеллект — новая эра ИИ? FinalSpark строит первый в мире биокомпьютер на базе выращенного в лаборатории «мини-мозга».
🧠 Мозг для робота. Skild AI создал ИИ-модель «мозга общего назначения», который можно встраивать в различных роботов.
🔬AI Scientist представил ИИ, способный самообучаться и проводить научные исследования.
СОХРАНИТЕ — ПРИГОДИТСЯ
🔖 tl;dv — ИИ-сервис для записи и расшифровки видеозвонков в Zoom, Google Meet и MS Teams.
🎙 Как озвучить любое видео: в ElevenLabs появилась библиотека с готовыми звуками, состоящая из 39 категорий на любой случай.
ПОЧИТАТЬ
📚 Новая книга Харари «Nexus: Краткая история информационных сетей от Каменного века до ИИ» уже доступна на русском языке.
💯 Time опубликовал список 100 самых влиятельных людей в ИИ. В него попали основатели стартапов, CEO корпораций, инноваторы, мыслители и архитекторы.
🖥 Можно ли сгенерировать видеоигру? Рассказываем, как устроены модели text2game.
👩⚕️ Как ИИ помогает выявлять детский аутизм: нейросети, позволяющие поставить диагноз на ранних стадиях.
ПОСМОТРЕТЬ
💪 Илон Маск показал суперкомпьютер Cortex AI — один из самых мощных в мире кластеров для обучения ИИ.
#AIweek | @hiaimedia
💯Time опубликовал список 100 самых влиятельных людей в AI
Журнал Time опубликовал свой второй список самых влиятельных людей в сфере искусственного интеллекта — Time 100 AI. Первый вышел сентябре 2023 года.
В итоговом списке оказались 40 CEO и основателей как стартапов в сфере ИИ — например, Илья Суцкевер (Safe Superintelligence), Дарио Амодей (Anthropic), Аравинд Шринивас (Perplexity AI), так и крупных технологических компаний, например, Сундар Пичаи (Google), Сатья Наделла (Microsoft) и, конечно, Сэм Альтман (OpenAI).
👩 Главные женщины в сфере ИИ по версии Time — Мира Мурати и Скарлетт Йоханссон.
Список разделен на четыре группы: лидеры, инноваторы, мыслители и архитекторы.
Полный список здесь.
#news @hiaimedia
👩⚕️ Как ИИ помогает выявлять аутизм
По данным ВОЗ, примерно каждый сотый ребенок в мире страдает от расстройства аутистического спектра (РАС). Зачастую диагноз ставят в относительно взрослом возрасте, из-за чего такие дети не получают необходимую для развития и обучения поддержку. Сегодня эту проблему помогает решить искусственный интеллект.
🇸🇪 Нейросеть AutMedAI, разработанная исследователями из Каролинского университета (Швеция), диагностирует детский аутизм с точностью до 80%. Для обучения ИИ-модели использовали датасет с информацией о 30 000 детей разного возраста. У половины стоял диагноз РАС.
Нейросеть анализировала 28 показателей на основе данных, полученных от родителей и врачей. Среди них — возраст первой улыбки, трудности с приемом пищи, проблемы с речью и прочие нюансы поведения.
🇦🇺 Австралийские ученые использовали ИИ при анализе электроретинограммы детей 5-16 лет — реакции ретины глаза на вспышки света. Алгоритмы обнаружили, что сетчатка детей с РАС реагирует иначе, чем у нейротипичных.
🇰🇷 Исследователи из Южной Кореи проанализировали с помощью ИИ фотографии сетчатки глаз около 1000 детей 7-8 лет, у половины из которых тоже был диагностирован РАС. Нейросеть в 100% случаев верно выбирала снимки сетчатки нейроотличных детей.
🇺🇸 ИИ-модель, разработанная исследователями из Университета Луисвилля в штате Кентукки,
выявляет аутизм у детей от 24 до 48 месяцев с точностью до 98,5%.
Еще о том, как ИИ помогает развивать медицину:
ИИ в поисках новых антибиотиков
Лекарство по рецепту ИИ
#news @hiaimedia
🧠 Мозг для робота
Роботы, обладающие мозгом, будут ловкими и находчивыми, а также очень любопытными, уверены основатели стартапа из Питтсбурга Skild AI. Они создали ИИ-модель «мозга общего назначения», который можно встраивать в различных роботов.
Стартап недавно привлек $300 млн и сейчас оценивается в $1,5 млрд. В числе инвесторов — Джефф Безос, Softbank, Lightspeed Ventures и другие венчурные фонды. Модель обучена на огромном датасете текстов, изображений и видео по аналогии с тем, как тренируют ИИ-чатботов.
Роботы общего назначения, которые могут безопасно выполнять любые автоматизированные задачи в любой среде, позволят нам расширить возможности роботов, демократизировать их стоимость и поддержать рынок труда, испытывающий острую нехватку кадров.
Абхинав Гупта, сооснователь Skild AI
💪 ИИ-суперкомпьютер от Илона Маска
Илон Маск показал суперкомпьютер Cortex AI, который уже почти достроили в Giga Texas, штаб-квартире Tesla в Техасе.
💡 Идея
Маск представляет этот проект как «новый гигантский суперкластер для создания ИИ для решения задач реального мира».
Это действительно один из самых мощных в мире кластеров для обучения ИИ. Суперкомпьютер будут использовать для разработок и улучшения cледующей версии нейросети Grok AI, обучения системы автопилота Tesla Full Self Driving и роботов Optimus. Рядом с Cortex уже строят огромную систему охлаждения.
🔋 Мощность
Cortex AI будет работать на 50 000 чипах Nvidia H100, а в следующем году туда планируют добавить 300 000 графических процессоров B200 от Nvidia, которые считаются самыми мощным в мире. Цена одного процессора — около $40 тыс. Эти чипы обучают ИИ не только на записанных файлах данных, но и на больших массивах видео.
На объекте будут работать 70 000 ИИ-серверов, потребляющих 130 МВт, а через два года — до 500 МВт энергии.
⚡️ Параллельно с Сortex AI Илон Маск запустил еще один гигантский кластер для xAI — Project Colossus в Мемфисе, который он называет gigafactory of compute. Кластер работает на базе 100 000 чипов H100 от Nvidia, для его охлаждения нужно 5 млн литров воды ежедневно.
На создание Colossus от идеи до реализации ушло всего 122 дня.
Также Маск недавно объявил об инвестициях $500 млн в суперкомпьютер Dojo в Буффало, где расположен еще один гигантский завод Tesla.
Почитать больше:
xAI представила новую модель Grok-2
#news #ElonMusk @hiaimedia