Новое медиа от создателей @GPT4Telegrambot. Мы пишем просто и понятно о мире искусственного интеллекта и нейросетей. Редактор @tombuzinsky
📣 Привет, друзья! Самое интересное за 21-ую неделю 2024 года из мира ИИ в нашем воскресном дайджесте.
НОВОСТИ
📱 CEO OpenAI Сэм Альтман впервые прокомментировал новую модель GPT-4o. GPT-4o стала результатом нескольких лет работы OpenAI: создание аудио- и видеомоделей, их совмещение и новый подход к обучению.
🎙️ Украли голос. Скарлетт Йоханссон утверждает, что голос GPT-4o звучит практически идентично ее голосу.
СТАРТАП
🌞 ИИ-дерматолог: голландский стартап Skinive позволяет делать быстрый скрининг кожи.
СОХРАНИТЕ — ПРИГОДИТСЯ
🎶 Как стать композитором с помощью Suno AI. Наша памятка по работе с нейросетью с примерами песен на стихи Юрия Шевчука и Николая Гумилёва.
💬 Как добавить субтитры к видео с помощью ИИ? Мануал по видеоредактору СapCut.
ПОЧИТАТЬ
🐳 О чем говорят кашалоты? Ученые открыли «фонетический алфавит кашалотов».
😓 В чем секрет успеха DeepL. История онлайн-переводчика с миллиардом пользователей по всему миру.
🗞 Rio — ваш ведущий новостей с ИИ. Стартап Curio использует технологии ИИ для создания персонального медиапомощника по имени Rio.
ПОСМОТРЕТЬ
🎬 Объявлены победители AI Film Festival. Гран-при получил сюрреалистичный фильм про японского иммигранта в США Get Me Out.
🧠 ChatGPT понимает, что происходит внутри мозга. Научный журналист Илья Колмановский принял участие в интересном эксперименте.
📱 TED Talks от профессора Стэнфорда Фей-Фей Ли. Она сравнила роботов, способных действовать в пространстве, с трилобитами.
До лета осталось 5️⃣ дней 🌞
#AIweek | @hiaimedia
🎬 В центре Лос-Анджелеса во второй раз прошел международный кинофестиваль ИИ AIFF, организованный ИИ-видеостартапом Runway. Примечательно, что мероприятие поддерживают такие авторитетные киноинституции, как Tribeca Film Festival и Женевский кинофестиваль.
🥇 Гран-при получил сюрреалистичный фильм про японского иммигранта в США Get Me Out. Режиссёр фильма Daniel Antebi снял 5 короткометражек, а в 2022 году выпустил свой первый полнометражный фильм God’s Time. Приз составил $15к и 1 млн кредитов Runway. За графику в картине отвечал художник Visual Frisson:
«ИИ позволяет мне создавать сложные визуализации, которые я бы никогда раньше не смог сделать»
🎬 Любой желающий мог подать заявку. Хронометраж фильма не должен превышать 10 минут. Использовать продукты Runway необязательно, как и полноценная генерация фильма с помощью ИИ. Организаторы просят не нарушать авторские права других артистов.
❗ В прошлом году было подано 300 заявок, в этом — уже 2500.
Критерии оценки: качество композиции фильма, согласованность повествования и художественного послания, оригинальность и использование ИИ. Каждый фильм оценивался по шкале от 1 до 10 судьями, высший средний балл определил победителя.
Где можно посмотреть фильмы участников?
На сайте кинофестиваля представлены фильмы победителей и номинантов. Также проводились гала-показы в Нью-Йорке и в Лос-Анджелесе.
🍿 Просмотр фильмов-финалистов займёт около 90 минут — отличная идея для киноманов, как провести вечер.
Источник: Forbes
Что думаете про использование ИИ в кино?
⚡️ — Отлично! Больше возможностей для креативного выражения
🙈 — Сомнительно, но окей
#news @hiaimedia
🗞 Rio — ваш ведущий новостей с ИИ
Вчера OpenAI заключила соглашение с News Corp на $250 млн на 5 лет для использования контента таких изданий, как The Times, The Sunday Times, MarketWatch, The Wall Street Journal, New York Post и The Daily Telegraph. Соглашение предоставляет доступ к актуальным новостям и архиву для обучения моделей OpenAI. Это большой объем тренировочных данных!
Стартап Curio уже с 2016 года имеет обширный каталог информационных партнеров: WSJ, The Guardian, The Atlantic, The Washington Post, Bloomberg, New York Magazine. Используя эти материалы, Curio обучила свою модель ИИ. Стартап превращает экспертную журналистику в профессионально озвученный контент. Cейчас компания использует технологии ИИ для создания персонального медиапомощника по имени Rio.
Новый продукт привлек финансирование от Khosla Ventures и главы TED Криса Андерсона.
❓ Как это работает?
Rio сканирует заголовки медиа, а затем собирает этот контент в ежедневную сводку новостей, которую вы можете прочитать или послушать.
В приложении новостная лента похожа на сторис в Instagram с графикой и ссылками. Пользователи могут листать заголовки и переходить к полным статьям, озвученным голосом ИИ.
Взаимодействие с Rio возможно и в чат-боте. Компания предлагает вам использовать Rio с помощью таких запросов: «Расскажите мне о возможности мира в Украине», «Каково будущее продуктов питания?», «У меня есть 40 минут, сообщи мне последние новости об ИИ».
Рио в настоящее время находится на раннем доступе, что означает, что вам понадобится приглашение, чтобы войти. В противном случае вы можете присоединиться к списку ожидания приложения на rionews.ai. Curio планирует запустить Rio полностью в этом году.
🔜Что дальше?
Такой интерфейс в ближайшем будущем, возможно, появится на более крупных новостных агрегаторах, таких как Google News и Яндекс, или даже на сайтах отдельных медиахолдингов.
Еще по теме
🔝 ТОП-10 онлайн-медиа, которые пишут об ИИ
🌐 OpenAI подписала соглашение с медиахолдингом Axel Springer
#news @hiaimedia
🎶 Как стать композитором с помощью Suno AI
Если вы чувствуете желание сочинять песни, понимаете, какую композицию хотите получить, какие инструменты должны звучать и в какой момент солист пропоет «ООО-УУУ», то для вас gpt4telegrambot/suno">памятка по работе с Suno AI.
🎸 Как создать песню?
Введите в @GPT4Telegrambot команду /chirp, выберите режим генерации и следуйте инструкции:
⚫️ В простом режиме опишите, о чем будет песня и в каком жанре.
⚫️ В расширенном можно выбрать необычный жанр и создать песню со своим текстом.
Suno AI создаст 2 трека, до 2 минут каждый. Трек можно продолжать несколько раз.
🗣️ Разметка текста
При добавлении текста используйте теги, которые сделают переходы органичными и позволят управлять звучанием.
Вот некоторые из них:
⚫️ [Verse] – ставится перед началом куплета.
⚫️ [Chorus] – перед припевом.
⚫️ [Sad Verse] / [Happy Chorus] – чтобы задать определенное настроение куплету или припеву.
⚫️ (oooyyy) – добавляет бэк-вокал в конце куплета.
⚫️ [Bridge] – соединяет части композиции, если нужно перейти от одного стиля к другому.
⚫️ [Instrumental Interlude] – добавляет проигрыш.
⚫️ [Outro] / [Big Finish] – поможет завершить песню. Наполняет финал импровизированной музыкой и текстами.
Каждый куплет разбивайте пустой строкой для паузы или проигрыша.
📌 Ударение
Чтобы поставить ударение в сложных словах, напишите ударный слог заглавными буквами: «изгИБ гиТАры жЁлтой».
▶️ Памятку и примеры песен на стихи Юрия Шевчука и Николая Гумилева можно gpt4telegrambot/suno">найти здесь.
#Suno @hiaimedia
👀 Разыгрываем ТВ Станцию Про 55“, Станцию Миди и комплект устройств для умного дома
Для участия:
• Подпишитесь на телеграм-каналы Яндекс и ТЕХНО;
• Нажмите кнопку «Участвовать» под этим постом;
• 24 мая в 12:00 бот случайным образом выберет трёх победителей. Первый получит ТВ Станцию Про, второй — Станцию Миди, третий — устройства умного дома (хаб, светодиодную ленту и розетку).
Отправка выигрыша возможна в Россию, Республику Беларусь и Казахстан. Доставка бесплатная.
ИИ-дерматолог: запись открыта!
Май — месяц профилактики меланомы и информирования о важности ранней диагностики.
По данным ВОЗ, около миллиарда людей на планете имеют кожные заболевания и около трети из них об этом не подозревают. Поэтому дерматологи советуют проходить чекапы хотя бы раз в год, а тем, у кого светлая кожа, - дважды в год, потому что они менее защищены от солнечных лучей и более подвержены риску развития рака кожи.
👋 Благодаря ИИ появилась возможность ранней диагностики кожных проблем. Голландский стартап Skinive позволяет делать быстрый скрининг кожи. Нейросеть обучена на более 1,5 млн снимков кожных заболеваний, которые затем были верифицированы дерматологами и онкологами из разных стран.
⚙️ Как это работает?
Нужно зарегистрироваться, указать возраст и тип кожи, и сделать с помощью встроенной камеры снимок интересующего участка. Далее вы мгновенно получаете оценку риска данной проблемы (низкий, средний, высокий), предварительный диагноз и рекомендации по вашему случаю.
🤢 К ИИ-дерматологу можно обращаться по самым разным вопросам: подозрительные родинки, кожные высыпания, акне, дерматиты и другие.
💲 После регистрации пользователь получает возможность бесплатного анализа одной кожной проблемы с опцией единичной бесплатной диагностики раз в неделю.
«Регулярные скрининги состояния кожи должны войти у всех нас в привычку: ИИ помогает сделать это точно и быстро». Кирилл Сокол, основатель Skinive
📱 CEO OpenAI Сэм Альтман впервые прокомментировал новую модель GPT-4o, представленную на прошлой неделе. Он назвал ее «сочетанием» усилий специалистов OpenAI и также выразил сомнение, что появится GPT-5.
💥 О том, почему GPT-4o важная модель
У меня давно была идея голосового управления. Но все существующие сегодня примеры такого управления — например, Siri — никогда не казались мне естественными. GPT-4o можно попросить говорить быстрее, сменить голос или интонацию, прерывать её. GPT-4o стала результатом того, над чем мы работали последние несколько лет: аудио- и видеомодели, их совмещение и новый подход к обучению.
🤔 Будет ли GPT-5?
Мы до сих пор не знаем. Главное, что я понял — традиционный способ презентации продуктов, которого придерживается большинство компаний, нам не подходит. Лучше сосредоточиться на улучшении эффективности модели, чтобы предоставить пользователям лучший продукт в мире.
🤔 Что лучше: узкоспециализированные или обобщённые модели
Могу поспорить, что будущее за обобщёнными моделями, которые смогут рассуждать. Если в такую модель загрузить новые данные, она с ними справится.
👍 Главная отличительная черта общения человека и AI через 2 года — это...
Естественный язык. Я очень жду появления роботов-гуманоидов, потому что наш мир создан для людей, и мне бы не хотелось его менять.
🧳 Какая профессия появится из-за AI?
Хороший вопрос, обычно, все спрашивают, какие профессии исчезнут. Думаю, новая большая категория профессий будет связана с ценностью человеческого общения.
☹️ Когда появится AGI?
Наивно полагать, что мы зафиксируем определенный момент, когда достигнем AGI. И я сомневаюсь, что в ближайшие пять лет мы достигнем такого уровня AI. Мы пошагово развертываем AI — это значит, что мы не собираемся создавать AGI втайне.
🔥 Альтман также рассказал:
→ как OpenAI будет монетизировать свои технологии;
→ как правительство должно регулировать AI.
Посмотреть интервью Сэма Альтмана полностью можно тут.
#OpenAI @hiaimedia
📞 Звоните Дали! Он вам точно ответит с помощью ИИ!
«Привет, я Сальвадор Дали, и вы можете спросить меня о чем угодно!» — так приветствует гостей знаменитый художник, точнее, его голосовой двойник, недавно воскрешенный с помощью искусственного интеллекта.
В мае Дали исполнилось бы 120 лет, и Музей Сальвадора Дали в Санкт-Петербурге, штат Флорида, представил возможность пообщаться с художником… по телефону. Причем по тому, который создал сам Дали. Это «Телефон-лобстер» — копия сюрреалистичной скульптуры Дали 1938 года.
📱 Проект Ask Dali («Cпросите Дали») музей запустил в коллаборации с креативным агентством Goodby Silverstein & Partners из Сан-Франциско.
Аутентичный голос Дали синтезировали с помощью нейросети ElevenLabs Eleven V2. Модель на базе GPT-4 обучена на большом архиве сочинений Дали и аудиозаписей его интервью на английском языке. Художник разговаривает с довольно сильным акцентом в характерной для него ироничной манере и готов объяснить смысл любых своих работ и раскрыть секрет своих легендарных усов.
«Ask Dalí» предлагает новый способ взаимодействия с технологией машинного обучения. Поэтические произведения Дали, написанные в его неподражаемом стиле, легли в основу обучения модели, которая дает динамичные и непредсказуемые ответы на вопросы посетителей».
Джефф Гудби, разработчик проекта
🎸«Творчество нельзя раздавить»
📱 Неделю назад Apple извинилась за рекламу нового iPad, в которой пресс уничтожает книги и музыкальные инструменты. Минутный ролик «Crush!», опубликованный гендиректором компании Тимом Куком в соцсети X, показывает, как под музыку пресс давит предметы, связанные с культурой и искусством: фортепиано, гитару, телевизор, аудиопроигрыватель, книги и банки с краской. В конце ролика на месте раздавленных вещей под прессом появляется новый iPad — таким образом Apple хотела показать, как многофункционально ее новое устройство.
В соцсетях ролик подвергли массовой критике — многие пользователи увидели в рекламе демонстрацию того, как новые технологии уничтожают искусство и опыт человечества. С негативными комментариями по этому поводу выступили некоторые знаменитости — актер Хью Грант, продюсер Жюстин Бейтмен, режиссер Рид Морано.
Samsung ответил на скандальную рекламу Apple, выпустив видеоролик по ее мотивам. Южнокорейская компания показала, как девушка играет на повреждённой гитаре среди обломков, и заявила: «Творчество нельзя раздавить». Это не первый раз, когда Samsung троллит Apple.
Предлагаем вашему вниманию оба ролика.
Они ярко отражают текущую дискуссию, волнующую умы современных художников, которая обострилась с началом революции в области искусственного интеллекта: что такое творчество, какую роль играют современные технологии в искусстве и кому принадлежат авторские права?
Какой ролик вам понравился больше?
🔥 — Apple
❤️ — Samsung
Еще по теме:
🧐 Нейрохудожественная галерея
🎨 AI и будущее искусства: дискуссия с Сэмом Альтманом
#news @hiaimedia
🤖 Эксперты Forbes опубликовали свои прогнозы, как может выглядеть мир, и ИИ в начале следующего десятилетия.
🔮 Основные прогнозы:
1️⃣ Мы будем взаимодействовать с ботами ежечасно — и не меньше, чем с людьми, используя ИИ в качестве личных помощников, репетиторов, карьерных консультантов, психотерапевтов, бухгалтеров, юристов и романтических партнёров. ИИ станет основным инструментом в маркетинге, продажах и работе с клиентами. Радикальный сдвиг в сторону массового внедрения ИИ может произойти в одночасье.
2️⃣ Наравне с роботами, выполняющими узкоспециальные задачи (например, работу на складе или приготовление кофе), в массовом количестве появятся роботы-универсалы. Tesla планирует начать продажи Optimus уже к концу 2025 года, а через 6 лет рядом с нами будет уже не менее 100 тыс. человекоподобных роботов.
3️⃣ Понятие AGI устареет и выйдет из употребления. Само развитие ИИ перестанет восприниматься как движение к некоему конечному состоянию, которое будет соотноситься со способностями человека, ИИ радикально превзойдёт человека во многих областях.
4️⃣ Nvidia, лидер по производству чипов для ИИ, сильно сдаст позиции. Главным конкурентом станет Intel, который уже сейчас владеет заводами, выпускающими чипы. Другие техногиганты вроде Amazon, Microsoft, Alphabet, Meta, OpenAI тоже будут вкладывать огромные средства в разработку своих чипов.
5️⃣ В начале 2030-х ИИ совершит революцию в экономике, выполняя огромное количество задач дешевле, быстрее и точнее людей. При этом безработица из-за внедрения ИИ станет одной из самых острых политических и социальных проблем. Возникнут и новые рабочие места — но не для всех. По этой причине не исключены протесты и беспорядки, появление партий и политических лагерей, выступающих «за» или «против» власти ИИ. Как следствие, ряд стран примут законы о всеобщем базовом доходе.
Больше, ещё больше прогнозов:
🔝 Станет ли NVIDIA самой дорогой компанией в мире?
❓ Заменит ли меня ИИ?
#news @hiamedia
🔍 Google наносит ответный удар. Самые интересные AI-новинки.
Вчера прошла ежегодная конференция Google I/O 2024, на этот раз почти целиком посвященная AI. Корпорация выступала в роли догоняющего, мероприятие проходило сразу после громкой презентации модели GPT-4o от OpenAI. Отметим, что новинки Google оказались достойными.
⚡️ Мощная Gemini
Google представила новую модель: Gemini 1.5 Flash. Мультимодальная модель оптимизирована для «узких, высокочастотных задач с малой задержкой». Это позволяет лучше генерировать быстрые ответы. Но задержка на фоне потоковой беседы с GPT-4o — скорее разочаровывает. Контекстное окно Gemini 1.5 Pro увеличено до 2 млн токенов: это в 16 раз больше, чем у GPT-4o.
Кроме того, Gemini будет интегрирована в поисковую систему Google Search, чтобы давать прямые ответы на поисковые запросы так, как это делает Perplexity.
💬 Личный помощник Astra
Astra — это мультимодальный ИИ-помощник, который сможет смотреть и понимать то, что видит через камеру вашего устройства, запоминать, где находятся ваши вещи, и делать что-то за вас.
🔍 Поиск по видео
Вы можете снять на видео то, что хотите найти, и задать вопрос, а AI-помощник попытается получить ответы из интернета.
👀 Генерация видео
Чтобы догнать Sora, Google выпускает нейросеть Veo, которая на основе текстового описания будет создавать 1080p видео в различных стилях, например, в режиме замедленной съемки. Дата релиза — пока неизвестна, но можно уже записаться в лист ожидания.
📌 Ещё были представлены:
→ Imagen 3 — ИИ-модель для генерации изображений, в том числе умеет рендерить текст.
→ Gems — приложение для создания ботов (аналог GPTs).
→ Gemini Live — эта функция делает голосовые чаты более естественными. Кроме того, пользователи смогут прерывать AI-помощника на полуслове.
→ Circle — помогает решать математические задачи.
💥 А тут вы найдете больше информации о прошедшей накануне презентации GPT-4o.
#news #Google @hiaimedia
📞 GPT-4o — это помощник, умеющий шутить, петь и синхронно переводить
Вчера OpenAI представила GPT-4o — самую быструю и мощную модель из всех. Главная цель новинки — демократизировать технологию, чтобы ей заинтересовались все пользователи, у которых есть смартфон.
📍 Мы выбрали интересные кейсы применения GPT-4o.
💡 Учитель математики
GPT-4o с помощью видео понимает формулы и пошагово учит пользователя решать математические примеры (подойдет даже детям). Она также может объяснять геометрические задачи, химические формулы и физические эксперименты.
🔈 Синхронный переводчик
Общаться с друзьями и коллегами по работе станет проще, потому что GPT-4o можно настроить так, что она будет отвечать каждому человеку на его родном языке, переводя фразы собеседника. На видео коллеги беседуют на испанском и английском, в роли переводчика — GPT-4o.
👁️ Сопровождающий для слабовидящих
GPT-4o может с помощью камеры телефона распознавать и описывать все, что видит, идентифицировать объекты (например, памятники архитектуры или животных) и указывать пользователю маршрут.
🌸 Друг и советчик
У GPT-4o можно спрашивать совета о том, какую стрижку сделать или какую одежду выбрать, она искренне порадуется, если у вас есть хорошие новости, поймет шутки и сама не прочь пошутить. Может помочь и с более серьезной задачей, например, подготовиться к собеседованию в OpenAI.
✨ Партнер по игре
GPT-4o знает правила игр и даже может быть рефери в вашем поединке с друзьями, например, в «Камень, ножницы, бумага».
🎙️ GPT-4o — еще и поёт
Модель будет не только отвечать разными голосами и выражать эмоции, но и споет по запросу. Почему бы и нет!
👉 Попробовать новую модель можно в @GPT4Telegrambot.
#news #OpenAI @hiaimedia
🟢 Прямо сейчас технический директор OpenAI Мира Мурати представляет новую флагманскую модель GPT-4o.
GPT-4o будет с сегодняшнего дня доступна всем.
O — значит Omnimodel, она позволит работать с текстом, голосом и изображениями.
При общении голосом GPT-4o распознает тон и эмоции в речи, отвечает быстро, точно и тоже очень эмоционально.
Инженер OpenAI Марк Чен просит новую модель рассказать историю на ночь про любовь и робота. В ходе рассказа просит добавить эмоции, потом драмы. GPT-4o сразу реагирует на запрос, меняет тональность. Мира просит начать говорить как робот — модель реагирует. Марк просит пропеть историю — GPT-4o поёт 🔥
GPT-4o распознает видео с камеры мобильного телефона и обсуждает то, что видит.
Инженер OpenAI написал на листочке I ❤️ ChatGPT и навел камеру. Модель прочитала и говорит, что это очень мило.
💻 OpenAI также представили десктопное приложение.
Показывают ChatGPT строчки кода на экране и просят объяснить. ИИ голосом объясняет простыми словами, что код связан с определением погоды.
📊 GPT-4o в 2 раза быстрее, чем GPT-4, работает на 50 языках.
Показывают перевод голоса в режиме реального времени. Мира говорит на итальянском, ChatGPT переводит на английский.
📎 Резюме: если зимой OpenAI представил много новых продуктов, то сейчас все выступление построено вокруг модели GPT-4o. Выглядит многообещающе. Должна стать доступна уже сегодня, но функционал будет дополняться в течение ближайших недель.
➡️ Запись трансляции
#OpenAI #news @hiaimedia
😉📱 Жоэль Пино, вице-президент Meta по развитию AI, рассказала в своем недавнем интервью, какие продукты компания считает главными AI-инструментами и что ждет Meta в будущем.
Самые интересные высказывания Пино:
👍 Невидимые улучшения
Многие AI-приложения в продуктах Meta незаметны для пользователя. Например, автоматическое удаление неприемлемого контента. Тем не менее более 95% контента, связанного с разжиганием ненависти и насилием, удаляется с платформы до того, как его сможет увидеть хотя бы один человек.
🔝 Ray-Ban Meta — топ
Наиболее ощутимые коммерческие успехи — у очков Ray-Ban Meta. Это продукт в компании определяют как стратегический, потому что он не только позволяет Meta расширить свое присутствие в мире, но и заставляет людей использовать виртуального ассистента Meta AI.
🤩 Стикеры — одним касанием
Модель Segment Anything позволяет выделять объекты на изображениях одним касанием. Она ориентирована на интеграцию в Instagram, а также для создания стикеров или редактирования изображений. У Segment Anything уже есть публичная демо-версия.
😱 Открытая библиотека
PyTorch, библиотека разработки машинного обучения, начиналась как внутренний проект для повышения производительности исследователей Meta. Сегодня она не только опубликована, но и стала ключевым элементом в разработке AI-инструментов: от автопилота Tesla до ChatGPT.
🆒 Модели, умеющие думать
AI-лаборатория Meta находится на пороге создания более совершенных AI-моделей, которые смогут собирать и понимать информацию в любом формате (текст, голос, изображение), а также рассуждать, иметь память и планировать. Они будут превосходить человека практически во всех сферах знаний. Можно сказать, что речь идет о появлении AGI, который, однако, будет назван другим термином.
Еще по теме:
❓ Что такое AGI?
#news @hiaimedia
📺 Netflix выпускает новый фильм о ИИ
24 мая на Netflix выходит научно-фантастический боевик Atlas о противостоянии человека и ИИ.
📺 Блестящий аналитик данных Атлас Шепард в исполнении Дженнифер Лопес посвятила годы попыткам поймать вышедшего из-под контроля ИИ-робота по имени Харлан. Харлан должен был помочь человечеству, но вместо этого чуть не уничтожил мир.
В безвыходной ситуации героине ничего не остается, кроме как обратиться за помощью к доброму ИИ по имени Смит, несмотря на её недоверие к искусственному интеллекту как явлению; судя по трейлеру, в фильме будет большое количество шуток на эту тему 😀
🎬 Режиссёр фильма — Брэд Пейтон, снявший фильм «Разлом Сан-Андреас» и сериал «Рэмпэйдж». Антагониста Харлана сыграет Симу Лю, известный по фильмам «Артур, ты король» и «Барби».
«Atlas — фильм о доверии в целом и о том, насколько сложно доверять людям», — Бред Пейтон
🤨 Интересный доклад Фей-Фей Ли на TED Talks
Профессор Стэнфорда Фей-Фей Ли сравнила роботов, способных действовать в пространстве, с трилобитами: и те, и другие впервые в истории получили зрение, трилобиты — миллионы лет назад, роботы учатся видеть мир прямо сейчас.
🌚 В начале была тьма
540 млн лет назад в мире царила бесконечная тьма. Но не из-за отсутствия света, а из-за отсутствия зрения. Хотя солнечный свет проникал на тысячу метров под водой, там не было ни одного глаза. И только трилобиты, давшие толчок Кембрийскому взрыву, стали первыми обитателями Земли, познавшими мир вокруг себя.
🤨 Компьютер видит и создает
Первый алгоритм компьютерного зрения, который может описывать фото на естественном языке, был создан моим бывшим студентом Андреем Карпаты. Я тогда спросила его: «Можем ли мы сделать все наоборот?» Андрей посмеялся и сказал, что это невозможно. Но сегодня мы видим, как генеративные AI уже способны превратить предложение в фото или видео. Следующий уровень: AI, который сможет совершать действия в пространстве.
🤖 Новая наука для роботов
Группа исследователей из Google разработала алгоритм, который переводит фотографии в трехмерное изображение. А коллеги из Стэнфорда разработали алгоритм, который при помощи одного изображения генерирует бесконечно правдоподобные 3D-пространства. Всё это прототипы зарождающейся науки о будущих возможностях, когда мы переведём весь мир в цифровую форму. Именно это поможет роботам научиться понимать и взаимодействовать с трёхмерным миром.
💥 Цифровой Кембрийский взрыв
Появление зрения перевернуло мир. Оно запустило самый глубокий эволюционный процесс — развитие интеллекта. Поразительный прогресс AI за последнее десятилетие — не менее удивителен. Но потенциал этого цифрового Кембрийского взрыва будет полностью реализован, когда мы наделим компьютеры и роботов пространственным интеллектом.
Почитать по теме:
🧚♀️ Фей-Фей Ли — фея-крёстная искусственного интеллекта
👨🎓 Образовательная лекция от одного из создателей ChatGPT Андрея Карпаты
#ted @hiaimedia
🧠 Могут ли наш мозг и ChatGPT понять друг друга?
Мы привыкли называть AI «черным ящиком», но и о собственном мозге нам не так уж много известно. А что если ChatGPT может пообщаться с мозгом напрямую и выяснить, как все устроено в нашей голове. Научный журналист Илья Колмановский принял участие в интересном эксперименте, о котором рассказал в своем подкасте.
🔋 Как мозг реагирует на слова
Нейробиологи из MIT провели исследование. С помощью томографа они просканировали мозг добровольцев во время чтения различных фраз (всего около тысячи). Оказалось, что на некоторые из них мозг реагирует гиперактивно, а на другие — слабо. Также удалось засечь участки мозга, отвечающие за речь — речевые центры.
🔍 Как ChatGPT понял, что происходит внутри мозга
Ученые загрузили снимки мозга и прочитанные фразы в модель ChatGPT. Затем они попросили LLM составить список фраз, которые, по мнению AI, вызовут определенную реакцию у мозга. ChatGPT составил 2 набора по 240 фраз: для сильной и слабой реакций, соответственно.
😏 Как манипулировать мозгом
Колмановский принял участие во второй части эксперимента. Его положили в томограф и дали почитать фразы из наборов от ChatGPT. После анализа реакций нейробиологи подтвердили, что фразы из «активного» набора действительно будоражили мозг, а слабые — едва вызывали реакцию.
Иначе говоря, ChatGPT смог на основе массива данных (снимки мозга и слов) понять, как «думает» мозг, и с помощью синтезированных данных (2 набора фраз) — управлять его реакциями.
🤫 Где это пригодится?
→ По мнению нейробиологов, ChatGPT и мозг человека устроены похожим образом с точки зрения создания предложений. И они способны понять друг друга без непосредственного участия самого человека.
→ Такой интерфейс «мозг – AI» поможет людям, пережившим инсульт, тренировать речевые центры с помощью специальных наборов слов.
🎧 Послушать выпуск подкаста об эксперименте с ChatGPT можно тут.
Больше историй:
«Hi, НейроЧат»: Наталия Галкина — о технологиях, которыми бы гордился Стивен Хокинг
@hiaimedia
🐳 О чем говорят кашалоты?
Ученые уже много лет пытаются расшифровать язык кашалотов, живущих кланами со сложным социальным устройством. Известно, что животные общаются друг с другом, используя серии коротких щелчков, напоминающие коды азбуки Морзе.
🆕 Исследователи из MIT в сотрудничестве с Project CETI применили инструменты на базе генеративного ИИ, способного классифицировать и анализировать звуки животных. Они обнаружили, что кашалоты используют гораздо более богатый набор звуков, чем было известно ранее. Их «стиль общения» очень похож на человеческий. Открытие назвали «фонетическим алфавитом кашалотов».
Нейросеть проанализировала датасет из собранных в течение 13 лет записей около 9 000 кодов кашалотов из восточно-карибского клана. Клан проживает у побережья Доминики и состоит примерно из 400 особей.
Выяснилось, что в зависимости от контекста кашалоты меняют ритм и темп сигналов и добавляют щелчки для выделения важных элементов «сообщения», подобно тому, как люди выделяют интонацией ключевые слова или выражают эмоции.
💬 Что хотят сказать кашалоты?
Ученые предполагают, что коды могут нести информацию, например, о координации охоты или ухода за малышами. Дополнительные щелчки могут указывать на возраст или социальный статус животного. При этом у каждого клана свой «диалект».
Точный «перевод» с их языка на человеческий — следующая задача, которую надеются осуществить с помощью ИИ.
👍 В чем польза открытия?
Исследование языка кашалотов открывает новые горизонты в понимании интеллекта животных и создании способов коммуникации с ними.
Используя машинное обучение, мы обнаружили, что щелчков, издаваемых кашалотами, гораздо больше, чем люди могли бы выделить вручную из набора данных. Оказалось, что общение кашалотов не случайное и не упрощенное, а структурированное.
Даниэла Рус, директор Лаборатории вычислительной техники и ИИ MIT
💬 Как добавить субтитры к видео с помощью ИИ?
Согласно исследованиям, около 60-85% пользователей Instagram просматривают сторис без звука. Учитывая эту тенденцию, многие инфлюенсеры и бренды добавляют субтитры.
Рассказываем, как ИИ поможет вам добавить субтитры в несколько кликов. Для этого отлично подходит CapCut — самый популярный видеоредактор с функцией распознавания речи.
Как это работает?
1⃣ После скачивания приложения и регистрации нажмите New project на главной странице и выберите видео для транскрибации.
2⃣ Загрузите видео и нажмите кнопку Captions в нижней панели; в правом углу необходимо выбрать язык, нажав на Detect language.
3⃣ Затем нажмите Generate — под видеорядом добавятся субтитры. Ощущается как магия 🪄
✏ Используйте кнопку Edit captions для редактирования текста, а с помощью бегунка меняйте время показа: перетащите нужную часть пальцем вправо или влево.
👁 Кнопка Style позволит поменять шрифт, добавить эффекты или анимацию, а Split «разобьёт» длинную фразу на две.
Чтобы поделиться готовым видео, нажмите на кнопку ⬆️ в верхнем правом углу. Если хотите скачать видео на телефон, после этого выбирайте иконку Other. И готовьтесь собирать лайки 👍
Для доступа к сайту из России нужен VPN. После установки приложением можно пользоваться без него.
🤖 В качестве примера мы взяли отрывок из свежего интервью Сэма Альтмана. Перевели его с помощью ElevenLabs и создали титры в CapCut.
💰 CapCut можно использовать бесплатно, но есть дополнительные функции по подписке; стоимость зависит от региона.
Смотрите разговорные сторис со звуком или предпочитаете читать субтитры?
😎 — Лучше воспринимаю на слух
👀 — Быстрее прочитаю, чем найду наушники
Ещё больше функций в нашем обзоре:
🎬 CapCut — сам себе режиссёр с помощью ИИ
#manual @hiaimedia
😓 В чем секрет успеха DeepL и правда ли, что его переводы точнее, чем у Google Translate?
Русскоязычные пользователи привыкли пользоваться Google Translate и Яндекс Переводчиком. Но стартап из Германии DeepL стремительно завоевывает популярность, прежде всего, за счет точности своих переводов.
💲 DeepL в цифрах
Более 1 млрд пользователей с момента основания стартапа.
32 языка поддерживает DeepL.
⚡ Как основатель DeepL заинтересовался переводами
Информатик Ярек Кутыловски родился в Польше, а когда ему исполнилось 12 лет его семья переехала в Германию. В школу Ярек пошел, ни слова не говоря по-немецки. Это заставило его задуматься о сложности общения на разных языках. Спустя много лет, в 2017 году Ярек решил помочь людям справиться с этой проблемой, ключом к решению стали нейросети и глубокое обучение.
🧠 В чем отличие DeepL от конкурентов
С самого начала стартап разрабатывал новое поколение нейросетей с новаторской архитектурой. В компании хотели, чтобы их AI-переводчик умел распознавать оттенки значений фраз, как это делает профессиональный переводчик. А в 2021 году компания запустила новые модели, справляющиеся с узкоспециализированной профессиональной лексикой. Благодаря сочетанию архитектуры нейросетей, датасетов и работе людей-переводчиков спустя 6 лет после своего основания компания DeepL стала единорогом.
Стартап обучает свои модели на данных из интернета и использует веб-сканеры для автоматического поиска переводов и оценки их качества. DeepL также использует обучение с подкреплением, чтобы обеспечить положительную обратную связь с AI.
⬆️ Трудности перевода
Перевод DeepL более детализирован и в среднем в 3 раза точнее, чем у конкурентов (см. иллюстрацию). Эти утверждения основаны на «слепых тестах», в ходе которых профессиональные переводчики выбирают наиболее точный перевод.
🔠 DeepL доступен в веб-версии, а также для iOS и Android.
Больше историй:
🐶 Трудности перевода: ИИ скоро расшифрует язык животных?
#deepl @hiaimedia
🎙️ Украли голос. Обвинения Скарлетт Йоханссон к OpenAI
На прошлой неделе OpenAI представила своего нового голосового помощника GPT-4o с выразительным, синтетическим голосом, поразительно похожим на голос ИИ-помощника, которого играет Скарлетт Йоханссон в научно-фантастическом фильме «Она».
Скарлетт Йоханссон утверждает, что в сентябре 2023 года генеральный директор OpenAI Сэм Альтман попросил разрешение использовать ее голос, но «после долгих раздумий и по личным причинам» она отказалась. За два дня до презентации Альтман снова связался с ее агентом, и снова получил отказ.
😠 Актриса была шокирована, обнаружив, что голосовой ИИ, звучащий практически идентично ее голосу, уже доступен публике, без ее согласия.
«Я была разозлена и не могла поверить, что мистер Альтман будет использовать голос, который звучит так жутко похоже на мой, что даже мои близкие друзья и представители СМИ не могли отличить его».
«Голос Sky не принадлежит Скарлетт Йоханссон и никогда не предполагалось, что он будет её напоминать. Мы выбрали актрису дубляжа для Sky ещё до того, как обратились к мисс Йоханссон. Из уважения к мисс Йоханссон мы приостановили использование голоса Sky в наших продуктах. Мы сожалеем, что не смогли лучше донести эту информацию до мисс Йоханссон».
📣 Привет, друзья! Самое интересное за 20-ую неделю 2024 года из мира ИИ в нашем воскресном дайджесте.
ГЛАВНАЯ НОВОСТЬ
📱 OpenAI представила GPT-4o — самую быструю и мощную модель из всех. O — значит Omni, она позволяет работать с текстом, голосом, изображениями и видео. Доступна в @GPT4Telegrambot.
🖌 Президент OpenAI Грег Брокман написал, что новая модель GPT-4o будет способна генерировать изображения с большим объемом текста.
📞Подборка интересных кейсов применения GPT-4o. Учитель математики, синхронный переводчик, помощник для слабовидящих и другие.
🔍 Google наносит ответный удар. На конференции I/O 2024 Google представила свои новинки: модель Gemini 1.5 Flash, поиск по видео, мультимодальный помощник Asta, нейросети для генерации видео и изображений.
СТАРТАП
🔍 WhiteBridge — ИИ-сервис для проверки репутации. Литовский стартап анализирует различные онлайн-источники и составляет подробный рассказ о человеке.
ПОЧИТАТЬ
📱 «Мы находимся на пороге создания моделей, умеющих размышлять», — интервью с Жоэль Пино, вице-президентом Meta по развитию AI.
🔭 ИИ обнаружил более 27,5 тысяч астероидов, которые «проглядели» самые мощные телескопы.
🤖 Forbes опубликовали прогноз до 2030 года, как может выглядеть мир и ИИ.
ПОСМОТРЕТЬ
🎨Объявлены победители недели ИИ-моды. Ими стали 4 дизайнера из Испании, ОАЭ и Италии.
🎸«Творчество нельзя раздавить»: провокационный рекламный ролик от Apple и ответ Samsung о технологиях и творчестве.
📞 Звоните Дали! В музее Сальвадора Дали во Флориде посетители могут пообщаться с художником через его «Телефон-лобстер». Аутентичный голос Дали синтезировали с помощью нейросети ElevenLabs.
Лето близко 🌞
#AIweek | @hiaimedia
📱 Президент и со-основатель OpenAI Грег Брокман написал в X, что новая модель GPT-4o способна генерировать изображения с большим объемом текста. И выложил вот такую картинку в подтверждение.
Пока что передовые модели Midjourney V6 и DALL-E 3 способны написать на картинках лишь несколько слов.
Ждем, когда появится в открытом доступе 🕐
#OpenAI @hiaimedia
🧐 ИИ для проверки вашей онлайн-репутации
Если вы промышляете vanity search, то есть гуглите себя в Интернете, знайте, этот поиск только что стал ещё круче!
WhiteBridge AI — литовский стартап, сервис для проверки репутации с помощью ИИ, помогает преобразовать разрозненные онлайн-данные в последовательный рассказ о человеке. ИИ анализирует информацию из огромного количества онлайн-источников, включая профессиональные и социальные сети, публичные записи.
Как это работает?
1⃣ Для поиска нужно ввести на главной странице имя и фамилию или адрес имейла.
2⃣ Нейросеть исследует цифровой след, верифицирует источники и на основе этого создаст полноценный профиль человека: от образования и места работы до интересов и достижений, и даже истории утечки данных.
❓В профиле также указывают информацию из неверифицированных источников. Это означает, что нейросети не удалось проверить информацию, например, возможны пересечения с однофамильцами.
Почему это важно?
В дополнение к общим данным из социальных сетей, ИИ помогает проверить ваш онлайн-образ: какую информацию о вас сообщали вы или другие.
Изучить онлайн-профиль вашего потенциального руководителя или HR-директора — это может быть полезным во время интервью.
В будущем WhiteBridge планирует предоставить пользователем возможность управлять своей онлайн-репутацией децентрализованным способом: проверять источники самостоятельно и запрашивать удаление тех из них, если они попадают под «право быть забытым».
⌨ Также можно будет дополнять важную информацию, упущенную ИИ, и получать вознаграждение за улучшение качества данных.
💵 1 отчет стоит $17, 3 отчета — $39.
Следите за своим цифровым следом?
😎 — Естественно; родная мать не найдёт в интернетах
🙈 — Боюсь представить, сколько про меня узнал интернет за все эти годы
#startup #manual @hiaimedia
🎨Объявлены победители недели ИИ-моды
Прошла вторая неделя ИИ-моды при поддержке фотодепартамента журнала Vogue. Конкурс позволяет молодым дизайнерам заявить о себе без необходимости поиска ресурсов на создание бренда. Победителями стали 4 дизайнера из Испании, ОАЭ и Италии.
🔼 Первые 4 изображения принадлежат победителям, остальные — финалисты.
Любой желающий мог подать заявку, предоставив 5 фотографий, иллюстрирующих идею коллекции. Помимо требований к размеру изображений и разнообразию силуэтов, организаторы попросили продумать экологичность производства. Коллекции победителей будут воплощены в жизнь и поступят в продажу.
Идея конкурса принадлежит креативной студии Maison Meta. Студия помогает дизайнерам внедрять ИИ. Среди их клиентов — известные марки Dolce & Gabbana, Zara, H&M, L’Oreal и Mugler.
Каждый в модной индустрии так или иначе внедрит ИИ в свои рабочие процессы — считает Cyril Foiret, со-основатель Maison Meta.
Какие нейросети применяли участники?
📱 70% дизайнеров работали с Midjourney. Помимо этого, победители использовали Runway, Pika Labs и DALL-E 3. Правила допускают использование Photoshop для исправления галлюцинаций ИИ.
Как выбирали победителей?
🗳 Сначала в ходе публичного голосования определили топ-20 финалистов.
🏆 Из них жюри выбрали победителей. Среди фэшн-экспертов были вице-президент web3-студии Adidas Erika Decker Wykes-Sneyd, креативный директор итальянского Vogue Ferdinando Verderi и визажистка модных показов Pat McGrath.
Источники: Vogue Business, The Business of Fashion
Как вам ИИ-мода?
❤️ — Красота!
🙈 — Фэшн из нот май пэшн.
#news @hiaimedia
🔭 Звездочет 2.0: ИИ научился находить астероиды
Астероидов, парящих в Солнечной системе и в том числе относительно недалеко от Земли, гораздо больше, чем до недавнего времени считали астрономы. Это открытие помог сделать искусственный интеллект.
🌚 ИИ-алгоритмы недавно обнаружили более 27,5 тысяч астероидов, которые «проглядели» самые мощные телескопы.
Большинство обнаруженных космических объектов парят в поясе астероидов между Марсом и Юпитером, а также в окрестностях Нептуна. Более сотни находится недалеко от земной орбиты.
🎮 Как это работает?
Разработанный командой Института астероидов и Вашингтонского университета ИИ-инструмент изучил более 412 000 архивных изображений, хранящихся в Национальной исследовательской лаборатории оптической инфракрасной астрономии. Алгоритм способен анализировать до 1,7 млрд точек на одном изображении телескопа и затем сравнивать положение этих точек на других снимках, выявляя таким образом астероиды. Вычисления и анализ ведутся через инструменты Google Cloud.
✨ В чем польза?
Новый инструмент облегчает поиск и отслеживание миллионов астероидов, включая потенциально опасные, которые когда-нибудь могут столкнуться с Землёй.
Например, с помощью ИИ уже удалось зафиксировать астероид шириной 180 метров, который, как ожидается, приблизится на расстояние 225 000 км от Земли — ближе, чем среднее расстояние между нашей планетой и Луной.
🌟 Какие перспективы?
Астрономы планируют использовать алгоритмы ИИ в новой обсерватории в Чили. Там установлен гигантский 8,4-метровый телескоп, который со следующего года начнет делать снимки южного неба каждую ночь в течение как минимум 10 лет.
Благодаря программному обеспечению на базе ИИ можно будет исследовать больше звездного неба и получать больше данных.
🆕 Исследователи надеются, что уже в первые 6 месяцев работы ИИ поможет обсерватории найти до 2,4 млн новых астероидов, в том числе не менее 2000 на близком расстоянии от Земли, — вдвое больше, чем те, что уже каталогизированы.
Источник
#news @hiaimedia
⚡️ Новая модель GPT-4o уже доступна в @GPT4Telegrambot
⚫️ Самая мощная модель
⚫️ Скорость ответа в 2 раза выше
⚫️ Рассуждает и иронизирует
⚫️ Решает задачи и пишет код
⚫️ Распознает изображения
Как пользоваться?
1️⃣ Подключите любой пакет GPT-4 в разделе /premium
2️⃣ Выбрать GPT-4o в /settings
➡️ Презентация модели
#OpenAI @hiaimedia
Привет, друзья!
Сегодня в 20:00 по московскому времени OpenAI расскажут об обновлениях ChatGPT и GPT-4.
Трансляция: openai.com
Что нас ждет (по слухам)?
⚫️ Голосовой ассистент с большим объемом памяти, который запоминает, ищет в интернете, выполняет задания.
⚫️ Новая модель (но не GPT-5). Возможно, созданная специально для голосового общения (voice-to-voice).
⚫️ Все больше, лучше и быстрее…
Сэм Альтман активно подогревает интерес аудитории в Х:
«Мы много работали над кое-чем новым и думаем, что людям понравится. Я прям чувствую магию!»
📣 Привет, друзья! Самое интересное за 19-ую неделю 2024 года из мира ИИ в нашем воскресном дайджесте.
ГЛАВНАЯ НОВОСТЬ
💰 Более $1 миллиарда инвестиций получил стартап Wayve. Британская компания разрабатывает ИИ для беспилотных автомобилей.
ПОСЛУШАТЬ
🔝 Прогноз сооснователя Suno AI Мики Шульмана начинает сбываться. Мы скоро окажемся в мире, где каждый сможет быть музыкантом. На обложке дайджеста фрагмент первой песни Suno AI, которая набрала более миллиона прослушиваний. Целиком в комментариях.
🎶 Udio — конкурент Suno №1. Мы протестировали новый сервис генерации песен Udio. Послушайте наш трек на стихи Александра Пушкина, поет «Борис Гребенщиков», хотя вряд ли знает об этом.
🎵 ElevenLabs Music — конкурент №2. Разработчик лучшего на рынке синтеза речи тоже решил занять свое место в мире генеративной музыки. Создать песню здесь пока нельзя, но послушать уже можно.
СОХРАНИТЕ — ПРИГОДИТСЯ
⚙️ Бесплатный курс «Как стать промпт-инженером» от сооснователя Coursera. 15-минутные лекции ведут Эндрю Энг и Иса Фулфорд из OpenAI.
ПОЧИТАТЬ
📱 OpenAI выпустила документ Model Spec. Он определяет цели и конкретные правила, которым должны следовать все ИИ-модели компании.
🇫🇷 Интервью с Артуром Меншем, основателем Mistral AI, который бросил вызов американским техногигантами на поле ИИ. Компания привлекает новый раунд инвестиций по оценке в $6 млрд.
🧠 Intel представила самый мощный в мире нейроморфный компьютер. Что такое Hala Point, и как он работает.
🏎 Компания Neural Concept с помощью ИИ улучшает аэродинамику гоночных болидов Формулы-1.
ПОСМОТРЕТЬ
📺 Netflix выпускает фантастический боевик Atlas о противостоянии человека и ИИ. В главной роли Дженнифер Лопес.
Прекрасного завершения недели 💙
#AIweek | @hiaimedia
🎵 ElevenLabs представила нейросеть для создания песен
Стартап ElevenLabs известен своими инструментами для клонирования голоса и преобразования текста в речь. Мы в редакции используем его для русского дубляжа видео с английского.
Cегодня они выпустили превью модели ElevenLabs Music, которая преобразует текстовые промпты в песни. Компания поделилась примерами в Х. Пользователи высоко оценили качество вокала и звука.
От 2024 года мы ждем многого в генерации видео, но пока одна за другой приходят новости из мира музыки. Напомним, что лидером в этой области является Suno AI, которая выпустила недавно третью версию. В апреле появился первый серьезный конкурент — сервис для генерации песен и музыки Udio. И вот теперь ElevenLabs.
ℹ️ ElevenLabs — это компания, которая занимается разработкой голосового синтеза и клонирования голоса с использованием технологий ИИ. В январе 2024 года ElevenLabs закрыл раунд финансирования на сумму $80 млн при оценке компании более $1 млрд, достигнув статуса «единорога». Ведущими инвесторами раунда стали известные фонды Andreessen Horowitz и Sequoia.
ElevenLabs планирует разрешить пользователям продавать ИИ-песни на своей платформе.
Как вам песни ElevenLabs?
🔥 — нравятся
🙉 — все еще слышу робота
Еще про теме:
⚡️ ElevenLabs запустили студию дубляжа — теперь можно редактировать озвучку
🎤 Перевод видео на 29 языков с сохранением голоса — нейросеть от ElevenLabs
🎶 Suno AI: мир, где каждый может быть музыкантом
#news @hiaimedia