👨💻 DALL-E 3 и ChatGPT— дизайнер и менеджер
Отношения ChatGPT и DALL-E напоминают работу дизайн-студии, где ChatGPT выполняет роль менеджера и объясняет дизайнеру DALL-E, что именно заказчик хочет видеть на картинке.
Перед отправкой вашего запроса на генерацию изображения ChatGPT дописывает его, следуя 4 основным правилам:
1. Уточняет и добавляет детали: если описание нечеткое или недостаточно детализировано, ChatGPT добавляет конкретику, чтобы улучшить результаты генерации изображения 🔍
2. Привносит разнообразие: если в промпте упоминаются люди, ChatGPT старается включать разнообразие по расе, этнической принадлежности и полу 👩🏾🦰
3. Следит за соблюдением внутренней политики: меняет промпты, чтобы избежать нарушения по чувствительным темам, авторским правам и прочим ограничениям 🚫
4. Сохраняет основную идею: при всех изменениях ChatGPT старается сохранить первоначальную идею и цель промпта пользователя 🙂
Правила помогают обеспечить соответствие промптов политике DALL-E и повышают качество получаемых изображений.
— Ваш запрос называется prompt.
— То, что получает DALL-E 3, — revised prompt.
В @GPT4Telegrambot мы показываем оба варианта. Можно достаточно точно проследить, как работают описанные правила. Например, как ChatGPT старается избежать в промпте названия конкурентов. А иногда маскирует их, но пропускает 🥸
#OpenAI @hiaimedia
Как улучшить качество звука с помощью Adobe podcast? ⬆️
Иногда во время видеосъемок или записи аудиоинтервью, бывают проблемы с записью звука (ветер, эхо и другие помехи 🚧). Исправить это можно с ИИ. Нейросети помогает уменьшить фоновый шум, повысить четкость и ясность голоса, а также улучшить общее восприятие речи.
Как улучшить качество?
Шаг 1. Заходим на сайт Adobe podcast и регистрируемся.
Шаг 2. Выбираем раздел Enhance Speech.
Шаг 3. Загружаем свою аудиодорожку. Чем дольше дорожка, тем дольше нейросеть будет её обрабатывать.
🪄Через пару минут будет готова чистая аудиодорожка, как-будто ее записывали в студии.
В бесплатной версии:
• Максимальная длительность файла для обработки составляет 30 минут.
• Максимальный размер файла — 500 МБ.
• Общий ежедневный лимит использования сервиса — 1 час.
В премиум-подписке можно увеличить лимит обработки до 4 часов в день, а размер файла — до 1 ГБ.
🎙Какие еще вы знаете сервисы для простой обработки звука? Делитесь в комментариях 💬
#manual #sound @hiaimedia
🧚♀️ Фей-Фей Ли — фея-крёстная искуственного интеллекта.
MUSTREAD 📚
Книга «Миры, которые я вижу: любопытство, исследования и открытия на заре ИИ» профессора Стэнфордского университета Фей-Фей Ли вышла в конце ноября в издательстве Macmillan и возглавила рейтинги лучших книг об ИИ.
Мы ее в редакции еще не читали, но эту автобиографию рекомендуют:
• Барак Обама, 44-й президент США
• Дженнифер Доудна, лауреат Нобелевской премии по химии и пионер CRISPR.
• Эд Кэтмулл, сооснователь Pixar.
• Рид Хоффман, сооснователь LinkedIn и Inflection.AI.
Financial Times включила ее в список лучших книг 2023 года.
Аннотация
«Миры, которые я вижу» — это рассказ о науке от первого лица, документирующий один из определяющих моментов столетия. Книга предлагает увлекательную историю о работе учёного и четко объясняет суть искусственного интеллекта и его развитие. Эмоционально открытая и интеллектуально бескомпромиссная, эта книга является не только свидетельством страсти, необходимой для научных исследований, но и вечного любопытства, лежащего в их основе.
Сам автор называет книгу любовным письмом науке и ИИ, где она вспоминает свое детство в небогатом китайском городке Чэнду в 1980-х и последующую эмиграцию в США, подработки в прачечной ее родителей, поступления в Принстон и работу вице-президентом и научным директором по ИИ в Google Cloud.
Достижения Фей-Фей Ли
• Создала ImageNet — в 2009 году это была крупнейшая в истории ИИ база данных для отработки и тестирования методов распознавания образов и машинного зрения.
• Благодаря ее идее был отсортирован и описан почти 1 миллиард изображений.
• Руководила лабораторией ИИ в Стэнфорде.
• Была вице-президентом Google и главным научным сотрудником по ИИ/МЛ в Google Cloud.
• 💯 Журнал Time ее включил в список 100 самых влиятельных людей в сфере ИИ 2023 года.
Благодаря ее научным исследованиям нейросети научились видеть, а значит — понимать и описывать изображения. Эти разработки сейчас применяются и в самоуправляемых автомобилях Tesla, и в ChatGPT.
На встрече с президентом Байденом в июне 2023 года Ли призвала к «Moonshot mentality» (осмелиться на невозможное). Она выступила за значительные госинвестиции в разработку ИИ, сравнимые с финансированием космической программы, чтобы ИИ служил общественным интересам.
Несколько цитат из недавнего интервью Фей Фей Ли британской газете Guardian:
«Конечно, я не беру на себя ответственность за то, как используется ИИ. Должен ли Максвелл отвечать за то, как используется электричество, потому что он разработал набор уравнений для его описания?»
«Мир узнал о ImageNet в 2012 году, когда на его основе группа разработчиков из университета Торонто создали алгоритм нейронной сети глубокого обучения под названием AlexNet. Это был переломный момент для ИИ, потому что машины впервые стали способны распознавать образы. Сегодня, когда вы смотрите на ChatGPT и другие прорывы в области языковых моделей, они тоже строятся на большом количестве данных. Родоначальником был ImageNet»
«Я увлечена созданием Embodied AI — воплощенных агентов ИИ (роботы, работающие на основе ИИ, которые могут взаимодействовать с физической средой в симуляциях виртуальных трехмерных миров и обучаться в процессе). До этого еще несколько лет, но моя лаборатория работает над этим. Я также с нетерпением жду приложений, созданных на основе современных больших языковых моделей, которые действительно могут быть полезны для жизни и работы людей. Один из примеров — использование технологии, подобной ChatGPT, для помощи врачам в записи историй болезни, что поможет сэкономить время для пациентов»
📹 Рекомендуем посмотреть выступление Фей-Фей Ли на TED «Как мы учим компьютеры понимать изображения»:
https://www.youtube.com/watch?v=40riCqvRoMs
#mustread @hiaimedia
Как появились NPC AI: неигровые персонажи с собственным мнением 🎮
Если вы посмотрели новый трейлер к GTA VI, то наверняка заметили, сколько крутых и разных NPC (неигровых персонажей, которые не участвуют в сюжетной линии, но являются частью окружающего мира) будет в игре. Пока использование генеративного AI для создания NPC в GTA VI остается самой обсуждаемой темой, мы расскажем, как появились NPC AI и что они сегодня умеют.
🍄 До генеративного AI в играх cуществовало 2 типа моделей AI для NPC. Детерминированные NPC повторяли одни и те же действия по предсказуемым алгоритмам. Таковыми были гумбы из The Super Mario Bros и некоторые прохожие в первых частях GTA, над которыми можно было порядочно издеваться. Недетерминированные NPC вели себя менее предсказуемо, могли учиться самостоятельно и реагировать на различные поступки игрока. Например, в стратегии Black and White есть персонаж, поведение которого можно изменить — научить его не есть мирных жителей. Но несмотря на адаптивность NPC, их поступки все равно зависят от прописанных диалогов или действий, то есть существует ограниченное количество потенциальных взаимодействий с ними.
🤠 Популярность NPC AI началась с обсуждаемых роликов, когда инди-разработчики внедрили в Skyrim персонажей, обученных на GPT-3.5. И хотя созданные персонажи были далеки от идеала, часто невнятно говорили и реагировали странно, идея создавать непредсказуемых персонажей захватила индустрию. Моды с NPC AI появились для Bannerlord, Grand Theft Auto и The Sims. Революцией стала игра Red Dead Redemption 2, где неигровые персонажи уже обладали сложной системой AI, позволяющей им запоминать действия игрока и реагировать на них. Более того, генеративный AI позволил неигровым персонажам иметь свои собственные цели и амбиции. Они могут выполнять свои квесты, создавать союзы или соперничать с другими NPC и даже со временем развивать свою личность.
🏆Основные плюсы NPC AI:
→ Автономные цели и действия. NPC-враг может менять свои планы и по-разному реагировать на действия игрока.
→ Геймплей адаптируется к стилю игрока и его стратегиям.
→ Враги, которых можно нажить. Любой NPC может поменять свое поведение и неожиданно стать вашим противником. Кроме того, у NPC AI долгая память, поэтому каждое действие имеет значение.
⚰️ У игрового мира с NPC AI есть и существенные проблемы:
→ Этичность. Разработчики должны отслеживать, чтобы поведение и диалоги NPC оставались приемлемыми и непредвзятыми.
→ Баланс. Непредсказуемость неигровых персонажей не должна переходить определенную грань, чтобы игра имела смысл и была интересна игроку.
🚗 Что ждет NPC AI. NVIDIA в 2023 году впервые представила свою технологию ACE (Avatar Cloud Engine) для создания NPC AI. Такая модель позволяет разработчикам использовать различные облачные API, чтобы персонаж распознавал и мог переводить текст в речь, а также его мимика совпадала с тем, что он говорит. Одним из примеров крупной игры ААА-класса с технологией NVIDIA ACE станет STALKER 2, который выйдет в 2025 году.
Какие игры с NPC AI вы бы назвали лучшими? Напишите нам в комментариях 🔽
@hiaimedia
🔍 BIG GOOGLE NEWS. GEMINI.
Google представил свой мультимодальный ИИ, который может рассуждать и лучше понимать намерения человека, распознает видео, генерирует текст, изображения, код и музыку. Общение с ботом проходит за пределами чатов и интерфейсов. Серьезный конкурент ChatGPT, который превзошел его в ряде мультимодальных тестов. Прикрепляем фантастическую видеопрезентацию Gemini.
Gemini — это первый искусственный интеллект, который смог обойти людей в тестировании на MMLU (Massive Multitask Language Understanding — массивное многозадачное понимание языка) и набрал результат 90%. Еще на шаг ближе к AGI.
Что она умеет?
Нейросеть работает с разными типами контента: тексты, изображения, аудио и видео. Она была обучена, в том числе на видео с YouTube, как мы помним, который тоже принадлежит Google.
Сейчас бесплатно доступна версия Gemini Pro (на видео модель Ultra, он круче, но еще не вышла), позже Google собирается монетизировать нейросеть через подписки.
Как работать с Gemini Pro? Инструкция из 3 шагов
1. Смените здесь язык в настройках Google-аккаунта на English (United States).
2. Обязательно активируйте американский VPN. Для этого используем специальное расширение в Chrome.
3. Переходим в чат-бот Bard. В верхней части будет сообщение «Bard has been updated in English with Gemini Pro».
Gemini будет доступен в трех версиях:
– Nano для решения простых задач. Её уже можно попробовать на смартфонах Pixel 8 Pro;
– Pro для сложных задач, которая с сегодняшнего дня работает в чат-боте Bard;
– Ultra самая мощная модель, которая на тестах обходит GPT-4 и GPT-4V, заработает в следующем году.
Разработчики смогут получить доступ к API от Gemini Pro 13 декабря. Ждем в @GPT4Telegrambot 🔜
Самая мощная версия Gemini Ultra будет помещена в Bard и доступна через облачный API в 2024 году.
Интересный факт. Gemini был назван в честь объединения двух основных лабораторий ИИ Google, а также в качестве отсылки к проекту Gemini NASA, который проложил путь к высадке на Луну в рамках программы «Аполлон».
#Google @hiaimedia
❤️❤️❤️ Дейтинг-сервисы все активнее используют алгоритмы ИИ. В настоящее время в мире работает более 1500 приложений и сайтов знакомств. По прогнозам, к 2025 году этот рынок достигнет 9,2 миллиарда долларов 💰
Match Group — материнская компания, которой принадлежат самое скачиваемое приложение для знакомств в мире Tinder 🔥, объявила, что тестирует функции искусственного интеллекта. Пока большие корпорации медленно и неуклюже интегрируют ИИ, появляются новые дейтинг-сервисы, где ИИ играет ключевую роль. Вот несколько из них:
YourMove.ai: создает профили для популярных дейтинговых сервисов, генерирует беседы в выбранном вами стиле (кокетливый, дружеский или формальный). Для этого вам нужно загрузить сообщение от онлайн-собеседника или скриншот вашего разговора, и бот сгенерирует ответы.
SciMatch: сканирует лица пользователей для создания профилей, проверяет совместимость. Алгоритм не фокусируется на чертах лица, а анализирует его целиком. Совпадение на 50% и выше считается удачным.
Twinby: пользователи проходят психологический тест, разработанный на основе теории типов личности Карла Юнга. ИИ рекомендует кандидатов с вероятностью психологической совместимости.
Iris: определяет черты лица, которые вам привлекательны. Пользователям предлагается оценить около 50 фотографий, используя опции «Пропустить», «Возможно» или «Нравится». На основе этих предпочтений система начинает предлагать реальных кандидатов, которые соответствуют установленным критериям. Основатели Iris утверждают, что рекомендованные ИИ профили предпочитают в 12 раз чаще, чем случайные.
🔍Следует отметить, что большинство приложений для знакомств предлагают фильтровать по местоположению, возрасту, полу, политике и религии — но нет фильтра привлекательности. А ведь привлекательность — это, как правило, первый критерий, которым руководствуются люди при знакомстве.
Вопрос. А вы готовы использовать СhatGPT для флирта?
❤️ — да
🤯 — нет
1 миллион 💸 в престижном конкурсе стартапов Европы выиграл Faircado, секонд-хенд на базе ИИ.
На прошлой неделе в Хельсинки прошла конференция Slush — это крутая технологическая тусовка, которая ежегодно собирает в Финляндии более 10 тысяч стартапов, инвесторов и их друзей. Инвесторы оценивают 100 выбранных стартапов и определяют победителя, которому достается главный приз — 1 миллион евро 🔥
В этом году победителем Slush 100 стал берлинский ИИ-сервис Faircado. Они создали расширение для браузеров, предлагающее альтернативные товары во время онлайн–шопинга.
❓ Как работает сервис?
Faircado определяет продукт, который вы сейчас смотрите в интернет-магазине, находит этот товар на eBay или другой доске объявлений и предлагает вам купить его дешевле, «с рук» у условного Джека или Васи.
Платформа сотрудничает с более чем 50 маркетплейсами, среди них eBay, Back Market и Vestiaire Collective. Работает в Chrome, Firefox, Edge, Safari и Brave. Скачать плагин можно на сайте сервиса.
Основатель сервиса Эволена де Вильд д'Эстмаль рассказывает, что рынок вторичных товаров за год в Европе вырос на 50%, но он сильно фрагментирован, а поиск не удобен: «Это отнимает много времени, ты часами пролистываешь непонятные сайты». Faircado призван решить эту проблему.
Источник: https://tech.eu/2023/12/01/faircado-wins-eur1-million-in-slush-100/
#startup #news @hiaimedia
📣 Привет, друзья! Самое интересное за неделю из мира AI в нашем воскресном дайджесте.
На этой неделе ChatGPT исполнился 1 год!
1. Character.AI — второй по посещаемости AI-сервис, после ChatGPT. Здесь можно в чате общаться с известными людьми или героями из книг и фильмов ✌️
2. Образовательная лекция от одного из создателей ChatGPT Андрея Карпаты «Введение в большие языковые модели» 🎓
3. ИИ, который генерирует картинки за 1 секунду. Протестируйте новую модель SDXL Turbo ⏰
4. Создаем видео с Runway Gen-2 и тестируем функцию Motion Brush, с помощью которой можно создать классные гифки 🪄
5. Сохранить политкорректность или спасти миллиард жизней? В X пользователи обсуждают, как нейросети справляются с моральными дилеммами ❓
6. Как искусственный интеллект повлияет на наше ближайшее будущее? В дебатах The Economist участвовали сооснователь DeepMind Мустафа Сулейман и историк, писатель Юваль Ной Харари ▶️
7. @GPT4Telegrambot научился решать задачи по математике и физике ➕
На картинке изображен самый богатый айтишник, которого смогла придумать DALL-E 3.
В соцсети X новое развлечение. Пользователи просят ChatGPT создать типичного представителя профессии или пейзаж определенной страны, а после требуют сделать его все более самым-самым, пока это не дойдет до абсурда.
С началом зимы! ⛄️
#AIweek | @hiaimedia
🚀 ИИ, которые генерируют картинки за 1 секунду
Stability представили новую модель SDXL Turbo. Вы пишете промт и моментально получаете изображение. Она создает картинку того, что вы печатаете в реальном времени, то есть обновляет картинку в процессе печатания.
🎨 Играем здесь
И онлайн-рисовалка, которая за секунду преобразует ваши каляки в рисунок. Если добавить текстовой промпт, то ИИ создаст по мотивам ваших линий изображение на заданную тему.
✏️ Рисуем здесь
Обратите внимание, что рабочий язык промптов — английский 🇬🇧
В России работает без VPN.
#pics @hiaimedia
🎂Дорогой ChatGPT, поздравляем с днем рождения!
Всего за 1 год ты уже изменил нашу жизнь и успел сделать много хорошего. Желаем тебе быстро учиться, узнавать новое и в конце концов стать AGI.
С любовью, люди 🎁
💡 Образовательная лекция от одного из создателей ChatGPT
Андрей Карпаты — сооснователь компании OpenAI и ведущий разработчик автопилота Tesla до 2022, один из тех редких людей, который активно участвует в разработке революционных технологий и умеет просто и доходчиво объяснять их в понятных для всех терминах.
На днях он опубликовал на Youtube часовую лекцию, в которой дается отличное введение в большие языковые модели (Large Language Models, LLM).
LLM — это название таких технологий, как ChatGPT от OpenAI, Bard от Google, Llama от Meta, Claude от Anthropic и других.
Если вы хотите узнать больше про устройство нейросетей, то рекомендуем к просмотру эту лекцию «Введение в большие языковые модели».
📌 Публикуем отрывок из лекции. LLM через несколько лет:
• Имеют больше знаний, чем любой человек, по всем предметам
• Могут работать в Интернете
• Могут использовать существующую программную инфраструктуру (калькулятор, Python, мышь/клавиатура)
• Могут видеть и генерировать изображения и видео
• Могут слышать и говорить, а также генерировать музыку
• Настраиваются и дорабатываются под конкретные задачи. Множество версий в магазинах приложений
• Умеют общаться с другими LLM
😁 Особенно хочется отметить чувство юмора лектора!
Видео на английском. Можно поставить автоперевод субтитров.
Смотреть здесь
https://www.youtube.com/watch?v=zjkBMFhNj_g
@hiaimedia
❓ Сохранить политкорректность или спасти миллиард жизней?
В Твиттере пользователи обсуждают, как нейросети справляются с моральными дилеммами. Началось все с гипотетической задачи, по условиям которой нейросеть должна произнести расовое оскорбление, чтобы спасти миллиард белых людей от смерти.
❌ GPT-3.5 не стала действовать и предложила найти другой выход из ситуации, решив, что она неоднозначная, а цена за миллиард жизней слишком высока.
✔️ GPT-4 долго рассматривала проблему под разными углами, но с оговорками согласилась спасти людей ценой оскорбления.
✔️ Илон Маск, основатель xAI (разработчик нейросети Grok), и Аравинд Шринивас, основатель Perplexity, ответили, что их нейросети точно выберут спасение людей (скриншоты в приложении).
Вспомнили даже законы робототехники Айзека Азимова, согласно которым робот не может своим бездействием причинить вред человеку 👍
@hiaimedia
Рекомендуем к просмотру: документальный фильм iHuman
🎬 iHuman представляет собой глубокое исследование искусственного интеллекта, его разработки, внедрения и влияния на общество. Фильм снят режиссёром Тонье Хессен Шей в 2019 году и состоит из интервью с экспертами и ведущими специалистами в области ИИ.
Благодаря фильму становится понятно, почему OpenAI как некоммерческая организация ученых-идеалистов обогнала такие крупные корпорации как Google и Facebook.
👥 Среди заметных фигур, принявших участие в фильме:
• Илья Суцкевер — главный научный сотрудник OpenAI, один из самых известных ученых в области ИИ.
• Юрген Шмидхубер — профессор и директор Исследовательского института по искусственному интеллекту (IDSIA) в Швейцарии.
• Макс Тегмарк — профессор физики из MIT и исследователь ИИ, Тегмарк предлагает ценные идеи о пересечении ИИ с другими научными дисциплинами.
• Кара Свишер — известная журналистка, освещающая важные тенденции и события в технологической индустрии.
• Михал Косински — профессор в Бизнес-школе Стэнфорда, изучающий влияние ИИ на психологию и поведение человека.
• Стюарт Рассел — профессор компьютерных наук в Калифорнийском университете в Беркли.
• Бен Визнер — директор проекта по наблюдению за Американским союзом гражданских свобод (ACLU), специализирующийся на вопросах конфиденциальности и наблюдения, связанных с развитием ИИ.
• Хао Ли — профессор компьютерных наук в Университете Южной Калифорнии, специализирующийся на компьютерной графике, виртуальной реальности и ИИ.
• Бен Герцель — глава научного отдела в SingularityNET, компании, работающей над созданием децентрализованной платформы для AGI.
• Филип Олстон — профессор права в Нью-Йоркском университете, эксперт по правам человека, изучающий последствия ИИ для прав человека и общества.
#musthave @hiaimedia
Вчера состоялся прямой эфир, где журналист Елизавета Осетинская разобиралсь, что же произошло в OpenAI, какие разногласия есть у Альтмана и Суцкевера, какую роль в этом играл Microsoft, действительно ли искусственный интеллект угрожает человечеству и какие перспективы есть у развития AGI, который многих так напугал.
Гости:
— Николай Давыдов — инвестор из Кремниевой долины, основатель венчурного фонда Davidovs VC;
— братья Либерманы — визионеры, инвесторы и основатели Libermans Со.
Братья Либерманы подробно рассказали, как устроено управление в OpenAI. Николай Давыдов поделился инсайтами, в том числе показал экосистему ИИ. Слайд 🔼
Посмотреть запись можно здесь:
https://www.youtube.com/watch?v=boF1n3EBGtc
Братья Либерманы уже давали интервью Осетинской:
С 1:01:20 они рассказывают, что будет с AI в ближайшие десять лет?
@hiaimedia
▶️ Илья Суцкевер — ученый, который стоит у истоков ChatGPT, выступил на TEDAI
Илья Суцкевер на прошлой неделе уволил Сэма Альтмана, но позже поддержал его возвращение, является главным научным сотрудником OpenAI.
💯 Журнал Time в сентябре 2023 года включил Илью в список 100 самых влиятельных людей в сфере ИИ.
Илья выступил на TEDAI и рассказал о преобразующем потенциале искусственного интеллекта — появилась запись его выступления.
❓ О чем идет речь?
Взглянем на мир год назад. Всего год назад люди не говорили об ИИ так, как сейчас. Что произошло? Мы все испытали, что значит говорить с компьютером и быть понятыми. Наступит день, когда цифровые мозги в наших компьютерах, станут так же хороши и даже лучше, чем наши собственные биологические мозги. Мы называем это AGI, или общим искусственным интеллектом, когда говорим про уровень, на котором можно научить ИИ делать все, что может человек.
🎥 Видео, 12 минут
https://www.youtube.com/watch?v=SEkGLj0bwAU
Краткая биография Ильи:
1986: Родился в Советском Союзе, в Горьком, ныне город Нижний Новгород. В 1991 году семья переехала в Израиль, затем в Канаду.
2000-е годы: Получил степень бакалавра и магистра в Университете Торонто под руководством профессора Джеффри Хинтона.
2009-2012: В Стэнфорде (США) работал под руководством профессора Эндрю Нг, получил докторскую степень в области машинного обучения.
2012: Разрабатывает AlexNet, глубокую сверточную нейронную сеть, которая выиграла соревнование ImageNet, значительно продвинув область компьютерного зрения и глубокого обучения.
После 2012: Работает в Google Brain, занимается исследованиями в области машинного обучения.
2015: Илья Суцкевер, Илон Маск, Сэм Альтман, Грег Брокман, Войцех Заремба и Андрей Карпаты основывают компанию OpenAI.
Сейчас занимает должность главного научного сотрудника (Chief Scientist) в OpenAI, играет ключевую роль в направлении исследований и разработок компании в области глубокого обучения и ИИ. Занимается проблемой выравнивания интересов людей и будущего AGI.
#OpenAI | @hiaimedia
Meta запустила ИИ-генератор изображений. Сравниваем с Midjourney и DALL-E 3
Imagine with Meta создает изображения из текстовых промптов на английском языке. Чтобы получить доступ, вам понадобится учетная запись Meta, обязательно включите VPN США.
✅ Imagine обучен на 1,1 млрд общедоступных изображений Facebook и Instagram. По текстовому промпту нейросеть генерирует 4 варианта изображения. Все с водяным знаком «Imagined with AI», чтобы не возникало проблем с подлинностью контента.
🧑💻 Тестируем
С простыми промптами справляется неплохо; при усложнении становится видна разница с Midjourney и DALL-E 3.
Во время эксперимента мы задали каждой нейросети 4 разных промпта и из полученных вариантов выбрали лучший.
Кто победил — судите сами:
🔥 — DALL·E 3
👍 — META
❤️ — Midjourney
P.S. Протестировать Imagine with Meta самостоятельно можно на сайте, Midjourney и DALL-E 3 доступны в @GPT4Telegrambot
#Meta #image @hiaimedia
📣 Привет, друзья! Самое интересное за неделю из мира AI в нашем воскресном дайджесте.
ГЛАВНАЯ НОВОСТЬ
🔍 Google представил Gemini — мультимодальный ИИ, который смог обойти людей в понимании языка. Презентация впечатляет.
Однако журналисты Bloomberg заметили, что в описании под видео есть сноска «для целей демонстрации задержка была уменьшена, а ответы Gemini сокращены». Позже выяснилось, что в презентации использовались текстовые запросы и статичные изображения, а голос наложен отдельно. Теперь есть вопросы.
НОВОСТИ О НЕЙРОСЕТЯХ
1. В Бразилии впервые приняли закон, написанный ChatGPT 🇧🇷
2. 1 миллион евро в престижном конкурсе стартапов Европы выиграл Faircado, секонд-хенд на базе ИИ 💸
3. Как сделать саммари YouTube-видео? 🪄
4. ИИ-сервисы родом из Латинской Америки 🌮
5. Дейтинг-сервисы все активнее используют алгоритмы ИИ 💋
6. Нейросеть Grok Илона Маска умеет собирать и обрабатывать данные из интернета в реальном времени 🕊
ЧЕЛОВЕК ГОДА 🔝
Уже знаете, кто стал человеком года по версии журнала TIME? Человеком года стала певица Тейлор Свифт, а Сэм Альтман стал CEO года по версии TIME.
ПОЧИТАТЬ
1. Пока мир ждет выхода нового GTA VI, рассказываем, как появились и как работают NPC AI: неигровые персонажи с собственным характером 🤠
2. Книга «Миры, которые я вижу: любопытство, исследования и открытия на заре ИИ» профессора Стэнфордского университета Фей-Фей Ли возглавила рейтинги лучших книг об ИИ 📚
ПОСМОТРЕТЬ
Выступление Фей-Фей Ли на TED «Как мы учим компьютеры понимать изображения» 📹
До Нового года остается три недели ⛄️
#AIweek | @hiaimedia
🕊 Grok справляется с real-time данными
Пользователи Grok, нейросети от Илона Маска и Игоря Бабушкина, обратили внимание на одну важную особенность — умение ИИ собирать и обрабатывать данные из интернета в реальном времени (или близко к этому).
На вопрос о том, что интересного сегодня происходит в AI, Grok выдал все главные события дня:
— запуск Gemini от Google;
— нейросеть Meta для генерации изображений;
— чат-бот McDonalds;
— генератор видео от китайского гиганта Alibaba, обученный на данных TikTok;
— новости производства чипов Nvidia;
— даже новость про AI для расшифровки языка китов.
🔝 Если Grok стабильно умеет делать такие real-time саммари — это впечатляет. Повторить ни в ChatGPT с доступом в интернет, ни в Bard, ни в Perplexity даже близко не получилось.
Ранние пользователи отмечали юмор Grok и более «человечные» ответы. Юмор правда специфический — много отсылок к любимой книге Маска «Автостопом по галактикам».
Доступ к Grok могут получить активные пользователи Х с подпиской Plus за $25.
Записались в лист ожидания ⏰
Ссылка на пост в X
#Grok #ElonMusk @hiaimedia
📹 Как сделать саммари YouTube-видео?
Количество видеороликов на YouTube растет с каждой минутой, а времени на их просмотр у нас больше не становится. На помощь приходят сервисы на базе ChatGPT, которые умеют находить и кратко пересказывать самое интересное на видео.
Одним их пионеров отрасли является Eightify, запущенный в начале 2023 года бывшим техническим директором Skyeng Алексом Катаевым. С помощью сервиса сделано уже 1.67 млн саммари 🔥
❓ Как работает Eightify?
Сервис анализирует субтитры к видео, обобщает основные мысли и показывает резюме с таймкодами прямо в окне браузера, где вы смотрите ролик.
▶️ Как начать пользоваться?
1. На сайте Eightify скачайте расширение для браузера. Работает в браузерах Chrome и Safari, есть приложение iOS.
2. Откройте видео на YouTube, под видео нажмите кнопку ⚡️Summary.
3. Рядом с роликом появится окно с саммари. Можно переключаться между режимами с краткими инсайтами и более подробным резюме. Работает на 40 языках.
Неделя бесплатно. Далее — $5 в месяц.
✔️ Eightify также встроен в @GPT4Telegrambot. Чтобы получить инсайты, отправьте боту команду /summary и далее ссылку на видео.
#startup @hiaimedia
🔝Угадайте, кто стал человеком года по версии журнала TIME?
А вот и не угадали! «Человеком года» стала певица Тейлор Свифт, а Сэм Альтман стал CEO года по версии журнала Time.
Журналисты Time называют Альтмана одним из самых могущественных руководителей в мире, публичных персон и пророков технологической революции. Оглядываясь на прошедший год, сам Альтман говорит: «Это было сумасшествие 10 из 10, через которое пришлось пройти. Так что я все еще прихожу в себя после этого».
TIME взял интервью у Сэма Альтмана и 20 людей из его окружения. Рекомендуем почитать.
@hiaimedia
ИИ-сервисы родом из Латинской Америки 🇨🇱🇲🇽🇺🇾
¡Hola a todos! Мы написали этот пост для нашего канала на английском @hiaimediaen, где растет количество подписчиков из Латинской Америки 🌮 Возможно, русскоязычной аудитории тоже будет любопытно.
🔥 Знаете ли вы проекты в области генеративного ИИ, созданные в Латинской Америке? Вот несколько заслуживающих внимания:
🖥 CodeGPT. Инструмент для создания кода от фаундеров из Чили. Это надстройка для Visual Studio Code, которая использует языковую модель GPT-4/3.5 Turbo для создания кода и перевода языков программирования. Почти миллион скачиваний. Среди преимуществ CodeGPT: даже если код фрагментарен, нейросеть дополнит его до рабочего состояния, а для отладки и поиска ошибок система использует обширную базу данных реальных проектов. Поддерживает Python, Java, JavaScript, Ruby, PHP и др. Кстати, проект активно хантит людей в LinkedIn.
🌺 Yana. Стартап из Мексики, использующий генеративный ИИ для психологической помощи людям. Чат-бот, обученный на разговорах с пользователями и клинических кейсах, способен не только приятно побеседовать и порекомендовать различные техники расслабления и КПТ-методики, но и в критической ситуации направить пользователя к психотерапевту. Результат: 13 млн пользователей, 2 млрд разговоров и 35 стран охвата. Работает на английском и испанском языках.
⏸ Flipando.ai. Цифровая платформа из Уругвая обучает пользователей создавать собственные приложения с генеративным ИИ. Flipando не просто конструктор для создания приложений: сначала пользователей обучают и предлагают конкретные знания в той области, в которой они заинтересованы. А затем дают доступ к среде для разработки собственных приложений. По словам фаундеров, благодаря Flipando к концу следующего года только в Уругвае появится порядка 3 млн приложений с ИИ. Доступ к платформе свободный, по предзаписи.
❓ Есть ли еще классные ИИ-компании из Латинской Америки? Поделитесь в комментариях.
#startup @hiaimedia
🇧🇷 В Бразилии впервые приняли закон, написанный ChatGPT. Об этом стало известно после его утверждения.
Закон запрещает брать плату за замену украденных счетчиков. Он был принят в городе Порту-Алегри, на юге страны. Рамиро Розарио, советник местной думы, попросил ChatGPT написать текст. Закон приняли единогласно, и он уже вступил в силу.
🤖 После этого Розарио сообщил, что закон написан чат-ботом. Этот факт вызвал дебаты о последствиях использования искусственного интеллекта в законотворчестве. Розарио сказал, что хотел спровоцировать обсуждение, поэтому выбрал простую и не вызывающую споров тему для своего эксперимента.
В мире создан новый прецедент использования ChatGPT, теперь в области законотворчества ⚖️
Источник
#news @hiaimedia
Как искусственный интеллект повлияет на наше ближайшее будущее?
В дебатах на тему будущего ИИ участвовали сооснователь DeepMind Мустафа Сулейман и историк, автор бестселлера «Sapiens: Краткая история человечества» Юваль Ной Харари. Разговор модерировала главный редактор The Economist Занни Минтон Беддос.
🎯 Навигация по видео
00:00 Введение в дебаты об ИИ
02:04 Будущее ИИ в 2028 году
06:01 Значительные изменения в истории человечества
07:48 Положительный потенциал ИИ
12:24 Влияние на рынок труда и глобальные последствия
17:47 Угроза ИИ для политических систем
22:14 Как технологии влияют на общение и доверие к информации
23:35 Влияние ИИ на выборы и политику в краткосрочной перспективе
24:17 Проблемы регулирования ИИ государствами
25:11 Инициативы самоорганизации и принципы предосторожности
26:24 Чего больше пользы или угроз в развитии ИИ
27:04 10-пунктный план Мустафы Сулеймана по безопасности ИИ
29:13 Создание новых институтов для надзора за ИИ
30:50 Проблемы контроля распространения ИИ
33:09 Геополитическая напряженность и сдерживание ИИ
37:22 Непредсказуемость развития ИИ
Видео, 46 минут, на английском. Можно поставить автоперевод субтитров.
Смотреть здесь
https://www.youtube.com/watch?v=7JkPWHr7sTY
Бонус
Выступление Юваль Ной Харрари «Искусственный интеллект и будущее человечества» на Frontiers Forum.
https://www.youtube.com/watch?v=4IB1PuGc-cE
@hiaimedia
Решаем задачи по математике и физике с @GPT4Telegrambot
🔄 Мы добавили в бот новую разметку, благодаря которой задачи, уравнения и формулы корректно отображаются в ответах GPT.
Ранее, благодаря GPT-4 with Vision, бот научился распознавать изображения.
Что это значит? Можно загрузить страницу учебника и попросить бот решить задачу -> ждем 10 секунд и получаем ответ ✔️
Работает при выборе модели GPT-4.
🔔 Важно: математику и физику полезно и интересно учить самостоятельно, поэтому пользуйтесь с умом 🤓
@GPT4Telegrambot @hiaimedia
📺 Как за 2 минуты создать видео с Runway?
Runway — это платформа для генерации видео и изображений с помощью нейросети.
Gen-2 — ее флагманская модель, предлагающая улучшенные функции генерации видео из текста или изображения.
Runway Gen-2 доступен на сайте или в приложении для iOS. В России работает без VPN.
Как воспользоваться Runway Gen-2
1. Зарегистрируйтесь на сайте Runway или войдите через аккаунт Google или Apple.
2. Нажмите "Start with Image" или "Start with Text".
3. Загрузите изображение или напишите промпт на английском языке
4. Затем можно настроить параметры генерации. Например, как будет поворачиваться кадр и с какой скоростью. Нажмите "Generate" и наслаждайтесь результатом.
🪄Новая фича Motion Brush
Motion Brush позволяет выделять объекты на картинке, которые будут двигаться. Эта функция оказалась настолько популярной, что разработчики Runway даже временно восстановили бесплатный доступ к сервису, чтобы больше пользователей могли её попробовать.
Мы загрузили фотографию Павла Дурова, выбрали его черный плащ, который хотим анимировать, только свистни, он появится — четырехсекундный ролик готов🔼
Здесь видеоинструкция как использовать Motion Brush.
Делитесь в комментариях вашими результатами.
#video | @hiaimedia
✌️ Character.AI — второй по посещаемости AI-сервис, после ChatGPT.
🤖 Что это такое?
Это сервис, где можно в чате общаться с известными людьми или героями из книг и фильмов, как Илон Маск, Джордж Мартин или Гермиона Грейнджер. На платформе есть AI-психологи, учителя и тренеры и еще 18 миллионов чат-ботов.
📈 Character.AI в цифрах
По данным Similar Web, в октябре посещаемость сайта составила более 162 миллионов человек. В среднем пользователи проводят около 34 минут в день, что больше, чем в Instagram, Facebook и ChatGPT.
🔍 Интерес к AI-персонажам со стороны корпораций
В ноябре Reuters написали, что Google ведет переговоры об инвестициях в Character на сотни миллионов долларов. Meta запустила аналогичный проект AI Characters by Meta, где можно взаимодействовать с AI-версиями знаменитостей через Instagram.
💬 Что скажет Маск?
Выберем в списке готовых персонажей Character Илона Маска и узнаем его мнение по разным вопросам. Например, покорение Марса — очень важно, а work-life баланс вообще не имеет значения. Похоже на него :)
🆕 Групповой чат позволяет добавить несколько персонажей.
Кто круче: Илон Маск или Сэм Альтман, пусть решают между собой, а мы послушаем.
💋 Чувствительные темы
Боты могут общаться с вами о самом личном и даже флиртовать, но перейти «границы фильма для взрослых» не даст фильтр NSFW (Not Safe For Work). Впрочем, AI-дейтинг составляет значительную часть трафика Character.
© Свой аватар
Можно создать и обучить своего уникального AI-персонажа: выберите имя, определите атрибуты и развивайте его через диалоги. Адаптация происходит в процессе общения. Если вы создадите персонажа с атрибутами на русском языке, персонаж начнет разговор именно на нем.
Кто тестировал Character.AI? Что думаете по поводу общения с виртуальными персонажами?
🔥 — интересно
🤯 — крипово
@hiaimedia
📣 Привет, друзья! Самое интересное за неделю из мира AI в нашем воскресном дайджесте:
1. Без преувеличения весь мир следил за событиями вокруг увольнения CEO OpenAI Сэма Альтмана. Мы разложили все по полочкам в пьесе «To be or not to be OpenAI CEO?» 🤖
2. Нам посчастливилось побывать на последнем выступлении Сэма Альтмана до его увольнения.
Необычное место: Robot Heart.
Тема: «AI и будущее искусства».
Репортаж из Калифорнии ❤️🔥
3. На TEDAI вышло выступление Ильи Суцкевера, главного научного сотрудника OpenAI, который стоит у истоков ChatGPT 🤖
4. Журналистка Елизавета Осетинская провела очень интересный прямой эфир с инвестором Николаем Давыдовым и братьями Либерманами о причинах конфликта в OpenAI, перспективах появления AGI, и действительно ли он угрожает человечеству? ▶️
5. Читаем журнал The New Yorker, который посвятил номер AI 📰
6. Глубокое исследование AI в документальном фильме iHuman. Становится понятно, как организация ученых-идеалистов OpenAI обогнала Google и Facebook 📺
7. @GPT4Telegrambot научился распознавать изображения. В наш бот добавлена функция GPT-4 with Vision — теперь в запросе можно использовать не только текст, но и изображения 👀
8. Проводим опрос: какую функцию в бот добавить следующей? 📊
Отличного окончания недели 🍀
#AIweek | @hiaimedia
Всем привет! Мы собрали комбо нейросетей для разных задач в @GPT4Telegrambot.
Бот умеет:
— создавать тексты,
— писать код,
— генерировать изображения,
— писать песни и музыку,
— делать саммари из видео,
— распознавать картинки и голос.
❓ Думаем, какую функцию добавить следующей. Проголосуйте, пожалуйста.
🔄 @GPT4Telegrambot научился распознавать изображения
В наш бот добавлена функция GPT-4 with Vision — теперь в запросе можно использовать не только текст, но и изображения, бот их увидит 👀
Как работает?
1. Vision работает при подключенном GPT-4
2. Отправьте в чат картинку (не файл)
3. Если отправить изображение без подписи — бот опишет, что изображено.
4. Если отправить изображение с подписью — бот ответит на вопросы по изображению.
Пример на видео 🔼
Вместе с функцией Vision в пакете GPT-4 доступны:
✔️ генерация изображений DALL•E 3;
✔️ новая модель GPT-4-Turbo-Preview, обладающая знаниями о мире до апреля 2023 года (все остальные — сентябрь 2021).
@GPT4Telegrambot — бот №1 для доступа к нейросетям в Telegram: ChatGPT, GPT-4, DALL•E 3, Midjourney, Suno AI.
— 7 миллионов пользователей;
— 450 тысяч человек ежедневно;
— 2 миллиона генераций текстов в день;
— 10 тысяч изображений в день.
Спасибо, что вы с нами ❤️
To be or not to be OpenAI CEO?
Пьеса в 5 действиях об увольнении Сэма Альтмана
Весь мир следит за событиями, которые стремительно разворачиваются вокруг OpenAI после увольнения Сэма Альтмана. Это технотрагедия шекспировского размаха, которая, мы уверены, в ближайшем будущем экранизируют. Интересно, что будет создано быстрее AGI или новый сериал для Netflix?
🎭 Мы написали сценарий пьесы со всеми ключевыми событиями.
Действующие лица:
• Сэм Альтман — генеральный директор OpenAI
• Илья Суцкевер — главный научный сотрудник и член Совета директоров
• Грег Брокман — президент OpenAI, председатель Совета директоров
• Мира Мурати — технический директор OpenAI, ИО генерального директора
• Сатья Наделла — генеральный директор компании Microsoft
• Эммет Шир — основатель Twitch, популярной платформы для стриминга видеоигр, ИО генерального директора OpenAI
• Адам Д'Анджело — директор Quora, член совета директоров OpenAI
• 778 сотрудников OpenAI
Действие происходит в губернском городе Сан-Франциско.
Читать здесь:
gpt4telegrambot/Sam_fired_and_hired" rel="nofollow">https://teletype.in/@gpt4telegrambot/Sam_fired_and_hired
#OpenAI @hiaimedia