Канал, в котором мы говорим про искусственный интеллект простыми словами Главный редактор и по рекламе: @crimeacs Иногда пишут в канал: @GingerSpacetail, @innovationitsme
С сегодняшнего дня можно использовать картинки для того что бы тюнить модели для зрения
Читать полностью…Показали как GPT-4 звонит в магазин (фэйковый) и заказывает 400 клубник в шоколаде
Читать полностью…Научились делать автопромпты, так же можно автогенерировать функции
Читать полностью…Новая штука - super low latency Realtime api с помощью WebSockets и с сегодняшнего дня будет speech2speech с голосами из ChatGPT
Читать полностью…Показывает как хорошо и приятно использовать o1-mini в Cursor (в режиме Composer). Говорит - вот мол заготовка кодовой базы, давай доделывай
Читать полностью…Пишет приложение для iOS, что то там про отслеживание МКС (которая на орбите)
Читать полностью…Включили записаный ролик с Devin, про то как они успешно используют о1 для значительного улучшения своего Fully Autonomous Software Engineer
Читать полностью…Я на DevDay OpenAI
Устраивайтесь поудобнее, через 17 минут начнется keynote презентация от OpenAI.
Буду рассказывать в этом канале!
https://huggingface.co/glif/how2draw
крайне любопытная lora how2draw
Ценность опенсурса в возможности FT. На апи и подписках зарабатывают и окупают модели еденицы, а ценность которую можно утащить из опенсурса велика - хороший пример это SD комьюнити которое стало автономно от моделей и создало столько инфраструктуры что можно конкурировать с MJ(особенно если знаешь что нужно)
Воскресный трэд:
Напишите в комментарии о чем были ваши 5 последних запросов к AI (не включая запросы по коду).
Я начну:
1. Напиши промпт для того что бы сгенерировать картинку для этого поста
2. Рекомендация кэмпинга с горячими источниками в Калифорнии
3. Рекомендация красивых мест для завтрака по пути на хайк
4. Написать email в службу поддержки, что бы они поменяли мне билеты на мюзикл
5. Рецепт буррито 🌯 для завтрака
Как же прекрасен Claude
Учу иврит, забыл распечатать карточки с глассными на урок. А нас поставили в пары и надо было друг другу показывать слова.
Я не растерялся - ведь у меня есть AI.
За несколько минут Claude сделал мне реально работающее веб-приложение для практики чтения букв!
Вот оно - бесплатно, без регистрации и смс
- o1 использовалась исследователями для создания бота GitHub, который пингует нужных CODEOWNERS для обзора
- Во внутренних тестах o1 задавала себе сложные вопросы для оценки своих возможностей
- Широкие знания о мире добавляются и будут улучшаться в будущих версиях
- Для будущих итераций модели планируются более свежие данные для o1-mini (сейчас октябрь 2023)
Техники и лучшие практики промптинга
- o1 выигрывает от стилей промптов, которые предоставляют крайние случаи или стили рассуждений
- Модели o1 более восприимчивы к подсказкам для рассуждений в промптах по сравнению с более ранними моделями
- Предоставление релевантного контекста в генерации с дополнением извлечением (RAG) улучшает производительность; нерелевантные куски могут ухудшить рассуждения
Общая обратная связь и будущие улучшения
- Ограничения скорости низкие для o1-preview из-за раннего этапа тестирования, но будут увеличены
- Активно ведутся работы над улучшением задержки и времени вывода
Замечательные возможности модели
- o1 может размышлять над философскими вопросами, такими как "Что такое жизнь?"
- Исследователи нашли o1 впечатляющей в её способности справляться со сложными задачами и обобщать на основе ограниченных инструкций
- Способности o1 к творческому рассуждению, такие как самотестирование для оценки своих возможностей, демонстрируют её высокоуровневое решение проблем
Революция в мире ИИ: Что мы узнали о модели O1 от разработчиков OpenAI
Компания OpenAI, известная своими передовыми разработками в области искусственного интеллекта, недавно провела сессию "Спрашивай меня о чём угодно" (AMA), посвященную своей новейшей модели O1. И вот что мы узнали:
O1 — это не просто очередное обновление. Название модели символизирует новый отсчёт в развитии ИИ, начало принципиально нового подхода. Главная особенность O1 заключается в её способности генерировать длинные цепочки рассуждений перед формулировкой окончательного ответа. Как отметил один из разработчиков: "O1 — это не итерация, а смена парадигмы в подходе к рассуждениям ИИ".
Ключевые возможности O1 включают:
1. Продвинутые рассуждения: модель способна создавать скрытые цепочки мыслей, что позволяет ей эффективно решать сложные задачи.
2. Оптимизированные версии: вариант "Мини" разработан для быстрой работы, что расширяет сферу применения модели.
3. Улучшенная работа в области точных наук: O1-мини демонстрирует выдающиеся результаты в задачах, связанных с программированием и точными науками.
Несмотря на впечатляющие достижения, у O1 есть области для совершенствования. Версия "Мини" обладает ограниченными знаниями о мире по сравнению с полной версией. Кроме того, некоторые функции, такие как вызов внешних инструментов, интерпретация кода и просмотр веб-страниц, пока находятся в разработке.
Процесс создания O1 был полон вызовов. Команда столкнулась с серьёзными трудностями при масштабировании модели и оптимизации её способностей к рассуждению. Интересно, что во время внутреннего тестирования O1 демонстрировала способность к самооценке, задавая себе сложные вопросы для проверки собственных возможностей.
Разработчики уделили особое внимание этическим аспектам. Хотя O1 может генерировать длинные цепочки рассуждений, эти скрытые процессы мышления не будут доступны пользователям. Это решение призвано обеспечить баланс между прозрачностью работы системы и безопасностью её использования.
В сравнении с другими моделями, O1 выделяется своим уникальным подходом к рассуждениям и решению задач. В отличие от GPT-4o, производительность O1 в построении цепочек рассуждений не зависит исключительно от промптов. Как пояснил один из разработчиков: "GPT-4o не может сравниться с O1 в рассуждениях только с помощью промптов; архитектура O1 фундаментально меняет правила игры".
Планы по развитию O1 включают:
- Внедрение поддержки внешних инструментов, включая вызов функций и интерпретацию кода.
- Расширение возможностей пользовательского контроля, в том числе над временем обработки запросов и лимитами токенов.
- Развитие мультимодальных возможностей для работы с различными типами данных.
Команда OpenAI рассматривает O1 как важный шаг на пути к созданию ещё более совершенных моделей ИИ. Ведутся исследования новых подходов к масштабированию вычислений, что может привести к значительному прогрессу в будущих версиях.
Потенциал применения O1 огромен: от автоматизации сложных задач программирования до улучшения понимания естественного языка в сфере обслуживания клиентов. Однако разработчики подчёркивают важность ответственного подхода к внедрению таких технологий и продолжают активно обсуждать вопросы безопасности ИИ.
Сессия AMA предоставила уникальную возможность заглянуть в будущее искусственного интеллекта. O1 не просто демонстрирует впечатляющие технические возможности — она знаменует новый этап в развитии ИИ, открывая дорогу к более глубокому и эффективному машинному мышлению. По мере развития этой технологии мы можем ожидать значительных изменений в различных сферах, где применяется искусственный интеллект.
Почитать АМА целиком
Показывает пример приложения с голосом - типа помощник по путешествиям
Читать полностью…Теперь про мультимодальность, пока рассказывает про advanced voice mode
Читать полностью…Подключил управление к дрону и дрон летит (ну о1 код написал, а управлял сам мисье Хуета)
Читать полностью…Говорит что скоро выпустят o1, а не o1-preview. И что она будет лучше в ризонинге.
Reasoning в их определении - ability to have reliable chain of thought
Вышел глава OpenAI платформы и говорит, что не будет ни GPT-5, ни Сэма Альтмана сегодня, но зато будет много общения и встреч с командой OpenAI
Читать полностью…Ученые обнаружили 300 новых геоглифов Наска с помощью компьютерного зрения
Представьте себе пустынное плато, испещрённое огромными древними рисунками, которые можно полностью оценить лишь с высоты птичьего полёта. Это геоглифы Наска в Перу — загадочные фигуры животных, людей и геометрических форм, вырезанные на земле более 2000 лет назад. Десятилетиями археологи искали новые геоглифы, и искали бы еще дольше, если бы не машинное обучение.
Традиционно поиск новых геоглифов напоминал поиск иголки в стоге сена. Археологи полагались на наземные исследования и аэрофотосъёмку, тщательно сканируя обширные области пустыни в поисках едва заметных следов. С учётом пересечённого рельефа и состояния геоглифов, подвергшихся выветриванию за тысячелетия, открытия были редкими и происходили с большой задержкой — в среднем около 18,7 новых геоглифов в год.
В революционном проекте исследователи обратились к компьютерному зрению, чтобы ускорить процесс обнаружения. Они обучили сверточную нейронную сеть — тип модели ИИ, особенно хорошо распознающий изображения — на наборе известных геоглифов. Несмотря на не большое количество примеров, нейросеть смогла выучить характерные особенности и узоры, присущие геоглифам.
Затем с помощью обученной нейросети проанализировали аэрофотоснимки региона Наска, создав "вероятностную карту геоглифов". Эта карта выделяла области с наибольшей вероятностью наличия неоткрытых геоглифов.
Результаты исследования поражают. Всего за один полевой сезон археологи подтвердили обнаружение 303 новых фигурных геоглифов, почти удвоив общее число известных геоглифов рельефного типа. Этот замечательный успех повысил скорость обнаружения с 18,7 до более чем 300 геоглифов в год!
Одной из самых интригующих находок стал небольшой, 9-метровый геоглиф, изображающий человекоподобную фигуру с прямоугольной головой и замысловатыми узорами на теле.
Благодаря обилию новых данных исследователи смогли глубже понять культуру Наска. Они заметили явные различия между геоглифами рельефного и линейного типов. Геоглифы рельефного типа, которые меньше по размеру и труднее обнаруживаются, преимущественно изображают человеческие фигуры, домашних животных, таких как ламы, и сцены из повседневной жизни. В то время как более крупные геоглифы линейного типа в основном представляют диких животных, таких как птицы и обезьяны.
Кроме того, распределение этих геоглифов раскрыло интересные закономерности. Геоглифы рельефного типа часто находились рядом с древними тропами, что позволяет предположить, что они могли служить ориентирами или посланиями для отдельных людей или небольших групп, путешествующих по региону. Геоглифы линейного типа, напротив, были связаны с церемониальными маршрутами, указывая на возможное общинное или ритуальное назначение.
Успех этого проекта с использованием компьютерного зрения имеет существенные последствия для археологии. Он в очередной раз демонстрирует, как технологии могут ускорить открытия, позволяя исследователям выявлять и изучать культурные артефакты, которые могли оставаться скрытыми на протяжении многих лет. Это особенно важно для таких мест, как Наска, где естественная эрозия и человеческая деятельность представляют угрозу для этих древних чудес.
Этот проект знаменует поворотный момент в том, как мы исследуем и осмысливаем наше прошлое. Как отметил один из исследователей: "С помощью искусственного интеллекта мы теперь можем обнаруживать и сохранять древние сокровища с ранее немыслимой скоростью".
Интеграция ИИ в археологические исследования не заменяет необходимость в человеческой экспертизе; напротив, она её усиливает. Поручая компьютерному зрению трудоёмкую задачу обработки огромных объёмов данных, мы позволяем археологам сосредоточиться на анализе и интерпретации, что ведёт к более глубоким инсайтам и большему пониманию истории человечества. По мере развития искусственного интеллекта, кто знает, какие ещё секреты наших предков мы сможем раскрыть?
📷 Статья
Эра Искусственного Интеллекта: Как ИИ преобразит нашу жизнь
Краткое изложение эссе Сэма Алтмана, генерального директора OpenAI
В ближайшие десятилетия мы станем свидетелями технологического прорыва, который наши предки сочли бы волшебством. Искусственный интеллект (ИИ) ускоряет прогресс, предоставляя нам инструменты для решения самых сложных проблем человечества.
Потенциал человечества определяется не генетикой, а накопленным опытом общества. ИИ уже стал частью этого коллективного знания и помогает создавать то, что раньше казалось невозможным.
В скором времени у каждого может появиться личная команда ИИ-помощников — виртуальных экспертов в различных областях, готовых воплотить практически любую идею. Наши дети будут учиться с помощью виртуальных наставников, получая знания в удобном темпе и на любом языке. ИИ произведет революцию в здравоохранении, науке и технологиях.
Чтобы ИИ стал доступным для всех, необходимо снизить стоимость и повысить доступность вычислительных мощностей. В противном случае ИИ рискует стать ресурсом только для избранных, что может привести к конфликтам и усилению неравенства.
Разумеется, нас ждут и трудности. ИИ изменит рынок труда, но люди всегда будут стремиться к творчеству и желанию быть полезными друг другу. Мы вступаем в эпоху безграничных возможностей и должны разумно управлять связанными с ней рисками.
Будущее сулит невероятный прогресс. Решение проблем изменения климата, освоение космоса, новые научные открытия — все это может стать реальностью. Имея в своем распоряжении практически безграничный интеллект и энергию, мы способны достичь многого.
Как наши предки не могли представить современный мир, так и мы не можем вообразить, что ждет нас через столетие. Однако одно несомненно: ИИ открывает дверь в новую эру возможностей для всего человечества.
Читать эссе целиком
Мы наконец открыли набор на осенний семестр Deep Learning School!
DLschool — это школа при ФПМИ МФТИ, где мы учим нейронным сетям с самых азов до продвинутого уровня. Полный курс состоит из двух частей, каждая из которых длится полгода.
- Первая часть посвящена введению в нейросети и компьютерному зрению. Начинаем с основ машинного обучения и нейросетей, переходим к CNN для обработки картинок, заканчиваем переносом стиля изображений и ГАНами. В этом семестре мы улучшили многие занятия, записали новые версии лекций и семинаров и обновили домашки.
- Вторая часть полностью посвящена обработке естественного языка (NLP). Начинаем с эмбеддингов слов и заканчиваем GPT-2,3, RLHF, RAG и другими актуальными темами вокруг LLM.
Сейчас идет набор на оба потока обучения — часть 1 (введение в DL + CV) и часть 2 (NLP).
Особенность нашей школы в том, что мы даем много практики (теория при этом тоже есть, разумеется, и немало). Вам предстоит много практических домашних заданий и самостоятельный итоговый проект в конце семестра. По окончании обучения вы точно получите нужные практические навыки работы с нейросетями. Больше информации об организации курса и программы обучения можно найти тут.
Преподаватели школы — ведущие специалисты российских и зарубежных IT-компаний и научные сотрудники исследовательских лабораторий. Среди них — я (Таня), буду вести у вас несколько лекций в обеих частях курса.
Школа бесплатная. Полностью онлайн: учиться можно из любой точки мира, где есть интернет. Занятия проходят раз в неделю — лекция, семинар и домашнее задание. Обучение проходит на платформе Stepik. Берем всех, отбора нет.
❗️Для первой чати курса также есть возможность приобрести дополнительный пакет, в который входит индивидуальная поддержка от менторов и преподавателей в прохождении курса, а также дополнительные вебинары. Подробнее о нем читайте на нашем сайте.
Старт обучения — 21 сентября. В этот день откроется первое занятие и будет живой вводный вебинар.
Чтобы зарегистрироваться на курс, нажмите на кнопку "поступить" на нашем сайте.
Ссылки:
Наш сайт
Подробная программа и оргинформация обоих частей курса
Ответы на часто задаваемые вопросы (F.A.Q)
Наш YouTube (тут видео всех лекций и семинаров школы, а также открытые лекции и интервью)
Наша группа VK
🧡 Поддержать нашу школу на Boosty
Если остались вопросы, пишите нам на почту (dlphystech@gmail.com) или в комментарии под этим постом.
Ждём вас в чатике курса в новом семестре!
Итоги AMA с командой OpenAI o1
Названия моделей и парадигма рассуждений
- OpenAI o1 названа так, чтобы отразить новый уровень возможностей ИИ; счётчик сброшен на 1
- "Preview" указывает на то, что это ранняя версия полной модели
- "Mini" означает меньшую версию модели o1, оптимизированную для скорости
- o - как OpenAI
- o1 не "система"; это модель, обученная генерировать длинные цепочки мыслей перед выдачей окончательного ответа
- Иконка o1 метафорически представляет собой пришельца с необычайными способностями (виза О1)
Размер и производительность моделей o1
- o1-mini намного меньше и быстрее o1-preview, поэтому в будущем будет предложена бесплатным пользователям
- o1-preview - ранняя контрольная точка модели o1, размер тот же
- o1-mini лучше справляется с задачами STEM, но имеет ограниченные знания о мире
- o1-mini превосходит o1-preview в некоторых задачах, особенно связанных с кодом
- Входные токены для o1 рассчитываются так же, как для GPT-4o, используя тот же токенизатор
- o1-mini может исследовать больше цепочек мыслей по сравнению с o1-preview
Контекст входных токенов и возможности модели
- Скоро появятся бóльшие входные контексты для моделей o1
- Модели o1 могут справляться с более длинными, открытыми задачами с меньшей необходимостью разбивки входных данных по сравнению с GPT-4o
- o1 может генерировать длинные цепочки мыслей перед предоставлением ответа, в отличие от предыдущих моделей
- В настоящее время нет возможности приостановить вывод во время CoT для добавления дополнительного контекста, но это изучается для будущих моделей
Инструменты, функциональность и предстоящие функции
- o1-preview пока не использует инструменты, но планируется поддержка вызова функций, интерпретатора кода и браузер
- В будущих обновлениях будут добавлены поддержка инструментов, структурированные выходные данные и системные промпты
- В будущих версиях пользователи, возможно, получат контроль над временем размышления и ограничениями токенов
- Ведутся работы по включению потоковой передачи и учёта прогресса рассуждений в API
- Мультимодальные возможности встроены в o1, нацелены на наилучшую производительность в задачах типа MMMU
Рассуждения CoT (Chain of Thought)
- o1 генерирует скрытые цепочки мыслей во время рассуждений
- Нет планов раскрывать токены CoT пользователям API или ChatGPT
- Токены CoT суммируются, но нет гарантии верности реальному ходу рассуждений
- Инструкции в промптах могут влиять на то, как модель думает о проблеме
- Обучение с подкреплением (RL) используется для улучшения CoT в o1, и GPT-4o не может сравниться с его производительностью CoT только через промпты
- Этап размышления кажется медленнее, потому что он суммирует процесс мышления, хотя генерация ответа обычно быстрее
API и ограничения использования
- o1-mini имеет еженедельное ограничение в 50 промптов для пользователей ChatGPT Plus
- Все промпты в ChatGPT считаются одинаково
- Со временем будут введены новые уровни доступа к API и более высокие ограничения
- Кэширование промптов в API - популярный запрос, но сроки пока не определены
Ценообразование, файнтюнинг и масштабирование
- Ожидается, что цены на модели o1 будут следовать тенденции снижения каждые 1-2 года
- Batch ценообразование API будет поддерживаться после увеличения ограничений
- Файнтюнинг в планах, но сроки пока не определены
- Масштабирование o1 ограничено исследовательскими и инженерными талантами
- Новые парадигмы масштабирования для вычислений могут принести значительные выгоды в будущих поколениях моделей
Разработка модели и исследовательские выводы
- o1 была обучена с использованием обучения с подкреплением для достижения производительности в рассуждениях
- Модель демонстрирует творческое мышление и высокую производительность в нестандартных задачах, таких как поэзия
- Философские рассуждения o1 и способность к обобщению, например, расшифровка шифров, впечатляют
Готовы познакомиться с нуля с машинным обучением для реальных задач?
19 сентября Mathshub запускает бесплатный курс, где вы изучите практическую работу с алгоритмами, используемыми в скоринге, рекомендательных системах, компьютерном зрении, ChatGPT и автопилотах.
Программа курса
1. Оптимизация и внедрение ML-моделей, работа с pipeline, предобработкой данных и кросс-валидацией
2. Библиотеки PyTorch, NLTK, sklearn для повышения производительности
3. Реализация нейросетей, разработка классификационной модели для компьютерного зрения
Живые сессии, практические задания, финальный проект и сертификат по окончании.
Преподаватель
Олег Булыгин — Data Scientist с 7-летним опытом в космической отрасли и 6-летним преподавательским стажем. Специалист по внедрению ML-решений в реальных проектах.
О Mathshub
Международная школа с более чем 40 000 студентов. 93% завершения курсов, средняя оценка 9/10, более 3 000 выданных сертификатов. Индивидуальный подход и акцент на практическое обучение.
🚀 Регистрация уже открыта!
#реклама