nn_for_science | Unsorted

Telegram-канал nn_for_science - AI для Всех

14681

Канал, в котором мы говорим про искусственный интеллект простыми словами Главный редактор и по рекламе: @crimeacs Иногда пишут в канал: @GingerSpacetail, @innovationitsme

Subscribe to a channel

AI для Всех

Международный онлайн саммит про разработку в сфере ИИ

Лучшие практики для разработчиков, ресерчеров, дата сайентистов, техлидов и фаундеров – от ведущих мировых экспертов из индустрии ИИ.

Выступят спикеры из:
Microsoft (команда PromptFlow)
D-ID
Aisera
Spectrm
Lightricks
Wrike
и других компаний-лидеров, которые прямо сейчас создают будущее искусственного интеллекта.

На саммите обсудят темы:
— How to build scalable GenAI Apps using prompts
— Data-driven approaches to personalizing AI Agents
— Crafting AI agents with a natural user interface
— Building robust & scalable AI-powered chatbots;
— The reality of being an AI Founder in 2024
— How Later Stage Companies Adopted AI
— Creating your own corporate-secured "ChatGPT" with almost zero specific knowledge
— Fine-tuning strategies for adapting pre-trained AI Agents to specific use cases,
и многое другое!

Конференция пройдет в ОНЛАЙН формате 16➖17 апреля на английском языке 🌎

Участникам будут доступны презентации, материалы воркшопов и записи, а также доступ в нетворкинг-чат.

Скидка 1️⃣0️⃣ % по промо-коду — osHMmof

Регистрация через VPN

#реклама

Читать полностью…

AI для Всех

OpenAI только что релизнули старую версию GPT-3.5 на Hugging Face

В Америке сейчас Пасха, и у многих сотрудников отпуска и выходные. OpenAI, видимо в преддверии релиза GPT-5, выложили в открытый доступ веса GPT-3.5. Ждём подробностей от сообщества.

🤗 веса

Читать полностью…

AI для Всех

Случайно проходил мимо

В окрестностях Open AI - островок нормальности по средине Mission district.

Вайб тут такой. А в нашей реальности происходит мрак.

📍Карта
🎧 Soundtrack

Читать полностью…

AI для Всех

Чайник из Юты

Сегодня, хочу вам рассказать про любопытнейший артифакт, который я на днях заметил в Музее Истории Компьютеров (Mountain View, CA).

Чайник из Юты, также известный как чайник Ньюэлла, является важной частью компьютерной графики. Созданный в 1975 году Мартином Ньюэллом, аспирантом из Университета Юты, он послужил универсальной тестовой моделью для ранних алгоритмов рендеринга.

Его выбор был обусловлен геометрической сложностью и узнаваемостью. За годы своего существования "Чайник из Юты" стал символическим эталоном, иллюстрирующим прогресс от простых wireframe моделей до современных сложных, фотореалистичных 3D-рендерингов.

Чайник из Юты до сих пор остается культовой эмблемой в сообществе цифровой визуализации, символизируя пересечение технических инноваций и художественного выражения.

Обязательно сходите в этой музей! Там много всего интересного

Читать полностью…

AI для Всех

Илон Маск и x.ai опубликовали веса Grok-1

Grok-1 это ИИ для платных подписчиков Твиттера, который по задумке создателя, должен функционировать как ИИ из книги «Автостопом по галактике». Модель из себя представляет огроменный Mixture of Experts на 314 млрд параметров. Мне пока такое проверит не на чем, так что подождём недельку и 100% увидим креатив от OSS сообщества, по сжиманию весов.

🎂 Анонс
💿 Код

P.S.: не нашел их random seed, но надеюсь он 42

Читать полностью…

AI для Всех

Я попробовал Apple Vision Pro

В Америке AVP можно попробовать в любом Apple Store. Работает это так: на сайте Apple выбираешь доступное время в удобном салоне, и бронируешь демо заранее (в моем случае за один день было норм).

На демо, просят взять с собой очки для зрения (если носите), их прямо на месте сканируют и по результатам выдают специальные оптические вставки для AVP.

Само демо длиться ~30 минут и начинается с основ управления. Управлять реально легко - смотришь и делаешь щипок пальцами. Через несколько минут уже чувствуешь себя уверенно.

На демо сначала показывают фотки, видео, панормы и spatial video. Потом учат пользоваться виртуальными средами и наконец дают посмотреть immersive video - и это реально вау 🤩. Ощущение как будто бы ты реально там! Вообще слово вау, я кажется говорил каждые пару минут.

Еще я попросил включить мне демо с динозаврами, и это тоже прям очень круто! 🦖

В целом, прибор мне понравился, но наверное я подожду 2-3юю версию, перед тем как покупать. Не то что бы с этим что-то не так, просто зная Apple, следующие несколько итераций будут самыми значительными.

Читать полностью…

AI для Всех

Илон хайпует на OpenAI and OpenAI хайпует на Илоне в соцсети, которая принадлежит Илону 🐕

И мы поXайпуем

Читать полностью…

AI для Всех

ML на графах в задаче e-commerce

Сегодня у нас пост присланный подписчиком: @marinadkntm (спасибо 🤩)

Допустим, мы решаем задачу поиска одинаковых товаров в онлайн-магазине.

Классический подход:
1. Подбор кандидатов. На этом этапе используется грубый, но быстрый алгоритм для подбора большого количества схожих объектов, потенциальных пар
2. Проверка пар моделью (т. н. матчинг) — более точная проверка того действительно ли в паре одинаковые объекты

У объекта может быть более одного дубликата, и хочется их объединять в одну группу, один кластер.

Просто склеить все найденные пары в один кластер — не лучшая идея, поскольку предсказания модели на 2 этапе имеют не нулевой процент ошибок.

На помощь приходит community detection (поиск сообществ), который представляет собой кластеризацию на графах.

В случае с товарами можно построить из них граф, рёбра между которыми будут соответствовать предсказанию модели, что товары являются дубликатами. На таком графе community detection поможет выделить группы одинаковых товаров.

Некоторые преимущества такого подхода:
1. Не нужно подбирать гиперпараметры. Например, задавать количество кластеров

2. Скорость. При таком подходе нет необходимости считать расстояние каждого объекта с каждым.

3. Масштабируемость. Можно запускать на больших графах параллельно на множестве executors

4. Self-supervised и Semi-supervised подходы. Задачу можно решать как при отсутствии какой-либо информации о кластерах, так и при заданной на части вершин информации о сообществах

Читайте подробнее про алгоритмы кластеризации на графах в:

📕 Статья на Habr

Читать полностью…

AI для Всех

Mars Dune Alfa: NASA набирает добровольцев для симулированной годовой миссии на Марс

NASA ведёт второй набор на самую эксклюзивную вакансию – марсианин.
Участники будут жить в закрытом пространстве, имитирующем условия на Красной планете, проводить научные исследования, выполнять космические задачи (например, симуляцию выходов в космос и роботизированные операции), изучать воздействие длительного пребывания в изоляции, тем самым формируя основу для реальных миссий.

Условия для жизни и работы:
🌌Площадь: ~ 160 кв м
🌌Материал: Лавакрит (Lavacrete) от ICON прочностью 140-245 атмосфер (2000-3500 psi)
🌌Четыре частные каюты для членов экипажа
🌌Рабочие станции
🌌Медицинская станция
🌌Общие зоны отдыха
🌌Кухня и площадка для выращивания пищи
🌌Сутки 24 часа 37 мин 22 сек

Бонусы:
🌌ограниченные ресурсы,
🌌сбои оборудования,
🌌задержки связи,
🌌стрессовые факторы окружающей среды: низкое давление, пыльные бури и прочие марсианские особенности,
🌌З/п по результатам собеседования, но, скорее всего, 60к/год

Требования:
☕️30-55 лет
🚀Английский язык
⭐️Гражданство или пмж США
🤩степень магистра STEM (инженеры, математики, биологи, физики, ИТ) + 2 года профессионального опыта в STEM или 1 тыс часов пилотирования самолета;
🧜‍♀️или 2 года на PhD, диплом врача или летчика-испытателя
✌️или бакалавриат STEM + 4 года опыта работы

Про песчаных червей и спайс (я про меланж, если что) не говорят.
Может, название просто так выбрали, а может, подразумеваются сюрпризы. Если пригласят собеседоваться, спросите, плз?

Почему это действительно важно: миссия поможет лучше понять, как люди могут адаптироваться к долгосрочным космическим путешествиям, в т.ч освоению Луны.

🌌 Заявки принимаются до 2 апреля 2024 года

Читать полностью…

AI для Всех

Иногда я пишу в x.com

Читать полностью…

AI для Всех

Дисней купил себе AI голоса для озвучки и дубляжа

У Диснея (одной из самых больших корпораций в мире с оценкой 200 млрд $) есть свой собственный акселератор для стартапов.

Сегодня анонсировали, что в этот акселератор была принята компания ElevenLabs, которая занимается разработкой AI голосовых услуг (например Text-to-speech или дубляж видео в оригинальном голосе, но на новом языке).

Еще совсем недавно, они кстати запустили программу по лицензированию голосов, а теперь стало понятно кто будет главы и покупателем.

Остальные компании в списке, кстати, тоже очень интересные

Анонс

Читать полностью…

AI для Всех

Google выпустил опенсорс версию Gemini

Новую модель Гугла, с открытыми весами и коммерческой лицензией, зовут Gemma. LLM доступна в 2х вариантах - 2B (работает на телефоне) и 7B (gpu).

7B модель по качеству обгоняет Мистраль 7B v0.1 и почти догоняет Llama 2 70B (на LLM Leaderboard).

Дать задание Instruct модели можно тут

Обратите внимание, что это (пока что) не чат-бот, а модель которой нужно давать инструкции (например напиши email)

🤗
Блог-пост
🖥 Блог-пост

Читать полностью…

AI для Всех

Вы уже активно используете плоды работы ИИ (искусственного интеллекта), даже не задумываясь об этом:
навигатор простраивает вам маршрут,
онлайн-кинотеатр рекомендует фильмы в разделе "вам понравится",
чат-боты отвечают на ваши вопросы
- и это лишь верхушка айсберга.

Сделала подборку топовых онлайн-курсов для тех, кто решил разобраться в новом всемирном тренде и понять принципы работы ИИ.

Introduction to Generative AI

Introduction to Large Language Models
Нейронные сети и их применение в научных исследованиях
Introduction to Artificial Intelligence (AI)
AI Foundations for Everyone Specialization
HarvardX: CS50's Introduction to Artificial Intelligence with Python

***
Подбор индивидуальной программы обучения от Полины Кривых

Гайд, как бесплатно проходить курсы на Coursera

Читать полностью…

AI для Всех

Сегодня слишком много новостей

Читать полностью…

AI для Всех

Андрей Карпаты ушел из OpenAI

Андрей Карпаты, знаменитый исследователь искусственного интеллекта и один из основателей OpenAI, покинул компанию 12ого февраля 2024 года.

Говорит, что ушел не почему то конкретному, и что вообще ему нравилось тусоваться в OpenAI.

Из его сообщения можно предположить, что он ушел разрабатывать LLM OS (и видимо в ближайшем будущем, не стоит ждать этого направления от OpenAI).

Обещает не забрасывать свои видео-лекции (в комментах написал что уже работает над новой).

Ну что ж, будем посмотреть 👀

Х

Читать полностью…

AI для Всех

На канале 3Blue1Brown вышло видео объясняющее что же такое GPT. Очень приятное.
Я выставил в настройках русские субтитры, и мне стало еще понятнее :)

https://www.youtube.com/watch?v=wjZofJX0v4M

Читать полностью…

AI для Всех

YOLO-World: обнаружение объектов в реальном времени без ограничений по категориям (почти)
 
Уже два месяца, как YOLO-World среди нас, но у меня только сейчас до нее дошли руки.
YOLO знаменитая серия детекторов которым достаточно "взглянуть только один раз", чтобы найти нужный объект. Одно «но» - их надо было обучать и дообучать заранее предопределенным категориям. В Tencent AI Lab объявили, что нашли способ обойти это ограничение.
 
Секрет в RepVL-PAN - перепараметризуемой сети агрегации зрительно-языковых путей для создания пирамиды признаков. Текстовые эмбеддинги могут быть перепараметризованы в веса сверточных или линейных слоев во время деплоймента.
 
Звучит классно, ведь больше не нужно собирать свой датасет. Проверила на рабочих картинках и загрустила: YW не может zero-short обнаружить ничего на лабораторных снимках… И на рентгене не нашла даже костей. Поэтому пока оставлю кастомную YOLOv8.
 
Если вам пригодилось, поделитесь? Может, кто-то, напр, трещины в бетоне детектил

👾Github
📖Paper
🎬Official
🤗Hf

Читать полностью…

AI для Всех

А вот и Grok на консьюмерском железе: https://x.com/ibab_ml/status/1771340692364943750?s=46&t=LyC3cTf6saYBOGwroEuLcg

Читать полностью…

AI для Всех

Top-10% статьей, которые скачали в 2022 году (в журнале JGR: Solid Earth).

Сегодня получил неожиданную ачивку (особенно учитывая, что на дворе середина 2024 года).

Оказывается, моя статья про разделение сейсмических сигналов вошла в топ 10% самый скачиваемых статьей в журнале JGR: Solid Earth.

Суть статьи заключается в следующем:

Мы адаптировали метод разделения сигналов Dual-Path Recurrent Neural Network (DPRNN), изначально предложенный для обработки речи, для применения к сейсмическим данным.
Обучив нейросеть на датасете STEAD, мы продемонстрировали возможность: (a) очистки сейсмических записей от шума (denoising) (b) разделения нескольких наложенных друг на друга сейсмических сигналов (source separation)
Такое разделение сигналов на одноканальных записях может найти применение во многих задачах сейсмологии - анализе афтершоков, seismo-acoustics, ambient томографии и др.

Мы показали, что машинное обучение способно успешно разделять сигналы даже в случае их значительного перекрытия по времени и частоте, когда традиционные подходы неэффективны.

📖 Статья
🖥 Код

Читать полностью…

AI для Всех

OpenAI показали свое первое демо совместно с Figure

🎧 Смотреть со звуком!

Недавно, OpenAI анонсировали свое партнерство с Figure - компанией производящей роботов. И вот появилась первая демонстрация.

В настоящий момент, GPT взяла на себя функции восприятия и интерфейса - то есть OpenAI воспринимает сенсорную информацию и передает ее роботу, внутренний (спинной?) мозг которого превращает эту информацию в движения (контроль). Так же, OpenAI берет на себя функцию общения с человеком.

Судя по видео - GPT-4V крутится на сервере, а не на самом роботе, но с развитием маленьких языковых и мультимодальных моделей несложно увидеть будущее (пару месяцев), в котором все происходит на самом роботе.

Ждем ответочку от Илона и Оптимуса с Гроком!

X.com

Читать полностью…

AI для Всех

Пока я все еще не могу войти в режим и снова писать посты каждый день, добавляйтесь в мои другие соцсети:

🌟LinkedIn
🌟x.com

Читать полностью…

AI для Всех

Антропик анонсировали Claude 3

Один из основных конкурентов OpenAI, про который уже все успели подзабыть на фоне бесконечного потока AI новостей, опубликовал свою новую языковую модель - Claude 3.

Судя по проиллюстрированным бенчамаркам, модель обходит GPT-4. В виду того, что Claude 3 уже доступен в API, думаю что мы скоро увидим в деле, так ли он реально хорош.

Помимо понимания текста, модели доступно зрение (image comprehension).

🖥️ Почитать подробнее
📟 Попоробовать Claude 3

Читать полностью…

AI для Всех

Важные личные новости🗞️

Мне дали О1 (Виза талантов) в США 🇺🇸 а это значит, что пора сказать до свидание академии, и окунуться в реальный мир 🌍

Напишу об этом еще много слов, а пока выдыхаем

Читать полностью…

AI для Всех

Последнее недели совсем не остается энергии на канал. Но поделюсь свежими трендами: вот сколько людей собирает митап по AI infra для real-time Voice AI 🤖

На фото офис Cloudflare

Читать полностью…

AI для Всех

Методы уменьшения размерности

Какое-то время назад, мы с вами чатились про методы уменьшения размерности. Предлагаю продолжить обсуждение, но в этот раз предметнее:

1) Какие есть бенчмарки, что бы установить что метод X и впрямь самый лучший?

2) Как насчет скорости? Какие самые быстрые методы вы знаете?

3) Самые быстро развивающиеся методы? (Я зашел на гит нескольких вариантов umap и парочку tsne, везде комми там по паре лет, я что-то упустил и все пользуются чем то новеньким?)

Картинка: только что сфоткал в ботаническом саду Сан Франциско

Читать полностью…

AI для Всех

Авиакомпания попала на деньги из за галлюцинации AI модели

Интересный прецедент из Канады, где суд встал на сторону пассажира, которому чат-бот AirCanada пообещал вернуть деньги.

После смерти бабушки Джейк Моффат зашел на сайт Air Canada, чтобы забронировать рейс из Ванкувера в Торонто. Неуверенный в правилах авиакомпании, он открыл чат-бота и задал ему вопрос.

Чат бот ответил, что пассажир имеет право на частичное возмещение тарифа в случае путешествия на похороны родственника.

К его удивлению, запрос на возврат средств был отклонен по причине того, что предоставленная чат-ботом, была неверной.

Дело дошло до суда, где аргумент авиакомпании о том, что чат-бот — это отдельное юридическое лицо, которое несет ответственность за свои действия, суд не убедил. Также гуманный канадский суд не убедил аргумент о том, что клиент никогда не должен доверять информации в чат боте.

В итоге, пассажир выиграл право на свою компенсацию, плюс покрытие всех судебных издержек.

Вообще это огромный прецедент. Так что если используете чат боты, скажите им чтобы особо не болтали, иначе за их креативность придется платить вам

✈️ Статья

Читать полностью…

AI для Всех

OpenAI Forum: платформа для формирования будущего ИИ с учётом вашего мнения

Форум – это инициатива OpenAI, объединяющая экспертов, исследователей и студентов для сотрудничества и (условно) совместной лепки искусственного интеллекта на благо всего человечества. На мой взгляд, круто, что OpenAI решили спросить человечество, в чем это благо.

Участники получат доступ к мероприятиям, к сети экспертов, включая исследователей и технологов OpenAI, а также возможность участия в исследовательских проектах OpenAI (за вознаграждение).

Цель - построить экосистему сотрудничества и создать площадку для обсуждения и формирования вариантов взаимодействия ИИ с различными областями жизни общества. Хочется верить, что самых разных областей - от запуска космических кораблей до юмора и флирта. Поэтому не стесняйтесь дропнуть заявку, ладушки?

Критерии для присоединения:
⁃ возможность уделять по часу времени в квартал на участие в мероприятиях,
⁃ демонстрируемая экспертиза в своей профессиональной области или академической дисциплине,
⁃ интерес на пересечении своего экспертного домена и ИИ. Например, к техническим и/или этическим вопросам.

Заявки рассматриваются на постоянной основе, потому что эта инициатива про максимальную представленность, инклюзивность и внимание к разнообразными точками зрения.

Подать заявку можно по ссылке

Читать полностью…

AI для Всех

Как обещал, пост про интересное применение длинного контекста в новой Gemini Pro v1.5

Google доучили свою модельку работать с миллионом токенов (GPT-4 поддерживает 128 тысяч, Claude 2 200 тысяч), причём, мультимодальных — то есть это могут быть и раскадровки видео, и текст, и просто набор изображений. Сюда влезет вся «Война и мир», наконец-то!

Но каждый раз когда мы говорим про длинный контекст встаёт вопрос: а он вообще работает? И какие возможности открывает? Я не буду отвечать на второй вопрос, но постараюсь пересказать пример ответа на первый — ведь это один из самых интересных пунктах в демках Google. И связан он с переводом каламанга. Каламанг — это язык, на котором говорят менее 200 человек (не тысяч, просто человек) в западной части Новой Гвинеи, на востоке индонезийского Папуа. Каламанг почти не представлен в Интернете, и любая модель просто не будет его знать — как и профессиональный лингвист.

Однако недавно был предложен бенчмарк по оценке навыков перевода модели с помощью 573-страничной книги лингвистки Eline Visser. В своей работе «A Grammar of Kalamang» она описывает правила языка, его устройство, часто используемые фразы итд. Это уникальный артефакт, позволяющий другим лингвистам с книжкой в одной руке и табличкой «слово -> перевод» в другой за несколько часов разобраться в языке и начать хоть как-то его переводить. Без контекста (книга+словарь) модель Gemini Pro v1.5 делает переводы, сравнимые по качеству со случайным гаданием.

Идея: давайте в промпт языковой модели положим и всю книгу от корки до корки, и словарик, и затем попросим LLM перевести текст либо с каламанга на английский, либо наоборот.

Тогда качество переводов становится сравнимым с качеством перевода человека, который работал с теми же материалами (в рамках бенчмарка им отводилось до 10 часов на перевод определенных текстов). Метрики вышли даже чуть выше, чем у кожаных, что, как предполагают авторы, модель очень эффективно утилизирует контекст, используя знания из книги на полную для выполнения сложной интеллектуальной задачи.

Так как в лабораториях Google тестируется модель на 10M токенов (20-30 книг и учебников?), то можно предположить, что качество перевода для очень редких и малоизученных языков в ближайшие полгода оооооочень сильно скакнёт.

Если вам интересно, как можно сделать такой длинный контекст, то отсылаю вас к этой работе, вышедшей за пару дней до гугловской, и по сути показыающей те же самые навыки (но применительно к видео и точности поиска в контексте).

Читать полностью…

AI для Всех

Infinite Craft: игра, с LLM в качестве движка

Давным давно, во времена, когда я учился в школе и скучал на уроках, была такая игра - надо было соединять элементы и из них получались новые (кто вспомнит название - пишите).

Так вот, на днях, кто-то сделал реанимировал ее с помощью языковых моделей.

Как играть:
Нажимаем на 2 элемента -> они соединяются в новый (конечно же, что за новый элемент, решает Мистраль на серверах together.ai). Местами получается очень даже забавно.

🦝 Играть

Читать полностью…

AI для Всех

Заработай на своем баритоне

ElevenLabs представляет программу лицензирования голоса, открывающую возможности для монетизации вашего голоса. Если у вас какой-то особенный голос - то это ваш шанс не только оставить свой след в мире цифровых технологий, но и получить пассивный доход.

Как это работает? Процесс прост: вы предоставляете образцы своего голоса, после чего специалисты ElevenLabs используют передовые технологии для его клонирования. Ваш цифровой голосовой двойник затем размещается в специализированном магазине ElevenLabs, где его могут приобрести или арендовать для различных целей – от создания контента до использования в качестве голоса виртуального ассистента.

Кажется что это возможность заработать на своем голосе. Каждый раз, когда кто-то покупает или берет в аренду ваш голос, вы получаете роялти. Это открывает потенциал для постоянного дохода без дополнительных усилий со стороны владельца голоса.

🎤 Сдать свой голос

Читать полностью…
Subscribe to a channel