Искусственный интеллект, нейросети, машинное обучение Разместить рекламу: @tproger_sales_bot Правила общения: https://tprg.ru/rules Другие каналы: @tproger_channels Сайт: https://tprg.ru/site Другие наши проекты: https://tprg.ru/media
Новаторский подход для языковых моделей — StreamingLLM
Стандартные языковые модели плохо работают с очень длинными текстами, требуя много памяти. Это ограничивает их применение в задачах с потоковым вводом текста.
Новый подход StreamingLLM решает эту проблему. Он основан на том, что модели сильно опираются на несколько первых токенов. Поэтому в StreamingLLM сохраняются состояния этих ключевых токенов вместе с состояниями недавних. Это позволяет эффективно применять языковые модели к очень длинным текстам (до 4 млн токенов), решая проблему памяти.
Репозиторий на GitHub: https://github.com/mit-han-lab/streaming-llm
#статья #streamingllm
появилась нейросеть, которая обучает роботов
Новый ИИ от NVIDIA называется Eureka — он обучает роботов точности при выполнении сложных задач.
Компания показала первые навыки, которыми овладела машина с помощью нейросети: механическая рука может вращать в пальцах ручку также плавно и быстро, как человек. Ещё Eureka научила роботов открывать ящики, подбрасывать мяч, пользоваться ножницами и другим действиям, их около 30.
Для этого нейросеть автономно пишет алгоритмы, которые потом ложатся в основу обучения. Сама Eureka работает на базе GPT-4. В NVIDIA сообщают, что алгоритмы ИИ на 80% эффективнее, чем программы, написанные специалистами.
Так, где там ручка? Нужно кое-что проверить...
Приглашаем на «Большую дату» — митап для аналитиков и дата-сайентистов в Москве
На нём вы обсудите последние новости мира аналитики данных, посмотрите на реальные кейсы и их решениями. Будут спикеры из разных команд Яндекса:
— Андрей Молотов, старший аналитик-разработчик. Расскажет, как предсказать отток сотрудников и уменьшить его с помощью ML-моделей и экспериментов.
— Яна Кузнецова, руководитель группы платёжной аналитики. Объяснит, что такое FinOps и какую роль играет аналитика в C2B-платежах Яндекса.
— Владислав Енин, менеджер проектов. Поделится историей о повышении конверсии платежей в Маркете.
— Кирилл Черкашин, старший аналитик-разработчик. Объяснит, с какими сложностями столкнулись ребята при разработке NLP-пайплайна в модерации рекламы и как их решали.
— Александр Самусенко, руководитель группы развития рекламных продуктов и стабильности. Расскажет, что такое аналитика ранжирования и зачем она нужна.
После докладов вы сможете отдохнуть, сыграть в «Сто к одному», поболтать о жизни и просто хорошо провести время. Встреча пройдёт 28 октября, для тех, кто не сможет прийти, проводится онлайн-трансляция.
Зарегистрироваться можно здесь.
Реклама ООО «Яндекс» erid: 2VtzqvGA8rA
Крутые новинки от Adobe в сфере ИИ: ключевые анонсы Adobe MAX 2023
На недавней конференции Adobe MAX компания представила множество нововведений в своих продуктах, основанных на искусственном интеллекте.
Ключевые из них:
— Adobe Firefly 2 — новое поколение инструментов для генеративной графики. Можно сгенерировать изображение по промпту или скопировать стиль с референса.
— Firefly для Illustrator создает векторные изображения по тексту с нуля. Firefly Vector — первая генеративная модель для создания векторной графики.
— Adobe Project Fast Fill — Generation Fill для видео. В Adobe Premiere добавили возможность убирать и дорисовывать предметы и менять фон по текстовому промпту.
— Premiere Pro теперь умеет автоматически создавать субтитры, улучшать голос и очищать аудио.
#новинки #adobe
Гигачад? Нет, это GigaChat
Сбер выкатил обновлённую версию нейросетевой модели GigaChat. Сравнительные тесты продемонстрировали улучшение навыков в области суммаризации, вопросно-ответной системы, генерации идей и перевода. Новая модель GigaChat показала заметный прогресс в тестировании, хотя пока ещё уступает ChatGPT.
Подробнее о процессе создания и реализации обновления: https://habr.com/ru/companies/sberbank/articles/767492/
#статья
Полезные советы по работе с библиотекой scikit-learn в Python
В видео вы найдёте ряд рекомендаций по использованию scikit-learn для машинного обучения на Python.
Затрагиваются различные аспекты предобработки данных, включая преобразование признаков, работу с пропущенными значениями, создание конвейеров обработки. Объясняются нюансы методов fit_transform и transform, рассматриваются способы кодирования категориальных признаков.
Видео будет полезно тем, кто уже знаком с базовыми возможностями scikit-learn, но хочет научиться использовать эту библиотеку более эффективно.
Репозиторий: https://github.com/justmarkham/scikit-learn-tips
#статья
Автоматическая генерация промптов для языковых моделей: анализ работы исследователей Google DeepMind
В этом видео подробно разбирается работа исследователей из Google DeepMind по созданию системы автоматической генерации подсказок-промптов для обучения языковых моделей.
Предложенный ими метод Promptbreeder использует эволюционный алгоритм и цепочки промптов для поиска оптимальных способов формулировки заданий для моделей.
В качестве альтернативы к видео оставляем ссылочку на документ: https://arxiv.org/pdf/2309.16797.pdf
#статья
Как втянуть в ChatGPT свою базу данных? Тонкости работы с API и промптами
В статье рассматриваются практические аспекты работы с ChatGPT и другими языковыми моделями для разработчиков.
Описаны основные ограничения ChatGPT: лимит токенов в запросе и ответе, способы работы с большими объемами данных. Рассмотрены агентные модели, позволяющие решать сложные задачи, векторизация текста для поиска в базах знаний.
Подробнее: https://habr.com/ru/companies/raft/articles/767364/
#статья #chatgpt
Microsoft даст вам до $15 000, но есть одно условие
Microsoft запустила программу bug bounty для поиска уязвимостей в ИИ-продуктах компании, включая чат-бот Bing. За нахождение критических уязвимостей, например в манипуляциях с выводами моделей, предлагаются премии до $15 000.
Подробнее о новой инициативе Microsoft по тестированию безопасности ИИ читайте в полной статье:
https://www.microsoft.com/en-us/msrc/bounty-ai
«Многослойность! Лук многослоен, я тоже многослоен»
И материалы тоже многослойны. И все эти слои NVIDIA научилась рендерить с помощью очень маленьких и быстрых неросетей-энкодеров, достигая максимальной фотореалистичности (UE5 и рядом не стоял). Керамический чайник, слегка заляпанный отпечатками пальцев, часто использующийся нож для сыра, древний бронзовый горшок и всякое такое. И когда-то, все эти знания будут использованы на пользу человечества, товарищи, а пока, просто наслаждаемся прогрессом.
Посмотреть:
https://www.youtube.com/watch?v=ffarLQDQmC4
Почитать:
https://research.nvidia.com/labs/rtr/neural_appearance_models/
#статья
2 дня до конца приема заявок на конкурсы «Старт-1» и «50 Идей» от Инвестиционно-венчурного фонда Республики Татарстан
Старт-1 — до 2 млн рублей на разработку прототипа продукта и развитие бизнеса. Участвовать могут как физлица, так и компании.
Заявки принимаются по направлениям:
— Информационные технологии.
— Медицина и технологии здоровьесбережения.
— Новые материалы и химические технологии.
— Новые приборы и интеллектуальные производственные технологии.
— Биотехнологии.
Подать заявку на Старт-1
50 лучших инновационных идей для РТ — премии до 100 тыс. рублей на развитие идеи для научных сотрудников, студентов, школьников.
Заявки на участие принимаются по номинациям:
— Перспектива.
— Инновации в образовании.
— Старт инноваций.
— Наноимпульс.
— Цифровая экономика.
— Патент года.
— Молодежный инновационный проект.
— Проекты национальной технологической инициативы.
— Социально значимые инновации.
Подать заявку на «50 идей»
Подробные условия проведения конкурсов «Старт-1» и «50 идей» можно прочитать здесь.
Обратите внимание: для подачи заявки на программу Старт-1, необходимо подать заявку на программу «50 идей».
Реклама НКО «ИВФ РТ» LjN8Jvx2p
Хотите секрет мгновенного профессионального роста? Практический курс по топовым нейросетям!
На нём вы освоите 7 нейронок и попрактикуетесь с ними на реальных задачах. Бонусом будет доступ к чату с авторами курса и его постоянное обновление.
Авторы программы уверяют, что 2 месяца учёбы достаточно, чтобы стать мастером топовых нейросетей и выделиться на рынке труда.
Оставить заявку: https://epic.st/ivK-N
Этот текст Skillbox помогла сделать нейросеть.
Реклама ЧОУ ДПО «Образовательные технологии «Скилбокс (Коробка навыков)» ИНН: 9704088880
Google научился бесконечно оживлять обои с рабочего стола
На самом деле, оживить можно что угодно. Image-to-video модель обученная на 2500 часах различных видосиков умеет брать фотографию и «оживлять» её, листики шевелятся, бельё на верёвке колышется на ветру, вот это вот всё.
Посмотреть:
https://www.youtube.com/watch?v=BWFEtLm0Zdc
Почитать:
https://arxiv.org/pdf/2309.07906.pdf
#статья
Раньше они доставали собачек из вашей головы, теперь будут доставать мысли
Опять сканирование мозга (ЭЭГ или МЭГ) и опять реконструкция из мозговых волн. Хотя намерения благие — помочь людям, которые потеряли возможность говорить после инсультов и прочих нехороших вещей Здоровые кандидаты выступают в качестве тренировочных экземпляров — они сидят, слушают истории, а машина записывает, какие слова вызывают какие реакции в мозге (и обучается). Модуль с репродукцией речи из мозговых волн пока не создан, но работы в ту сторону ведутся.
Почитать
https://arxiv.org/pdf/2208.12266v2.pdf
Репозиторий:
https://github.com/facebookresearch/brainmagick
#статья
Продолжаем держать в курсе с небольшим дополнением
Новые новости из мира ИИ. Очки с ИИ, YouTube с ИИ, Amazon Alexa с ИИ, вообще всё что двигается, туда надо запихнуть ИИ, а если не двигается — подвинуть и запихнуть. Небольшой оффтоп — а вы знали что есть устройство с ИИ моделью, которая слушает как люди, так сказать, очищают организм и определяют, есть ли у человека диарея? Они ИИ даже к унитазам прикрутили (на самом деле это нужно для определения, случилась ли вспышка холеры в определенном районе).
Посмотреть:
https://www.youtube.com/watch?v=YatbA9KtPRw
Почитать (оффтоп):
https://pubs.aip.org/asa/jasa/article/152/4_Supplement/A50/2840593/The-feces-thesis-Using-machine-learning-to-detect
#новости
Международное AI соревнование — AI Journey Contest 2023 в самом разгаре!
Продемонстрируй свои навыки, ведь на кону ценный опыт, признание от экспертов и впечатляющий призовой фонд в размере более 11 миллионов рублей!
Задачи конкурса в этом году — настоящий вызов: от создания мультимодальных диалоговых систем до распознавания русского жестового языка на основе видео. Предстоит не только показать свои технические навыки, но и проявить креативность.
Успей отправить своё решение до 10 ноября, участвовать может каждый старше 18 лет.
Присоединяйся к AI Journey Contest 2023 и ворвись в лидерборды, где кто-то уже замер в ожидании победы!
Реклама ПАО «СБЕРБАНК» LjN8K8RuY
Делаем свой чат-бот на основе ИИ
В этом туториале вы узнаете как создать с нуля собственного чат-бота на JavaScript с применением таких технологий как Node.js, Express, React, MongoDB и моделей от OpenAI.
Автор подробно объясняет весь процесс разработки веб-приложения — от начальной настройки до развертывания рабочего чат-бота.
#туториал #openai
Как сэкономить на использовании языковых моделей? На примере LLM-помощника
В этой статье рассказывается, как работает RAG и как с его помощью можно сэкономить на использовании дорогих языковых моделей.
Языковые модели вроде GPT-4 требуют больших вычислительных мощностей и денег на обучение. Но есть способ снизить расходы при их использовании — кэширование ответов с помощью техники Retrieval-Augmented Generation (RAG).
При поступлении нового вопроса система сначала ищет похожий в индексе. Если находит, отдает готовый ответ. Если нет — генерирует ответ моделью, добавляет пару вопрос/ответ в индекс. Таким образом, чем больше вопросов задается системе, тем чаще она отвечает из кэша, не нагружая дорогую модель. Экономия растет со временем!
Репозиторий с кодом на GitHub: https://github.com/akocherovskiy/LLM_chat-bot_RAG_approach
#llm #python
Как создать идеальные рекомендации для пользователей?
Сегодня как никогда актуальным является вопрос подбора персонализированного и релевантного контента для пользователей. И с этим хорошо справляются такие ML-модели, как Collab, User2Vec, User2item и Catboost. Но для использования их нужно обучить на обширных данных о поведении и предпочтениях аудитории.
Именно так поступила команда AvitoTech, когда разрабатывала свою систему рекомендаций. Об этом и многом другом они рассказали в новом фильме «Авито. Рекомендации»: https://youtu.be/zopTexr7gfY
Реклама ООО «Авито Тех» LjN8JxiPP
Как научить нейросеть оптимизировать — простой пример с линейной регрессией
Языковые модели (LLM) активно используются для решения разного рода задач. В сентябре этого года специалисты Google опубликовали работу о возможности использования LLM для решения задач оптимизации.
Вдохновившись этой идеей, автор статьи реализовал простой оптимизатор на основе модели Mistral-7B-Instruct для линейной регрессии. Эксперимент показал, что даже относительно небольшие LLM становятся всё более «умными» и могут использоваться для оптимизации.
Репозиторий: https://github.com/akocherovskiy/LLM_as_optimizer
#статья
Секретное оружие дата-сайентиста
Графы — передовые методы анализа данных, которые используют для выявления связей между сущностями.
Они помогают решать сложные задачи и справляются с ними эффективней классических подходов.
В статье рассказывается:
— что такое графы и где применяются;
— почему их используют крупные компании;
— какие задачи можно решать графами;
— примеры использования на практике.
https://tprg.ru/zEwj
#статья #аналитика #графы
ИИ помог учёным расшифровать 2000-летний папирус
Предыстория: в 79 году нашей эры произошло извержение вулкана Везувий, пострадали от этого не только Помпеи, но и Геркуланум, в котором была библиотека с сотнями папирусов. Это единственная библиотека, сохранившаяся с таких древних времён.
Прочитать эти свитки крайне сложно, потому что практически нереально их развернуть, не повредив обугленные останки. Сложно, но оказалось возможно.
Учёные из университета Кентукки сделали тысячи трёхмерных рентгеновских изображений двух свёрнутых свитков и трёх фрагментов папируса. Представили ИИ, которого обучили читать буквы на таких свитках. И при поддержке инвесторов из Кремниевой долины запустили исследование, в котором можно было получить денежный приз, если получится извлечь разборчивые слова из останков.
В итоге у двух студентов получилось так улучшить нейросеть, что, наконец, удалось прочитать первое слово. Это «πορφύραc» — в переводе «пурпурный». Ребята получили за такое открытие вознаграждение в 40 и 10 тысяч долларов.
У нас в самом разгаре конкурс пет-проектов. Выбирайте понравившиеся работы и продвигайте их к победе своими лайками и просмотрами
Консольная змейка: автор создал консольную версию знаменитой игры без графических библиотек.
Агрегатор фестивального кино: код решает проблему отложенной публикации фестивального кино.
Удивительный пример того, как интерес к теме помогает разработчику годами развивать систему.
Аналог BGInfo для корректного отображения обоев на нескольких экранах: Дмитрий Беликов «лечит» программу BgInfo, исправляет режим заполнения обоев для нескольких экранов.
#diy #конкурс
Генерировать текст и картинки это здорово, но кто будет делать рутину по внесению всех этих данных в конечные системы?
Иногда до 90% нашей работы это не создание чего-то нового, а ежедневное внесение данных во всевозможные отчёты и корпоративные системы. И только вечерком мы наконец-то добираемся до желанных творческих задач на развитие нашего бизнеса. Мечта многих, чтобы кто-то за них прожимал кнопки на компьютере по заданным алгоритмам, бесконечные CTRL+С и CTRL+V, заполнял экранные формы и документы.
На самом деле всё уже придумано. Пусть рутинную работу делают программные роботы. ROBIN CLOUD – облачная No Code платформа по разработке программных роботов, в которой любой человек далёкий от программирования может собирать простые приложения и цифровых ассистентов практически под любую задачу.
Лучше провести пару вечеров за освоением новой технологии RPA по бесплатному курсу и стать умнее. Потом ещё пару вечеров на сборку алгоритма робота в конструкторе и стать свободным. Чем продолжать годами вручную лопатить бесконечные массивы данных, распихивая их по разным системам.
Реклама ООО «Робин» ИНН 9725022632 erid: LjN8KYaNY
Рамки не всегда ограничивают, иногда они направляют
AutoGEN — новый фреймворк для развертывания LLM-приложений через агентов. В первой трети статьи авторы объясняют, насколько гибкие у них агенты, как их можно кастомизировать и общаться с ними с помощью текста и/или кода. А вот оставшиеся две трети заняты огромным приложением, в котором приводятся возможные примеры LLM-приложений, дальнейшие платы и прочее. И как обычно, если лень читать — можно сразу бежать в репозиторий.
Почитать:
https://arxiv.org/pdf/2308.08155v2.pdf
Репозиторий:
https://github.com/microsoft/autogen
#статья
Мало было номеров, теперь ещё и приставки
MiniGPT-5 — модель для генерации текста и контекстного изображения к нему, использующая генерализированный токен, который может использоваться в обоих потоках аутпута модели. Теперь детские книжки с иллюстрациями можно получать по одному нажатию кнопки (и используя некоторое количество электроэнергии).
Почитать
https://arxiv.org/pdf/2310.02239v2.pdf
Репозиторий:
https://github.com/eric-ai-lab/minigpt-5
#статья
Как генерировать изображения и не поджарить свою GPU
Об этом нам расскажет статья про LCM (Latent Consistency Model), новый подход, который сильно уменьшает нагрузку на генеративные диффузионные модели для генерации изображений инференсе. С помощью данного подхода можно конвертировать любую существующую обученную LDM на быструю генерацию.
Почитать:
https://arxiv.org/pdf/2310.04378v1.pdf
Репозиторий:
https://github.com/luosiallen/latent-consistency-model
#статья
Пришло время провести своё техсобеседование.
Да, вы не ослышались! Но это возможно только в нашем королевстве зазеркалья Nozo.
Мы знаем, как волнительно решать задачи на техинтервью, поэтому в нашем королевстве всё наоборот! Теперь ваша очередь заставить инженеров потрудиться и отправить им на решение самые каверзные задачи по Go, C# или QA.
Авторы 4 самых сложных и интересных задач получат мерч от Ozon Tech. А победитель заберёт лучшую награду: карьерную консультацию с HR Ozon Tech или встречу с тимлидом команды инженеров.
Инженеры будут ждать ваши задачи до 7 ноября.
А если вам нечем их озадачить, вступайте в чат королевства, пробуйте решить задачи других участников и участвуйте в голосовании.
Все подробности на лендинге: https://tprg.ru/CRnU
Реклама ООО «Озон Технологии», erid: LjN8KAjJs
Дорогая, проснись, новые нейросети вышли
На самом деле не вот прям новые, но с новым концептом. Bayesian Flow Networks (BFNs) — альтернативный вариант генеративных нейронных сетей, которые в процессе генерации используют не шумные данные (как в диффузионных моделях), а их распределение. Для этого конечно пришлось создать специфичную loss-функцию. Эксперименты показали, что такая модель работает лучше всего, что было сделано до этого на MNIST, CIFAR-10 и text8 датасетах. Аккуратнее, статья больше чем на половину состоит из математических выкладок и если вы не закончили курс высшей математики, просто возьмите код в репозитории.
Почитать:
https://browse.arxiv.org/pdf/2308.07037v2.pdf
Репозиторий:
https://github.com/nnaisense/bayesian-flow-networks
#статья #нейронные_сети
Как задеплоить бесконечную LLM не привлекая внимания санитаров
Конечно используя мозги других людей. Если LLM обучена со стандартным механизмом attention, то количество входных токенов будет фиксировано и больше этого количества запрос сделать не получится. Если же мы будем использовать windowed attention, когда при превышении некоторой длины мы начинаем выкидывать самые первые токены плавающим окном (попутно запихивая последние) то качество ответов очень сильно падает. А это что-то, да значит.
Авторы статьи заметили, что при использовании авторегрессионных LLM, очень много attention-score аллоцировано на первые несколько токенов. Из-за структуры функции softmax, как раз и происходит падение качества window attention, потому что при выкидывании этих самых больших значений, распределение attention score на оставшихся токенах начинает сильно скакать (математические выкладки по этому вопросу конечно есть в статье). Назван этот феномен был attention sink (слив внимания?) и вполне эффектно был добавлен как фича в механизм attention детища авторов — StreamingLLM. Просто оставляем изначальные токены, но всё ещё двигаем окно и вуаля, модель показывает хорошие результаты. Нюансы и код — ниже.
Почитать:
https://arxiv.org/pdf/2309.17453v1.pdf
Репозиторий:
https://github.com/mit-han-lab/streaming-llm
#статья