VK Cloud Conf: как перенести лучшие практики разработки ИТ-компаний в классический бизнес
Каждая крупная российская компания, которая стремится к росту, вынуждена развивать собственную разработку. Для многих это новое направление. В то же время большинство вопросов современной разработки — инструментарий, ресурсы, процессы — общие для разных отраслей.
⏰ Когда: 8 июня, 12:00
📍Где: Москва и онлайн
⚡️ Регистрация
На VK Cloud Conf эксперты VK и крупнейших российских компаний поделятся опытом организации процессов разработки, работы с данными и информационной безопасности в облаке.
Вы узнаете, какими инструментами и подходами можно сократить время вывода новых разработок на рынок. Спикеры обсудят архитектуру современных аналитических систем — от сбора и структурирования данных до визуализации и разработки моделей машинного обучения.
В программе:
🔹 Как повысить эффективность разработки ИТ-решений с помощью облачных сервисов
🔹Подходы к работе с данными: примеры масштабных дата-решений, особенности и результаты проектов
🔹 Тренды и примеры миграции на российские базы данных
🔹 Лучшие практики облачной безопасности в условиях требований к конфиденциальности данных
Конференция будет полезна руководителям компаний и ИТ-специалистам разных направлений.
ZipIt! Merging Models from Different Tasks without Training
ZipIt allows to combine completely distinct models with different initializations, each solving a separate task, into one multi-task model without any additional training.
"ZipIt!", новый метод объединения двух произвольных моделей одной архитектуры.
🖥 Github: https://github.com/gstoica27/zipit
⏩ Paper: https://arxiv.org/abs/2305.03053v1
📌 Dataset: https://paperswithcode.com/dataset/nabirds
ai_machinelearning_big_data
🖥 Awesome Chatgpt
Awesome list for ChatGPT — an artificial intelligence chatbot
Awesome список для ChatGPT.
🖥 Github: https://github.com/sindresorhus/awesome-chatgpt
💨 Examples: https://github.com/xiaowuc2/ChatGPT-Python-Applications
✅️ QuickGPT: https://sindresorhus.gumroad.com/l/quickgpt
ai_machinelearning_big_data
TaskPrompter: Spatial-Channel Multi-Task Prompting for Dense Scene Understanding
Novel spatial-channel multi-task prompting transformer framework to achieve this target.
Две мощные модели многозадачных трансформеров для пониманияк контекста на видео.
🖥 Github: https://github.com/prismformore/multi-task-transformer
⏩ Paper: https://openreview.net/forum?id=-CwPopPJda
📌 Dataset: https://paperswithcode.com/dataset/cityscapes-3d
ai_machinelearning_big_data
🖌 Edit Everything: A Text-Guided Generative System for Images Editing
A text-guided generative system without any finetuning (zero-shot).
Edit Everything позволяет пользователям редактировать изображения с помощью простых текстовых инструкций.
🖥 Github: https://github.com/defengxie/edit_everything
⏩ Paper: https://arxiv.org/abs/2304.14006v1
🚀 Dataset: https://paperswithcode.com/dataset/wukong
ai_machinelearning_big_data
Как не забывать теорию Deep Learning и учить новое?
Можно подписаться на канал DeepSchool. В нем вы найдете
- короткие посты с теорией;
- разборы статей;
- советы по обучению сетей;
- вопросы с собеседований;
- и обзоры фреймворков.
1. Обзор ключевых идей MobileNet — что делает эту архитектуру столь эффективной
2. Инструкция: как ускорить разметку изображений при помощи CVAT и FiftyOne
3. Что такое attention
4. Об асинхронности вычислений на GPU
5. Вопрос с собеседования на дообучение сегментационной модели
Подписывайтесь, чтобы не забывать теорию Deep Learning и учить новое :)
Как можно использовать ChatGPT в IT-менеджменте
Можно ли менеджеру спрашивать совета у ChatGPT? Можно ли проводить или проходить собеседования с помощью искусственного интеллекта? Как использовать нейросеть в управлении бизнесом?
Ведущие подкаста «Для tech и этих» вместе с директором по анализу больших данных в СберМаркете рассказали, как и для чего можно использовать ChatGPT менеджерам и инженерам. Слушайте выпуск по ссылке: bit.ly/41VpORi
ChatGPT: создаем ИИ без единой строчки кода
Бесплатно покажем, как создать нейросеть полностью только запросами к ChatGPT! Без единой строчки кода написанной руками!
Получи запись прямо сейчас!
☝А еще у нас крутые интенсивы на которых ученики пишут собственные нейронки без опыта программирования - это тоже Бесплатно
📌 Как Airflow и k8s помогают строить эффективный конвейер?
📆 Узнайте 27 апреля в 20:00 на открытом уроке в OTUS. Вебинар приурочен к старту онлайн-курса «MLOps».
⚠️ На этом занятии мы построим свой конвейер обучения моделей на Airflow и k8s.
➡️ Для участия нужно зарегистрироваться:
https://otus.pw/M29e/Нативная интеграция. Информация о продукте www.otus.ru
Сбер запускает новую нейролингвистическую модель GigaChat.
GigaChat может ответить как быстро справиться с тревогой или подсказать, как справиться с грустью и улучшить настроение. Но, помимо этого, нейросеть генерирует ответы и на другие вопросы с помощью метода supervised fine-tuning, reinforcement learning with human feedback, а также на нейросетевом ансамбле NeONKA (NEural Omnimodal Network with Knowledge-Awareness).
GigaChat расширяет опыт взаимодействия с поисковыми запросами и учитывает контекст во время генерации ответа. И все это на русском языке.
На данный момент GigaChat находится в статусе закрытого бета-тестирования. Если вас привлекает перспектива стать одним из первых пользователей, получивших бесплатный доступ после его официального релиза, переходите по ссылке в Телеграм-канал.
А вы уже успели приобрести жильё по программе льготной ипотеки для IT-специалистов? Нет? Тогда эта новость для вас!
Застройщик ЛСР предлагает в апреле скидки всем, кто оформит IT-ипотеку:
1% — на однокомнатную квартиру или студию;
2% — на двухкомнатную квартиру;
3% — на 3-5-комнатную квартиру.
Скидка предоставляется на покупку недвижимости во всех объектах застройщика. Еще один момент: важно быть сотрудником компании-партнёра ЛСР.
Что делать, если ваша компания не является партнёром застройщика? Подать заявку на её включение в список! Важно: требования к компании включают аккредитацию Минцифры России и использование налоговых льгот.
Подробнее об акции здесь.
Реклама. ООО "ЛСР. НЕДВИЖИМОСТЬ-СЗ" LjN8K2f4Y
LLM Zoo: democratizing ChatGPT
Model "Phoenix", achieving competitive performance among open-source English and Chinese models while excelling in languages with limited resources
LLM Zoo - это проект, который предоставляет данные, модели и бенчмарки для больших языковых моделей.
🖥 Github: https://github.com/freedomintelligence/llmzoo
⏩ Paper: https://arxiv.org/abs/2304.10453v1
⭐️ Parameters: https://huggingface.co/FreedomIntelligence/phoenix-chat-7b
ai_machinelearning_big_data
Практический вебинар VK Cloud: Погружение в MLflow API. Готовые рецепты и сценарии использования
⏰ Когда: 4 мая, 16:00 по Москве
📍 Регистрация
На вебинаре спикеры покажут основные этапы работы с ML-моделями в MLflow. Вы узнаете, как оценивать и сравнивать модели и выводить их в production.
В программе:
🔹 Принципы работы с MLflow на Jupyter в облаке и решение основных задач: логирования метрик, моделей и параметров.
🔹Сравнение различных ML-моделей и экспериментов с помощью извлеченных метрик.
🔹 Разбор большинства методов MLflow API.
🔹 Деплой ML-модели и демонстрация основных сценариев использования на практике.
Спикеры:
— Александр Волынский, технический менеджер продукта Cloud ML Platform, VK Cloud
— Сергей Артюхин, преподаватель курса «Симулятор ML», karpov.courses
Вебинар будет полезен дата-сайентистам, MLOps- и DevOps-инженерам и аналитикам данных.
Зарегистрироваться
Inpaint Anything: Segment Anything Meets Image Inpainting
Inpaint Anything is able to remove the object smoothly.
"Inpaint Anything" - новый проект, который позваоляет удалить / заполнить / заменить что угодно на картинке (помощью промпта).
🖥 Github: https://github.com/geekyutao/Inpaint-Anything
⏩ Paper: https://arxiv.org/abs/2304.06790
⭐️ Dataset: https://segment-anything.com/dataset/index.html
ai_machinelearning_big_data
💻 Graph classification with Transformers
This notebook shows how to fine-tune the Graphormer model for Graph Classification on a dataset available on the hub.
В этой статье мы рассмотрим, как можно выполнять классификацию графов с помощью библиотеки Transformers.
🤗Hugging face blog: https://huggingface.co/blog/graphml-classification
⏩ Intro to Graphs: /channel/ai_machinelearning_big_data/3214
🖥 Github: https://github.com/huggingface/blog/blob/main/notebooks/graphml-classification.ipynb
⏩ Paper: https://arxiv.org/abs/2106.05234
⭐️Dataset: https://ogb.stanford.edu/
ai_machinelearning_big_data
🔈Text-to-Video: The Task, Challenges and the Current State
In this post, we covered the constraints, unique challenges and the current state of text-to-video generation models
Текст в видео: Задачи, проблемы и текущее состояние. В этом посте мы обсудим прошлое, настоящее и будущее моделей "текст в видео".
🤗 Hugging face: https://huggingface.co/blog/text-to-video
🖥 Github: https://github.com/huggingface/blog/blob/main/text-to-video.md
⏩ Damo-vilab: https://huggingface.co/damo-vilab
📌 Dataset: https://m-bain.github.io/webvid-dataset/
ai_machinelearning_big_data
🔄 Caption Anything: Interactive Image Description with Diverse Multimodal Controls
Caption-Anything is a versatile tool combining image segmentation, visual captioning, and ChatGPT, generating tailored captions with diverse controls for user preferences.
Универсальный инструмент для работы с изображениями, сочетающий в себе возможности, Visual Captioning, SAM, ChatGPT. Модель генерирует описательные подписи для любого объекта на изображении.
🖥 Github: https://github.com/ttengwang/caption-anything
⏩ Paper: https://arxiv.org/abs/2305.02677v1
📌 Dataset: https://paperswithcode.com/dataset/cityscapes-3d
🖥 Colab: https://colab.research.google.com/github/ttengwang/Caption-Anything/blob/main/notebooks/tutorial.ipynb
ai_machinelearning_big_data
Имеете опыт в машинном обучении, но хотите двигаться ещё дальше?
Специально для вас Валерий Бабушкин, Vice President, Data Science в Blockchainꓸcom, вместе с командой опытных специалистов из Яндекса, AliExpress и X5 Retail Group подготовил продвинутый курс, на котором вам предстоит решать сложные и нестандартные задачи бизнеса.
Ранжирование и матчинг, динамическое ценообразование, uplift-моделирование, ускорение и повышение чувствительности A/B-тестов — выбирайте нужные блоки или проходите курс целиком.
Если вы уже сталкивались с чем-то из этого в своей работе, то познакомитесь с best practices индустрии. А если нет — дополните своё резюме новыми кейсами и станете более разносторонним ML-специалистом.
Ждём вас на курсе! Следующий поток стартует уже 10 мая, а по промокоду HARDMLAI26 будет скидка 5%
Записывайтесь по ссылке
Running IF with 🧨 diffusers on a Free Tier Google Colab
IF is better at generating images with high-frequency details (e.g., human faces and hands) and is the first open-source image generation model that can reliably generate images with text.
Инструкция, как запустить одну из самых мощных моделей преобразования текста в изображение с открытым исходным кодом IF на бесплатном Google Colab.
🤗 Hugging face: https://huggingface.co/blog/if
🖥 Github: https://github.com/deep-floyd/IF
⏩ Paper: https://arxiv.org/pdf/2205.11487.pdf
📌 Demo:https://huggingface.co/spaces/DeepFloyd/IF
ai_machinelearning_big_data
🔍 Unleashing Infinite-Length Input Capacity for Large-scale Language Models with Self-Controlled Memory System
Self-Controlled Memory (SCM) system to unleash infinite-length input capacity for large-scale language models.
SCM может быть интегрирована с любыми LLM для обработки сверхдлинных текстов без каких-либо изменений или тонкой настройки.
🖥 Github: https://github.com/toufunao/SCM4LLMs
⏩ Paper: https://arxiv.org/abs/2304.13343v1
📌 Tasks: https://paperswithcode.com/task/language-modelling
ai_machinelearning_big_data
🔊 AudioGPT: Understanding and Generating Speech, Music, Sound, and Talking Head
Multi-modal AI system named AudioGPT, which complements LLMs (i.e., ChatGPT) with 1) foundation models to process complex audio information and solve numerous understanding and generation tasks
AudioGPT: Генерирование речи, музыки, звука и говорящих аватаров.
🖥 Github: https://github.com/aigc-audio/audiogpt
⏩ Paper: https://arxiv.org/abs/2304.12995v1
🤗 Hugging face: https://huggingface.co/spaces/AIGC-Audio/AudioGPT
📌 Dataset: https://paperswithcode.com/dataset/c4
ai_machinelearning_big_data
Track anything
Project developed upon Segment Anything, can specify anything to track and segment via user clicks only.
Track-Anything - это гибкий и интерактивный инструмент для отслеживания и сегментации видео.
🖥 Github: https://github.com/gaomingqi/track-anything
⏩ Paper: https://arxiv.org/abs/2304.11968v1
🤗 Hugging face: https://huggingface.co/spaces/watchtowerss/Track-Anything
📌 Dataset: https://paperswithcode.com/dataset/davis-2017
ai_machinelearning_big_data
Collaborative Diffusion for Multi-Modal Face Generation and Editing
Multi-modal controls, framework synthesizes high-quality images consistent with the input conditions.
Проект, который позволяет использовать несколько модальностей для управления созданием и редактированием лица.
🖥 Github: https://github.com/ziqihuangg/collaborative-diffusion
⏩ Project: https://ziqihuangg.github.io/projects/collaborative-diffusion.html
⏩ Paper: https://arxiv.org/abs/2304.10530v1
⭐️ Dataset: https://paperswithcode.com/dataset/celeba-dialog
ai_machinelearning_big_data
Count anything
An empirical study on few-shot counting using segment anything
Исследование использования метода SAM для сложной задачи подсчета объектов по нескольким снимкам.
🖥 Github: https://github.com/vision-intelligence-and-robots-group/count-anything
⏩ Paper: https://arxiv.org/abs/2304.10817v1
🤗 Hugging face: https://huggingface.co/spaces/nebula/counting-anything
📌 Dataset: https://drive.google.com/file/d/1ymDYrGs9DSRicfZbSCDiOu0ikGDh5k6S/view?usp=sharing
ai_machinelearning_big_data
📸 Omni Aggregation Networks for Lightweight Image Super-Resolution
Omni Self-attention paradigm for simultaneous spatial and channel interactions,mining all the potential correlations across omni-axis.
Omni-SR, легковесный фреймворк для получения высокого разрешения изображений.
🖥 Github: https://github.com/francis0625/omni-sr
⏩ Paper: https://arxiv.org/abs/2304.10244v1
⭐️ Dataset: https://paperswithcode.com/dataset/manga109
ai_machinelearning_big_data
🧑💻 Learning to Program with Natural Language
This project introduces the Learning to Program (LP) method, which aims to learn the task program in text form from the training set using Large Language Models (LLMs) themselves.
Новый проект от Microsoft представляет метод Learning to Program (LP), который позволяет использовать естественный язык в качестве языка программирования для описания процедур задач, делая их легко понятными как для людей, так и для LLM.
🖥 Github: https://github.com/microsoft/naturallanguageprogram
⏩ Paper: https://arxiv.org/pdf/2304.10464v1.pdf
⭐️ Dataset: https://paperswithcode.com/dataset/math
ai_machinelearning_big_data
Understanding INT4 Quantization for Transformer Models: Latency Speedup, Composability, and Failure Cases
В данной работе исследуется возможность использования квантования INT4 для языковых моделей и показываем.
🖥 Github: https://github.com/microsoft/DeepSpeed
⏩ Paper: https://arxiv.org/pdf/2301.12017v1.pdf
⭐️ Dataset: https://paperswithcode.com/dataset/multinli
ai_machinelearning_big_data
Stability AI запускает первый набор языковых моделей StableLM
This repository contains Stability AI's ongoing development of the StableLM series of language models and will be continuously updated with new checkpoints. The following provides an overview of all currently available models. More coming soon.
StableLM предназначена для генерации текста и кода и будет использоваться в различных приложениях. Модель обучена и полностью готова к использованию всеми желающими абсолютно бесплатно. В данный момент готовы к использованию языковые модели с 3B и 7B (3 и 7 млрд.) параметрами.
🖥 Github: https://github.com/Stability-AI/StableLM
🤗 Hugging face: https://huggingface.co/spaces/stabilityai/stablelm-tuned-alpha-chat
ai_machinelearning_big_data
💻 Навык работы с большими данными открывает путь в ведущие IT-корпорации. Обычно такие корпорации используют MLOps — способ повышения производительности и создания надежных моделей корпоративного уровня.
📊 Занимаетесь дата-инжинирингом и хотите выйти на новый уровень? Эксперты топовых компаний обучат вас необходимым навыкам на практическом онлайн-курсе «MLOps» от OTUS.
👉 Определите свой уровень подготовки с помощью теста — https://otus.pw/UB4x/
🔥 Пройдете тест, получите велкам-скидку и доступ к 2 предстоящим открытым урокам:
✔️ Построим свой конвейер обучения моделей на Airflow и k8s.
✔️ DataFrame API: от Dask к PySpark
Разработчики, архитекторы, Data Science и R&D-специалисты Нижнего Новгорода, вы здесь? Сбер приглашает вас на инженерный митап RecSys Community, который пройдет 25 апреля в Сo-working Garage 💻
О чем расскажут спикеры?
✔️ Рассмотрят подходы к применению трансформеров в рекомендательных системах и поделятся успешными кейсам.
✔️ Покажут, как используют AmazMe для обработки персонализированных и мультимодальных рекомендаций.
✔️ Раскроют все секреты, какие изменения помогли сделать рекомендательную систему поиска друзей такой точной.
Конечно же, на митапе будут Q&A-сессии, кофе-брейк, розыгрыш мерча и интересное общение. Встречаемся 25 апреля в Co-working Garage по адресу: ул. Октябрьская, д.35. Сбор гостей в 18:30.
Зарегистрироваться!⚡️