Наука, технологии, изобретения и урбанистика — прямо сейчас говорим о том, что уже скоро повлияет на каждого. по всем вопросам - @workakkk @ai_machinelearning_big_data - Machine learning @itchannels_telegram - 🔥лучшие ит-каналы
🔥 Reclaim.ai — это платформа для автоматизации планирования, которая помогает пользователям организовать рабочий процесс и управление задачами. Она синхронизирует календари, автоматически планирует время для задач, встреч, отдыха и подстраивается под изменения приоритетов.
🌟 Reclaim оптимизирует распорядок дня, анализирует продуктивность и предоставляет отчеты, что делает её полезной для индивидуальных пользователей и команд, нуждающихся в эффективном планировании и гибком управлении временем.
🔗 Ссылка: *клик*
@vistehno
🤖 Все, что я вижу здесь - в будущем это крошечные собаки-роботы из «Черного зеркала», восстают против человечества .
@vistehno
Если раньше нейросети были просто хайпом, то сейчас навыки работы с ИИ — это реальное преимущество, ведь они значительно упрощают выполнение задач и улучшают карьерные перспективы в разных сферах. За год в 7,8 раза чаще работодатели стали указывать владение ИИ в требованиях к кандидатам.
Если вы хотите научиться эффективно использовать нейросети и не отставать от трендов, присоединяйтесь к бесплатной онлайн-конференции Skillbox 5–7 ноября: https://epic.st/BIuZwY?erid=2VtzqvG79f2
За 3 дня вы разберётесь, что такое нейросети, как они работают и чем могут быть полезны лично для вас. Эксперты поделятся опытом использования ИИ в разных сферах: от дизайна и программирования до маркетинга и travel-индустрии.
✔️ Познакомитесь с более чем 10 нейросетями: ChatGPT-4, Dalle-3, Midjourney, Stable Diffusion, Gen-2 и другими
✔️ Узнаете, как составлять запросы для нейросетей
✔️ Поймёте, к какой нейросети обращаться в конкретной ситуации
✔️ Попрактикуетесь в создании реальных объявлений для бирж фриланса
Бонусы за участие:
— Простые инструкции, как подключиться к ChatGPT, Midjourney и другим популярным нейросетям
— Розыгрыш личной консультации с Александром Доброкотовым — нейрохудожником и креативным директором
Реклама. ЧОУ ДПО «Образовательные технологии «Скилбокс (Коробка навыков)», ИНН: 9704088880
👩💻 Вышла новая версия VS Code 1.95!
🔍 Что нового:
🌟 Copilot Edits: Быстро вносите крупные изменения в нескольких файлах одновременно!
🌟 Copilot Chat в боковой панели: Держите чат с Copilot открытым и готовым к работе, пока вы работаете!
🌟 Несколько учетных записей GitHub: Одновременно входите в несколько учетных записей GitHub в VS Code!
🌟 Обзор кода с Copilot: Получите быстрый обзор или более глубокий анализ некоммиченных изменений!
🌟 Docstrings с Pylance: Генерируйте шаблоны docstring для классов или методов!
🔗 Подробнее: *клик*
@vistehno
🔥 Memenome — это ИИ платформа для преобразования скучных PDF-документов в видео из ТикТока с паркуром в Майнкрафт на фоне! Сложно придумать этому по-настоящему полезное предназначение, однако это забавно и бесплатно
🔗 Ссылка: *клик*
@vistehno
🐎 Стыдно не знать!
@vistehno
ИТ-событие МТС True Tech Champ
Дата: 8 ноября
Место: МТС Live Холл + онлайн
МТС приглашает разработчиков присоединиться к мультиформатному ИТ-событию True Tech Champ. Будем обмениваться опытом, общаться с экспертами и просто классно проводить время среди своих.
Что тебя ждет:
— True Tech Garage. Интерактивный лекторий с воркшопами, ИТ-батлом «Плохие прогерские шутки» и кодинг-дуэлью с победителем олимпиады.
— Технофест. Более 20 площадок с кодерскими и фановыми активностями. Можно забраться на скалодром, погонять роботов по лабиринтам и взломать код сейфа.
— Шоу-финал. Лучшие команды ИТ-чемпионата на глазах у зрителей поборются за победу в гонках роботов по усложнённым интерактивным лабиринтам с подвижными консолями и спецэффектами.
Участие бесплатное, детали и регистрация по ссылке https://truetechchamp.ru/conf
❓Узнайте как построить модель финансового рынка, создать и обучить торгового агента с использованием специализированного фреймворка на открытом уроке в Otus
Моделировать финансовый рынок непростая задача, а когда мы хотим обучить торгового агента для эффективной работы, она становится непосильной для одного человека
На открытом уроке «Построение торгового агента на базе алгоритмов обучения с подкреплением» рассмотрим свободно распространяемые фреймворки для моделирования финансового рынка
✅ Сосредоточимся на финансовой стратегии, а детали реализации алгоритма фреймворк возьмет на себя
Регистрация на урок 👇
https://otus.pw/GgIr/?erid=LjN8K5jmq
#реклама
О рекламодателе
⚡️Легкий способ получать свежие обновления и следить за трендами в разработке на вашем языке. Находите свой стек и подписывайтесь:
МАШИННОЕ ОБУЧЕНИЕ: t.me/ai_machinelearning_big_data
C++ t.me/cpluspluc
Python: t.me/pythonl
Хакинг: t.me/linuxkalii
Devops: t.me/DevOPSitsec
АНАЛИЗ Данных: t.me/data_analysis_ml
Javascript: t.me/javascriptv
C#: t.me/csharp_ci
Java: t.me/javatg
Базы данных: t.me/sqlhub
Linux: t.me/linuxacademiya
Python собеседования: t.me/python_job_interview
Мобильная разработка: t.me/mobdevelop
Docker: t.me/DevopsDocker
Golang: t.me/Golang_google
React: t.me/react_tg
Rust: t.me/rust_code
ИИ: t.me/vistehno
PHP: t.me/phpshka
Android: t.me/android_its
Frontend: t.me/front
Big Data: t.me/bigdatai
Собеседования МЛ: t.me/machinelearning_interview
МАТЕМАТИКА: t.me/data_math
Kubernets: t.me/kubernetc
Angular: /channel/+qIJAuSEb2MQyMDJi
💼 Папка с вакансиями: t.me/addlist/_zyy_jQ_QUsyM2Vi
Папка Go разработчика: t.me/addlist/MUtJEeJSxeY2YTFi
Папка Python разработчика: t.me/addlist/eEPya-HF6mkxMGIy
Папка ML: /channel/addlist/2Ls-snqEeytkMDgy
Папка FRONTEND: /channel/addlist/mzMMG3RPZhY2M2Iy
😆ИТ-Мемы: t.me/memes_prog
🇬🇧Английский: t.me/english_forprogrammers
🧠ИИ: t.me/vistehno
🎓954ГБ ОПЕНСОРС КУРСОВ: @courses
📕Ит-книги бесплатно: /channel/addlist/BkskQciUW_FhNjEy
🔥 Easy-Peasy.AI — полезный сайт, предоставляющий инструменты на базе искусственного интеллекта для автоматизации создания контента, текстов и маркетинговых материалов!
🌟 Сайт предлагает различные AI-генераторы, такие как создание текстов, генерация картинок, создание идей для маркетинга, написание сценариев, перевод аудио в текст и многое другое! На сайте также присутствует бесплатный тариф!
🔗 Ссылка: *клик*
@vistehno
🌟 Open-Sora-Plan v1.3.0: воссоздание сервиса генерации text-to-video Sora средствами opensource.
Проект Open-Sora-Plan предлагает набор инструментов и моделей для генерации видео на основе текстовых запросов и решения сопутствующих задач: восстановление и улучшение качества видео, интерполяция кадров и уточнение текстовых описаний.
▶️ Ключевые особенности версии 1.3.0:
🟢Улучшенный вариационный автоэнкодер WF-VAE
Он использует вейвлет-преобразование для разложения видео на поддиапазоны, захватывая информацию в различных частотных областях.
🟢Skiparse (Skip-Sparse) Attention
Методика Skiparse организовывает токены-кандидаты для внимания с помощью двух чередующихся методов пропуска и сбора, сокращая количество операций с плавающей запятой.
🟢Новая стратегия очистки данных
Cостоит из анализа семантической схожести кадров, ОСR для обнаружения субтитров, оценки эстетики и качества видео, анализа движения и повторной оценкb движения с учетом субтитров.
Стратегия позволила сократить датасет Panda70m до 27% от исходного.
🟢Динамическое разрешение и длительность.
Open-Sora-Plan v1.3.0 поддерживает динамическое разрешение и длительность видео, обрабатывая отдельные кадры как изображения.
⚠️ Такое масштабное обновление позволило значительно сократить аппаратные требования инференса и генерировать 93 кадра text-to-video в разрешении 480р на 24 GB VRAM.
▶️ Подробные инструкции по установке, обучению и инференсу в режимах
CausalVideoVAE, Prompt Refiner, Text-to-Video, Image-to-Video доступны в репозитории проекта.
📌Лицензирование: MIT License.
🟡Модель
🟡Сообщество в Discord
🟡Техотчет
🖥GitHub
@ai_machinelearning_big_data
#AI #ML #OpenSora #Text2Video #Image2Video
🔥 GAGAvatar — это проект с NeurIPS 2024, который генерирует анимируемые 3D аватары головы на основе одной фотографии.
Он позволяет реконструировать голову в 3D и осуществлять ее анимацию в реальном времени, используя видео или изображения.
🌟 Репозиторий включает инструменты для рендеринга, обучения и выполнения генераций с помощью встроенных моделей, написан на Python.
🔐 Лицензия: MIT
▪️GitHub
@vistehno
📹 AISaver.io — инструмент для замены лиц в видеороликах. С помощью этой технологии можно автоматически заменять лица на видео, используя алгоритмы искусственного интеллекта и глубокого обучения
🌟 Инструмент может применяться для создания контента, видеомонтажа и других креативных проектов
🔗 Ссылка: *клик*
@vistehno
📎 ML: Медицинский дайджест за 14 - 20 октября 2024 г.
▶️Модели машинного обучения и бенчмарки
🔘OLAPH: Повышение достоверности ответов на медицинские вопросы.
Метод, который фокусируется на повышении достоверности ответов в формате лонгрида, используя итеративный процесс обучения с SFT и DPO.
🔘LLMD: LLM для интерпретации медицинских карт пациентов.
Модель, разработанная для анализа истории болезни пациента на основе его медицинских карт.
🔘LifeGPT: агностическая генеративная модель клеточных автоматов.
Первая модель, способная предсказывать переходы состояний в двумерной системе Cellular Automata.
🔘MedCare: Раздельное согласование в обучении медицинских LLM.
Модель для решения проблемы снижения производительности LLM при адаптации к специализированным медицинским задачам.
🔘Y-Mol: LLM для разработки лекарственных средств.
Инструктивная модель, основанная на LLaMA2 для решения задач разработки лекарственных средств.
🔘WorldMedQA-V: многоязычный мультимодальный корпус данных для оценки медицинских моделей.
Мультимодальный датасет на разных языках для оценки моделей разной модальности в задачах здравоохранения.
▶️Фреймворки и методологии
🔘MedINST: набор медицинских инструкций для обучения LLM.
Многозадачный мета-набор данных медицинских инструкций из 133 задач.
🔘MCQG-SRefine: автоматическая генерация медицинских вопросов.
Система для автоматической генерации высококачественных вопросов множественного выбора в стиле экзамена USMLE.
🔘AgentClinic: повышение диагностической точности LLM в симулированной медицинской среде.
Система, которая дает возможность агенту-врачу, основанному на LLM, итеративно совершенствовать свои рассуждения и действия после постановки неверного диагноза.
🔘MeNTi: использование инструментов в LLM для решения медицинских задач.
Архитектура агента для LLM, разработанная специально для решения задач, связанных с медицинскими расчетами.
▶️Медицинские LLM-приложения
🔘AGENTiGraph: Интерактивная чатбот-платформа под управлением LLM.
Платформа, которая объединяет LLM с графами знаний для решения задач в специфических медицинских областях.
🔘MMed-RAG: Мультимодальная медицинская RAG-система.
Система повышения фактической точности, разработанная для борьбы с галлюцинациями, возникающими в медицинских VLM.
🔘Medical Graph RAG: Безопасная медицинская LLM c поиском по графу знаний.
Метод использования LLM в медицине, основанный на RAG, дополненной поиском по графу знаний.
🔘MedAide: Многоагентная система для комплексных медицинских задач.
Платформа для решения сложных медицинских задач, основанная на LLM и мульти-агентной архитектуре, где каждый агент специализируется на определенном аспекте здравоохранения.
🔘Генерация синтетических клинических испытаний на LLMs.
Методика использования LLM для создания синтетических клинических испытаний.
▶️Исследования и обзоры
*️⃣UniStruct: новая архитектура для представления структурированных медицинских данных.
Метод адаптации техник субсловной токенизации для представления групп медицинских кодов как единые токены.
*️⃣Адаптация медицинских LLM для 50 языков: подход с использованием MoE по языковым семьям.
Исследовании проблемы адаптации медицинских LLM к локальным языкам, чтобы улучшить доступ к медицинским услугам.
*️⃣ Можно ли добиться успеха в обучении медицинской VLM на чисто синтетических данных?
В статье изучается возможность использования исключительно синтетических данных для обучения моделей MedVLM. Спойлер - да, можно
🔜 Читать полный дайджест
@ai_machinelearning_big_data
🔈 E2/F5-TTS — система, которая преобразует текст в речь (TTS — text-to-speech). Это позволяет вводить текст и получать его озвучивание с помощью двух различных моделей. Программа использует новейшие достижения в области искусственного интеллекта для синтеза речи, что делает голос естественным и понятным.
💡 Обе модели, E2-TTS и F5-TTS, предназначены для создания синтезированной речи, которая звучит максимально похоже на настоящую человеческую. При этом E2-TTS фокусируется на быстром и простом преобразовании текста, а F5-TTS использует более сложные методы для плавности и реалистичности речи
🔥 Модели бесплатные и их можно развернуть локально!
🔗 Huggingface: *клик*
@vistehno
🔥 Docling — это инструмент для конвертации и анализа документов, разработанный для подготовки документов к использованию в генеративных ИИ-приложениях.
💡 Docling поддерживает различные форматы (PDF, DOCX, PPTX, HTML и другие), может извлекать метаданные, читать структуры страниц и таблиц, а также интегрироваться с LlamaIndex и LangChain. В репозитории также реализована поддержка OCR для обработки отсканированных документов, что делает его мощным инструментом для работы с документами в различных ИИ-сценариях.
🖥 Github
🔗 Сайт проекта
@vistehno
🔥 Anyword — это платформа для автоматизированного создания и оптимизации текстового контента на основе искусственного интеллекта. Она предоставляет инструменты для генерации рекламных текстов, описаний продуктов, заголовков, а также других маркетинговых материалов с учетом анализа аудитории и эффективности. Anyword ориентирован на маркетологов и создателей контента, помогая улучшить CTR, вовлеченность и конверсии
🌟 На сайте присутствует бесплатный пробный период, который можно "увеличить" мультиаккаунтами (для регистрации нужна только почта) 👀
🔗 Ссылка: *клик*
@vistehno
🖥 ChatGPT Search — это новое официальное расширение для браузеров, которое интегрирует ChatGPT в результаты поиска!
💡 Расширение добавляет дополнительную панель в поисковые системы, например, Google, и выводит ответы, генерируемые ChatGPT, на основе поисковых запросов пользователя. Это позволяет быстро получать дополнительные объяснения и информацию прямо на странице поиска, улучшая удобство и экономя время
🔗 Ссылка: *клик*
@vistehno
🖥 Transformer Explainer — это интерактивный инструмент для визуализации работы нейросетей и архитектуры, лежащей в основе современных NLP-моделей, таких как Gemini или GPT!
🌟 Сайт демонстрирует, как слои внимания моделей обрабатывают текст, предоставляя визуальные пояснения к каждому этапу анализа и представления текста
🔗 Ссылка: *клик*
@vistehno
Ищете удобную и надежную IT-инфраструктуру для вашего проекта?
Размещайте собственный сайт, запускайте приложения, обучайте нейросети или загружайте огромное количество данных в одном окне браузера. Все эти и многие другие задачи можно решить в Selectel. (тут можно кликабельную ссылку с utm вставить)
Selectel — один из ведущих провайдеров IT-инфраструктуры и облаков. Выделенные серверы, облако собственной разработки, сервисы информационной безопасности и еще более 50 продуктов — все настраивается и масштабируется из единой панели управления.
Что вы получите, выбрав Selectel:
— Удобство. Чтобы начать работу с сервером, достаточно выбрать нужные характеристики и в пару кликов запустить его.
— Масштабируемость. Быстрое развертывание новых мощностей при увеличении нагрузки на ваш сайт или приложение.
— Безопасность. Все дата-центры Selectel соответствуют требованиям 152-ФЗ, а также вам будет доступна бесплатная защита от DDoS-атак.
Регистрируйтесь в панели управления и разверните инфраструктуру вашего проекта в несколько кликов.
📌Учебное пособие по диффузионным моделям для обработки изображений и СV.
Учебник Стэнли Чана, профессора кафедры электротехники, вычислительной техники и статистики Purdue University (США), содержит ультраполезные знания в области диффузионных моделей в контексте обработки изображений и CV. Он доступно и детально объясняет сложные концепции и подходит как опытным профессионалам, так и тем, кто только начинает изучать эту область.
Для профессионалов, уже работающих с диффузионными моделями или стремящихся углубить свои знания, этот учебник послужит отличным ресурсом, который предоставляет прочную основу для понимания и применения концепций в прикладных задачах.
▶️ Содержание:
Вариационный автоэнкодер (VAE)
🟢Структурные элементы VAE
🟢Нижняя граница доказательства (ELBO
🟢Оптимизация в VAE
🟢Заключение и ограничения
Вероятностная модель диффузионного денойза (DDPM)
🟠Базовые элементы DDPM
🟠Нижняя граница доказательства (ELBO)
🟠Распределение обратного процесса
🟠Обучение и инференс
🟠Предсказание шума
🟠Неявная модель диффузионного денойза (DDIM)
🟠Заключение и преимущества DDPM и DDIM
Динамика сопоставления баллов Ланжевена (SMLD)
🟢Выборка из распределения
🟢Функция оценки Штейна
🟢Методы сопоставления баллов
🟢Итоги по SMLD
Стохастическое дифференциальное уравнение (SDE)
🟠От итерационных алгоритмов к обыкновенным дифференциальным уравнениям
🟠Что такое SDE?
🟠SDE для DDPM и SMLD
🟠Численные решатели для ODE и SDE
🟠Заключение и взаимосвязь между DDPM, SMLD и SDE
Уравнения Ланжевена и Фоккера-Планка
🟢Броуновское движение
🟢Мастер-уравнение
🟢Разложение Крамерса-Мойала
🟢Уравнение Фоккера-Планка
🟢Заключение и связь между SDE и уравнением Фоккера-Планка
🟡Arxiv
@ai_machinelearning_big_data
#AI #ML #Tutorial #Duffusion
🤖 Skyvern — это инструмент с открытым исходным кодом для автоматизации браузерных рабочих процессов с использованием больших языковых моделей (LLM) и компьютерного зрения
🌟 Skyvern позволяет создавать и запускать автоматизированные сценарии для выполнения задач, таких как парсинг веб-страниц, клик-акции, заполнение форм и навигация, что делает его полезным для автоматизации повторяющихся задач в браузере
🔗 Ссылка: *клик*
🖥 Github
@vistehno
📝 TextBuddy — это онлайн-редактор и помощник для улучшения текстов! Он помогает упрощать сложные предложения, исправлять грамматику и орфографию, а также структурировать текст, делая его более читабельным
🌟 Используя AI, TextBuddy может перефразировать, сокращать текст, подбирать синонимы и оптимизировать сообщения для лучшего восприятия аудиторией!
🔗 Ссылка: *клик*
@vistehno
👑 Король Дании Фредерик во время презентации первого в Дании суперкомпьютера Gefion с искусственным интеллектом совместно с Дженсеном Хуангом главный исполнительным директором компании NVIDIA
Цитата Фредерик с презентации - "Я не единственный король в этом зале. На другом из них кожаная куртка" 😎
@vistehno
Привет, я Ярослав, окончил МФТИ и рассказываю в канале моей студии о хардкорном внедрении AI в корпорациях и производствах)
Я не выкладываю новости из мира AI и генерации Миджорни, только суровый ентерпрайз, рассказываем о технических и бизнесовых нюнсах наших проектов, например, как:
- Внедряли AI для литья стали;
- Выявляли окллюзии головного мозга;
- Узнавали период овуляции у свиней по видео)
Контент будет интересен разработчикам и продукт-овнерам, которые внедряют ИИ у себя.
Еще у нас есть подкаст куда приходят, например, Игорь Котенков из "Сиолошной".
Подписывайтесь, если интересно реальное внедрение Ai в корпорации: @r77_ai
🔥 IBM Granite 3.0 — это набор новых корпоративных моделей искусственного интеллекта (ИИ) от IBM, ориентированных на высокую производительность, безопасность и гибкость. Модели Granite обходят Llama-3.1 8B аналогичного размера в рейтинге лидеров OpenLLM HuggingFace!
⭐️ Эти модели предназначены для выполнения сложных задач, таких как генерация текста, классификация данных и редактирование кода. Granite 3.0 включает в себя улучшенные алгоритмы для ускорения обработки данных, включая инновации, такие как "спекулятивное декодирование" для более быстрого вывода и использование моделей "микса экспертов" для снижения задержек
🔗 Подробнее: *клик*
@vistehno
🗣«Люди в RPA» — это не просто митап, а площадка для обсуждения актуальных проблем и возможностей в роботизации процессов.
X5 Tech и Газпромбанк.Тех меняют парадигму конференций по роботизации — время отойти от обычного обсуждения преимуществ роботизации перед другими подходами и сосредоточить внимание на тех, кто сегодня задает вектор развития этого направления.
Целевая аудитория — разработчики RPA, у которых в фокусе внимания реальные вопросы развития технологии:
🫥 Управление командами роботизации — чем отличается организация RPA-разработки от других продуктовых команд;
🫥 Citizen-разработка — разработка RPA-решений силами линейных сотрудников: коллеги поделятся опытом и успехами такого подхода, обсудят риски и перспективы развития;
🫥 Развитие отечественных платформ роботизации — представители ведущих платформ поделятся своим видением текущей ситуации и расскажут, как они адаптируют свои решения под требования разработчиков;
🫥 Квалификационный стандарт RPA — тимлиды RPA вместе обсудят, какими навыками должен обладать сотрудник в начале пути и к каким вершинам должен стремиться в профессиональном росте.
28 октября проведем дискуссию, которая станет началом детального обсуждения поднятых вопросов с пользой для сообщества разработчиков RPA.
⚡️ Увидимся в офисе Газпромбанк.Тех по адресу: Москва, ул. Коровий Вал, 5, БЦ «Оазис» 28 октября
Сбор участников офлайн с 13:00
Начало трансляции онлайн в 14:00
✅ Зарегистрироваться на митап «Люди в RPA»
Реклама, Банк ГПБ (АО), ИНН: 7744001497, erid:2VtzqusNXWB
🔥 EgoAllo — это исследовательский проект, направленный на оценку движения тела и рук в мире.
💡 Репозиторий содержит код для обучения моделей, обработки данных и визуализации результатов, используя данные от камер Project Aria. Основная цель — предсказать 3D-позицию тела и рук на основе этих данных. Этот проект помогает исследовать движение человека с использованием технологий SLAM и других методов компьютерного зрения
🔗 Страница проекта: *клик*
📖 Arxiv: *клик*
▪️Github
@vistehno
🖥 OpenAI выпустила приложение ChatGPT для Windows!
🌟 Скачать можно из Microsoft Store, однако это ранняя версия, доступная пока только для обладателей подписки на сервис
🔗 Ссылка: *клик*
@vistehno
🔥 Компания Adobe представила новую функцию под названием Harmonize.
Она автоматически регулирует освещение, тени, отражения и цветовую коррекцию, чтобы новые объекты в кадре смотрелись естественно. Эта функция работает с людьми, животными и любыми другими объектами.
Прогнозируется, что к 2025 году продвинутые пользователи Photoshop будут использовать всего две клавиши: "Удаление фона" и "Harmonize".