по всем вопросам @haarrp @itchannels_telegram - 🔥 best it channels @ai_machinelearning_big_data -ML @ArtificialIntelligencedl -AI @datascienceiot - ml 📚 @pythonlbooks -📚books
🖥 python-genai — это официальный SDK на Python от Google, предназначенный для интеграции генеративных моделей Google AI в приложения!
💡 Основные возможности включают генерацию текста, настройку моделей с помощью системных инструкций, параметры генерации (например, температуры, длины вывода), а также встроенные механизмы безопасности. SDK поддерживает удобную работу с параметрами через словари или модели Pydantic. Также предусмотрена интеграция с пользовательскими функциями для обработки результатов или вызова API.
🔐 Лицензия: Apache-2.0
🖥 Github
@pythonl
🔥 software-papers — тщательно составленный список научных статей по программированию!
🌟 Темы охватывают широкий спектр аспектов программирования и информатики, включая историю вычислений, алгоритмы, структуры данных, искусственный интеллект, программную инженерию и многое другое.
🔐 Лицензия: MIT
🖥 Github
@pythonl
⚡️ Mistral OCR – это новый высокоточный и мультимодальный API, предназначенный для всестороннего анализа документов.
Он работает с изображениями и PDF, возвращая результат в виде упорядоченного, структурированного вывода, где текст и визуальные элементы перемежаются в соответствии с исходной структурой документа.
Согласно внутренним тестам, Mistral OCR достигает 94.89% точности, опережая Google Document AI (83.42%) и Azure OCR (89.52%).
Система способна обрабатывать 2000 страниц в минуту (в том числе на русском языке) на одном вычислительном узле, предлагая функцию "doc-as-prompt" для использования документов в качестве инструкций. Полученные данные могут быть структурированы в формат JSON. Mistral OCR доступен в Le Chat и через API на la Plateforme.
mistral.ai
Вот колаб, в котором всё, что вам нужно для запуска:
— Вставить API в строку api_key
(его можно получить бесплатно); — Загрузить файл в левую папку и заменить pdf_file = Path
на имя вашего документа.
На выходы вы получите текст, изображения и таблицы — а таблицы всегда были для меня особенно сложными.
https://mistral.ai/fr/news/mistral-ocr
@ai_machinelearning_big_data
#mistral #ocr
⚡ AstrBot – Мультиплатформенный LLM-чатбот
Готовый чатбот и фреймворк для интеграции LLM в различные мессенджеры (QQ, Telegram, WeChat и др.).
Поддерживает несколько популярных моделей и имеет встроенный WebUI. Описание проекта на китайском, лучше включите автоперевод в браузере, проект реально полезный, для тех, кто пилит ботов.
🖥 Github
@pythonl
💥 Почему ансамблирование — это must-have в ML?
Даже лучшие ML-модели не идеальны. Но что если можно усилить их точность, объединив несколько алгоритмов?
На открытом уроке разберём популярные методы ансамблирования:
- Бэггинг снижает дисперсию модели, делая её устойчивее
- Градиентный бустинг усиливает предсказания, обучая модели на ошибках
Вы узнаете, как эти методы повышают точность прогнозов, и разберёте их на практике.
📅 Встречаемся онлайн 17 марта в 18:00 мск. Открытый урок пройдёт в преддверии старта курса «Специализация Machine Learning», а все участники получат скидку на обучение.
➡️ Ссылка для регистрации: https://otus.pw/trnl/?erid=2W5zFHGPX7E
Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.
🔥 Cloudflare Agents — это фреймворк, позволяющий создавать интеллектуальных, сохраняющих состояние агентов, которые функционируют на периферии сети, используя глобальную инфраструктуру Cloudflare!
🔐 Лицензия: MIT
🖥 Github
@pythonl
🖥 Prefect — это фреймворк оркестрации рабочих процессов с открытым исходным кодом, предназначенный для создания надежных конвейеров обработки данных на Python!
💡 Он позволяет превращать Python-скрипты в производственные рабочие процессы с минимальными усилиями, обеспечивая автоматическое отслеживание состояния, обработку ошибок, планирование задач и мониторинг в реальном времени. С помощью Prefect вы можете строить динамические и устойчивые конвейеры данных, которые адаптируются к изменениям и восстанавливаются после сбоев.
🔐 Лицензия: Apache-2.0
🖥 Github
@pythonl
🖥 Preswald — это платформа, предназначенная для создания, развертывания и управления интерактивными приложениями для работы с данными!
💡 Она объединяет процессы сбора, хранения, преобразования и визуализации данных в одном легковесном и мощном SDK. Preswald позволяет разработчикам быстро создавать прототипы внутренних инструментов или развертывать полнофункциональные приложения, снижая сложность и затраты без ущерба для гибкости.
🔐 Лицензия: Apache-2.0
🖥 Github
@pythonl
🔍 Как повысить грейд и зарплату х2❔
1. Переходи в бота ШОРТКАТ @shortcut_py_bot
2. Ответь на пару вопросов
3. Бронируй удобный слот на бесплатную индивидуальную встречу для тестирования
4. Сразу же на звонке узнаешь свой грейд и точки роста — на основе опыта менторов из бигтеха
Переходи в бота и записывайся на бесплатную диагностику 📂 @shortcut_py_bot
Реклама. ООО "ШОРТКАТ", ИНН: 9731139396, erid: 2VtzqxduHWv
🖥 Swifter — это библиотека Python с открытым исходным кодом, предназначенная для оптимизации применения функций к объектам DataFrame и Series в библиотеке pandas!
🌟 Она автоматически определяет наиболее эффективный способ выполнения операции, будь то векторизация, параллельная обработка с использованием Dask или стандартный метод apply.
🔐 Лицензия: MIT
🖥 Github
🖥 Guillotina — это современная RESTful-платформа на основе Python, разработанная для эффективного управления большими объемами данных! Она построена с использованием asyncio, что обеспечивает высокую производительность и масштабируемость при работе с асинхронными операциями.
🔐 Лицензия: BSD-2
🖥 Github
@pythonl
🖥 ScrapeServ — это API, который принимает URL и возвращает файл с данными веб-сайта и его скриншотами!
🌟 Он разработан для запуска в Docker-контейнере и использует браузерные технологии для обработки JavaScript на страницах. Среди возможностей ScrapeServ — прокрутка страницы с созданием скриншотов различных разделов, автоматическая обработка перенаправлений и корректная работа с ссылками на загрузку файлов. Задачи обрабатываются в очереди с настраиваемым распределением памяти, обеспечивая эффективное использование ресурсов.
🔐 Лицензия: MIT
🖥 Github
@pythonl
🔥 ERD Lab — это бесплатный онлайн-инструмент, предназначенный для профессионального проектирования и визуализации баз данных с использованием диаграмм "сущность-связь" (ERD)!
Он позволяет импортировать существующие SQL-скрипты или создавать новые базы данных без необходимости писать код, что упрощает процесс разработки и документирования структур данных.
🔗 Ссылка: *клик*
@pythonl
🖥 glom — это библиотека Python, предназначенная для упрощения доступа и преобразования вложенных структур данных! Она предоставляет декларативный подход к извлечению и модификации данных, позволяя разработчикам эффективно работать с комплексными иерархиями объектов и коллекций.
🔐 Лицензия: BSD-3-Clause
🖥 Github
@pythonl
🖥 FastSQLA — это асинхронное расширение для SQLAlchemy версии 2.0 и выше, разработанное для интеграции с FastAPI! Оно предоставляет готовые шаблоны, поддержку SQLModel и встроенную пагинацию, упрощая настройку и управление асинхронными соединениями с реляционными базами данных.
🔐 Лицензия: MIT
🖥 Github
@pythonl
🔍Тестовое собеседование на Middle Python-разработчика в четверг
13 марта(в четверг) в 19:00 по мск приходи онлайн на открытое собеседование, чтобы посмотреть на настоящее интервью на Middle Python-разработчика.
Как это будет:
📂 Даня, старший разработчик СберМаркете будет задавать реальные вопросы и задачи разработчику-добровольцу
📂 Даня будет комментировать каждый ответ респондента, чтобы дать понять чего от вас ожидает собеседующий на интервью
📂 В конце можно будет задать любой вопрос Дане
Что узнаешь на прямом эфире от ШОРТКАТ:
1. Чего ждут от кандидатов на Middle позиции в Python-разработке
2. Какие вопросы задают на интервью и зачем
3. Как подготовиться к собесу, чтобы получить оффер
Это бесплатно?
Бесплатно
Переходи в нашего бота, чтобы получить ссылку на эфир → @shortcut_py_bot
Реклама, ООО "ШОРТКАТ", ИНН: 9731139396, erid: 2VtzqvFqJq5
⚡️FastAPI-Guard — удобный инструмент для защиты защиты ваших FastAPI-приложения
✅ Контроль IP-адресов: отслеживание активности пользователей
✅ Логирование запросов: подробная запись всех обращений
✅ Обнаружение атак: своевременное выявление попыток взлома
Очень простая интеграция, хорошее годное решение для защиты от различных атак.
▪Github
▪Документация
@pythonl
«Ядро планеты Python»: большой интерактивный учебник по Python, который дополняет сообщество
Учебник охватывает основные темы Python, но коротко и достаточно ёмко, чтобы раскрыть специфику, удобство, красоту и силу этого языка.
Всё с кучей примеров и небольшими дорожными картами по каждой теме, а последнее изменение — меньше недели назад: https://github.com/amaargiru/pycore
#python
⚡ ai-hedge-fund – -инструмен для анализа финансовых рынков на основе ИИ
Новый репозиторий от команды AI Hedge Fund, который включает в себя экспериментальные скрипты и модули для анализа финансовых данных с использованием Python.git clone https://github.com/virattt/ai-hedge-fund.git
cd ai-hedge-fund
▪ Github
@pythonl
🖥 Groovy — это транспилер, преобразующий функции Python в их эквиваленты на JavaScript!
🌟 Он используется в библиотеке Gradio, позволяя разработчикам писать функции на Python, которые затем выполняются на стороне клиента как JavaScript, обеспечивая быструю работу. Groovy поддерживает подмножество стандартной библиотеки Python и некоторые специфические классы Gradio, с акцентом на подробное сообщение об ошибках при попытке транспиляции неподдерживаемого кода.
🔐 Лицензия: Apache-2.0
🖥 Github
@pythonl
Python-разработчики и не только, кто на челлендж?
Задача: за 4 дня собрать 4 работающих проекта.
Прокачайте навыки на бесплатном мини-курсе по Python-разработке и разберите реальные кейсы.
Он состоит из практики чуть менее, чем полностью. Вы создадите:
1️⃣ Бота для Telegram, который умеет переводить голос в текст — автоматизация в пару кликов
2️⃣ Бота для Telegram, который обрабатывает фотографии по команде
3️⃣ Парсер — чтобы вытаскивать инфу с сайтов
4️⃣ Веб-сайт (с помощью фреймворка Flask) — первый шаг в бэкенд
В общем, прокачаете навыки, освежите память и наверняка узнаете что-то новое.
Регистрируйтесь в Telegram-боте по ссылке: https://epic.st/29ImA?erid=2VtzqvXrSCW
🎁 А ещё подарки: персональная карьерная консультация, скидка 10 000 рублей на любой курс Skillbox и подборка полезных материалов.
Реклама. ЧОУ ДПО «Образовательные технологии «Скилбокс (Коробка навыков)», ИНН: 9704088880
🖥 simplejson — это библиотека для Python, обеспечивающая простое, быстрое и расширяемое кодирование и декодирование JSON!
🌟 Она полностью написана на Python и не имеет внешних зависимостей, но включает необязательное C-расширение для повышения производительности. Поддерживает Python версии 3.3 и выше, а также имеет обратную совместимость с Python 2.5+.
🔐 Лицензия: MIT
🖥 Github
@pythonl
🖥 Guillotina — это современная RESTful-платформа на основе Python, разработанная для эффективного управления большими объемами данных! Она построена с использованием asyncio, что обеспечивает высокую производительность и масштабируемость при работе с асинхронными операциями.
🔐 Лицензия: BSD-2
🖥 Github
@pythonl
🖥 В этой статье объясняется, что такое OpenTelemetry и как интегрировать его в Django-приложение для мониторинга и трассировки запросов!
🌟 Автор рассказывает о ключевых компонентах OpenTelemetry, таких как метрики, логи и трассировки, а также демонстрирует установку и настройку инструментов для сбора данных.
🔗 Ссылка: *клик*
@pythonl
VDS — хардкор? Вы ещё не слышали про Bare Metal 😎
27 февраля эксперт облачного провайдера Cloud․ru Евгений Константинов расскажет:
😶🌫️что это за технология;
😶🌫️чем Bare Metal отличается от виртуальных машин;
😶🌫️какой путь мы прошли при создании нашего сервиса Evolution Bare Metal.
Это не просто вебинар, а демо. Вам покажут, как использовать технологию эффективно, и ответят на все вопросы.
Зарегистрироваться можно здесь 👈
⚡️ Челлендж: 12 IT-проектов за 12 месяцев — попробуй сам!
Собрали крутые кейсы, для тех, кто хочет запустить свой первый IT-продукт, но не знаете, с чего начать, присмотрись к комьюнити инди-хакеров, которые тестируют простой, но эффективный подход:
✅ Разработка + запуск за 1 месяц
✅ Минимальные вложения (средний бюджет на продвижение — $150)
✅ Честный разбор: что сработало, а что — нет
Вот несколько примеров их проектов:
👉 Кейс о генераторе картинок – американцы платят $40, хотя есть бесплатные аналоги. Разработка заняла 4 недели.
👉 Темная тема с тарифами от $5 до $99 – 2 недели работы, пассивный доход, сравнимый с зарплатой разработчика.
👉 Что бывает, если пилить сложный продукт 2 года без теста на рынке – не повторяй эту ошибку!
👉 Математическое приложение, которое через 4 месяца вышло на $1200/месяц – всего за 30 дней разработки.
👉 Бот для фотокниг, который принес 1 700 000 рублей – кейс с разбором ошибок и удачных решений.
💡 Что полезного можно взять из их опыта?
1️⃣ Метод быстрого запуска: как сделать рабочий продукт за 1 месяц.
2️⃣ Эффективное продвижение: как привлечь тысячи пользователей без больших бюджетов.
Здесь можно следить за быстрыми запусками и, возможно, попробовать создать свой продукт! 🚀
Кластеризация временных рядов: хаос или скрытые паттерны?
Финансовые данные, сенсоры, котировки акций — данные приходят потоком, но как выявить закономерности и сгруппировать их правильно? Стандартные методы не работают, а временные ряды ведут себя слишком нестабильно.
Разбираем на открытом вебинаре «Кластеризация временных рядов» 5 марта в 20:00 (мск):
- Изучим метрику DTW (Dynamic Time Warping)
- Разберём методы понижения размерности
- Найдём связи в котировках акций на реальных данных
Всем участникам — скидка на большое обучение «Machine Learning. Professional».
➡️ Регистрируйтесь, чтобы не пропустить: https://otus.pw/iIy6/?erid=2W5zFJUDfeQ
Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.
У вас была ситуация, когда вы открываете новый проект или библиотеку и пытаетесь разобраться в коде?
Если в этом проекте используются аннотации типов - вы справитесь с этой задачей намного быстрее. Также на уроке рассмотрим библиотеку pydantic, которая позволяет вывести на новый уровень работу с данными в Python.
Узнайте, как эффективно реализовать интернационализацию и локализацию в Spring-приложениях.
⏺ 26 февраля в 20:00 МСК Бесплатно. Урок в рамках старта курса «Python для аналитики» от Otus.
Ссылка на регистрацию: https://otus.pw/y1jh/
#реклама
О рекламодателе
⚡ Data Fusion 2025 — главное событие весны для специалистов по работе с данными в пятый раз соберет на своей площадке более 250 экспертов.
Вас ждет:
• Два дня практических кейсов, 14 треков и 70+ сессий, посвященных передовым исследованиям в области больших данных и технологий AI
• Кейс-стади о применении ML в различных сферах бизнеса от финтеха и промышленности до медицины
• Экспертиза от ученых, бизнес-лидеров и представителей государства.
📅 16-17 апреля
📍 Москва, технологический кластер «Ломоносов»
Не упустите шанс узнать о главных трендах в AI и задать вопросы лидерам индустрии.
Участие бесплатное. Регистрация уже открыта — https://data-fusion.ru/
#AI #ML #BigData #DataFusion #DataScience #IT
*IT-информационные технологии
*AI-искусственный интеллект
*DS-наука о методах анализа данных.
*Нетворкинг-полезные связи
*Воркшоп-практическое обучение
🖥 PyQuery — это библиотека на языке Python, позволяющая манипулировать и извлекать данные из HTML и XML документов с использованием синтаксиса, похожего на jQuery!
🌟 Она предоставляет удобный API для выборки элементов с помощью CSS-селекторов и их последующей обработки. PyQuery построена на основе lxml, что обеспечивает быструю и эффективную работу с XML и HTML.
🖥 Github
@pythonl