52807
по всем вопросам @haarrp @itchannels_telegram - 🔥 best it channels @ai_machinelearning_big_data -ML @ArtificialIntelligencedl -AI @datascienceiot - ml 📚 @pythonlbooks -📚books
Как создать аннотированный график с помощью #Python и matplotlib 🐍📊
Читать полностью…
Baidu выпустила Unlimited OCR - модель для распознавания длинных документов за один проход.
У модели 3B параметров, но активируются только 500M. При этом она показывает новые SOTA-результаты на OmniDocBench v1.5 и v1.6.
Главная фишка - Reference Sliding Window Attention.
Модель держит в фокусе:
• исходный документ
• недавний контекст
• следующие слова
А всё лишнее постепенно «забывает», чтобы не раздувать вычисления.
За счёт постоянного размера KV Cache и более дешёвого attention Unlimited OCR может распознавать 40+ страниц за один forward pass, не теряя контекст и не замедляясь.
GitHub: https://github.com/baidu/Unlimited-OCR
Hugging Face: https://huggingface.co/baidu/Unlimited-OCR
Python Tip: pickle — быстрый способ сохранить Python-объекты в файл.pickle умеет сериализовать почти любые Python-структуры: словари, списки, кортежи, set, числа, строки и даже более сложные объекты.
Пример:
import pickle
data = {
"name": "Alice",
"scores": [10, 20, 30],
"active": True
}
with open("data.pickle", "wb") as f:
pickle.dump(data, f)
with open("data.pickle", "rb") as f:
loaded_data = pickle.load(f)
print(loaded_data)
pickle небезопасен.pickle только для внутренних данных, которым доверяете.
Читать полностью…
🏆 Итоги Первого Кубка нейроконтента в МосХаб.Сколково
Вчера наше пространство превратилось в настоящую нейролабораторию. 150 дизайнеров, разработчиков, сценаристов и AI-специалистов собрались, чтобы за несколько часов создать вертикальные ролики с помощью нейросетей.
Участники работали по четырём социально значимым кейсам: «Москва 2040: технологии для людей», «Технологическое будущее: страна инженеров», «Код жизни: медицина будущего» и «Москва — город заботы».
Главный кубок второй год подряд завоевала команда «Кролики».
Генеральный директор платформы «Россия — страна возможностей» Андрей Бетин отметил: «Из 1300 заявок в финал вышли сильнейшие. Это подтверждает высокий уровень подготовки участников и их творческий потенциал».
Кубок нейроконтента подтвердил: нейросети усиливают замысел человека, но не заменяют его. Настоящий прорыв — в тандеме живого творчества и цифровых технологий. МосХаб.Сколково — та самая точка, где такие проекты становятся реальностью.
Фото с мероприятия — в альбоме
Подписывайтесь: Telegram | МАКС | ВКонтакте
OpenMythos - open-source попытка теоретически реконструировать Claude Mythos, где все архитектурные ставки расписаны прямо в README.
По сути, OpenMythos это публичная гипотеза, которая ещё и запускается.
Что авторы считают основой Mythos?
Не глубокий стек уникальных слоёв, а Recurrent-Depth Transformer.
MoE с активацией около 5% параметров, поэтому общий размер модели скорее показывает объём хранения, а не реальную стоимость вычислений.
Loop-index positional embedding, чтобы каждая итерация работала как отдельная вычислительная фаза.
ACT halting, чтобы модель сама решала, когда ей достаточно “думать”, причём отдельно для каждого токена.
И ещё continuous latent thoughts, которые могут кодировать сразу несколько следующих шагов. По смыслу это похоже на breadth-first search внутри одного forward pass.
Источники идей тоже понятны: Parcae для стабильности, Universal Transformers для halting, DeepSeek для MoE routing.
GitHub:
http://github.com/kyegomez/OpenMythos
🐍 Python Парсинг: Большой продвинутый бесплатный курс
Полное практическое руководство по веб-скрейпингу на Python — от основ HTTP до production-grade пауков, обхода антибот-защит, асинхронности и проектирования надёжных пайплайнов. Каждый раздел содержит рабочие примеры, типовые ошибки и продвинутые практики.
https://github.com/justxor/Pythonparsing-/tree/main
Python иногда может выглядеть как тёмная магия.
Вот однострочный quicksort через lambda:
q = lambda x: x and q([i for i in x[1:] if i <= x[0]]) + [x[0]] + q([i for i in x[1:] if i > x[0]])
Zero training needed, Image-to-LoRA(i2L) V2 уже вышел 🚀
Обновлённая версия i2L стала заметно мощнее: теперь она может превратить одно или несколько референсных изображений в style LoRA за один прямой проход, без отдельного обучения для кастомизации визуального стиля.
🌟 Что нового в V2:
* Совместимость: работает с разными базовыми моделями, включая Z-Image, Klein-4B и Hidream-O1.
* Скорость: прямое предсказание весов style LoRA без обучения.
* Точность стиля: высокая верность переноса стиля без утечки семантики.
* Контроль: явные веса открывают asymmetric CFG, смешивание стилей из нескольких референсов и управляемую генерацию.
* Архитектура: image encoder, обучаемые LoRA queries и compressed decoding heads, которые генерируют адаптированные матрицы.
🤖 Коллекция моделей: https://modelscope.ai/collections/DiffSynth-Studio/Image-to-LoRA-V2
🎠 Studio: https://modelscope.ai/studios/DiffSynth-Studio/Z-Image-i2L-V2
📄 Paper: https://modelscope.ai/papers/2606.13809
🔍 Обнаружение уязвимостей с помощью Audit
Audit — это агент для поиска уязвимостей, использующий 8-ступенчатую методологию, основанную на взаимодействии узких агентов и принципе "умышленного несогласия". Он интегрируется с Claude Pro и предлагает структурированные отчеты о безопасности.
🚀 Основные моменты:
- Многопоточность: узкие агенты работают параллельно для поиска уязвимостей.
- Умышленное несогласие: второй агент проверяет выводы первого.
- Отслеживание доступности: подтверждает, что уязвимости могут быть достигнуты злоумышленником.
- Обратная связь: находит новые задачи на основе обнаруженных уязвимостей.
📌 GitHub: https://github.com/evilsocket/audit
#python
Nex-N2 - новое любопытное семейство агентных моделей.
Что внутри:
- Adaptive Thinking - модель сама подбирает глубину рассуждения на каждом шаге
- экономия около 20% токенов без потери качества
- Coherent Thinking - единый формат мышления для поиска, кодинга и tool use
- меньше хрупких переключений между разными режимами работы
По заявлению команды, Nex-N2 показывает уровень Tier-1 open-source моделей на SWE-bench, Terminal-Bench, GDPval и других бенчмарках, приближаясь к GPT-5.5 и Opus 4.7.
Звучит мощно, но такие цифры стоит проверять независимыми прогонами.
- Kimi-K2.6: 86% - 13 из 14
- MiniMax: 100% - 8 из 8
- GLM-5.1: 100% - 13 из 13
- DeepSeek-V4-Pro: 92% - 11 из 12
- Opus 4.7: 45% - 5 из 11
- GPT-5.5: 30% - 3 из 10
🔗 https://nex-agi.com
📦 https://huggingface.co/nex-agi/Nex-N2-Pro
https://modelscope.cn/models/nex-agi/Nex-N2-Pro
https://github.com/nex-agi/Nex-N2
✔️ Centaur - это платформа для совместного использования AI-агентов, интегрированных в Slack.
Она позволяет командам взаимодействовать с агентами, которые выполняют задачи в изолированных средах Kubernetes, обеспечивая безопасность и гибкость.
🚀 Основные моменты:
- Slack-агенты для выполнения задач и получения ответов.
- Изолированные среды для безопасного выполнения команд.
- Поддержка пользовательских инструментов и плагинов.
- Долговременные рабочие процессы с возможностью восстановления.
- Хранение состояния для повторного подключения без потери данных.
📌 GitHub: https://github.com/paradigmxyz/centaur
#python
🖥 В России второй день подряд жалуются на проблемы с доступом к PyPI, главному репозиторию пакетов для Python. По данным Downdetector, сбои затрагивают пользователей из разных регионов.
PyPI для Python-разработчиков - это не просто сайт с библиотеками. Через него ставятся зависимости, фреймворки, CLI-утилиты и большая часть всего, что нужно для нормальной разработки. Когда он начинает отваливаться, ломается не «ещё один зарубежный сервис», а базовая инфраструктура языка.
Диагностика интернет-блокировок показала обрыв соединения на этапе TLS. Это момент, когда клиент и сервер пытаются установить защищённое соединение. Такое поведение похоже на блокировки через DPI, то есть глубокую инспекцию пакетов.
По симптомам ситуация напоминает недавние проблемы с доступом к DeepSeek, которые издание тоже связывало с похожим механизмом.
При этом в Роскомнадзоре утверждают, что PyPI не ограничивали и проблем с доступом к ресурсу не фиксируют, сообщает «Осторожно, новости».
Для разработчиков это неприятный сигнал. Даже если проблема окажется временным сбоем, зависимость от внешней инфраструктуры снова стала очень заметной: без PyPI внезапно сложнее собрать проект, поднять окружение, поставить зависимости и просто нормально работать с Python.
⚡️ Как Redis считает миллиарды уникальных значений, почти не тратя память
Есть алгоритм HyperLogLog. Он позволяет примерно понять, сколько уникальных элементов прошло через систему, используя около 12 KB памяти.
Идея простая: Redis не хранит сами элементы.
Он делает так:
- берёт элемент
- считает от него хеш
- часть хеша использует как номер ячейки
- в другой части смотрит, сколько нулей подряд встретилось
- если новое число больше старого - обновляет ячейку
Почему это работает?
Потому что длинная серия нулей в хеше встречается редко.
Например:
- 1 ноль подряд - довольно часто
- 5 нулей подряд - уже реже
- 10 нулей подряд - примерно шанс 1 к 1024
- 20 нулей подряд - совсем редкое событие
Если Redis увидел очень редкий паттерн, значит через него, скорее всего, прошло много разных элементов.
В Redis используется 16 384 маленьких счётчика. Каждый хранит максимальную «редкость», которую видел для своей группы элементов.
Потом Redis объединяет эти значения математикой и получает оценку уникальных элементов.
Не точное число, а очень близкую оценку.
Главный прикол HyperLogLog:
он может обработать хоть миллионы, хоть миллиарды значений, но память почти не растёт.
Именно поэтому Redis умеет считать уникальных пользователей, IP, запросы или события без огромных таблиц и списков.
🔥 Три разных человека. Три разных проекта. Один и тот же подход.
— Юра взял «скучную» нишу с готовым спросом → сначала печальные $100/мес, через год уже ~$10K/мес
— Денис сделал Telegram-игру в одиночку на основе AI → ~ $1500 за 1,5 месяца после запуска
— Аня без кода запустила AI-бота для изучения английского → первые ~$200 уже в 1 месяц
Разные результаты. Разный масштаб. Но общие правила:
1. не придумывать «гениальную идею», а брать существующий спрос
2. делать простой MVP и быстро запускаться
3. докручивать монетизацию и продукт по факту использования
Ребята сделали всё без команды, без инвестиций, а самое главное — без ожидания «идеального момента». Да, не у всех получается сразу. И не у всех выходит на $10K. Но если системно идти по схеме выше — появляется первый доход с продукта, а дальше уже есть что масштабировать.
В комьюнити разбираем такие кейсы регулярно: @its_capitan. Что сработало, что нет, и почему.
🖥 Python умеет аккуратно читать вывод долгого процесса по мере выполнения
Вместо того чтобы ждать завершения команды, можно запустить её через subprocess.Popen и читать stdout построчно.
Так удобно следить за:
- долгими скриптами
- серверами
- сборками
- тестами
- CLI-утилитами
- фоновой обработкой данных
Пример на картинке запускает HTTP-сервер и сразу печатает его вывод:subprocess.Popen(...) стартует процесс stdout=subprocess.PIPE забирает поток вывода iter(proc.stdout.readline, b'') читает строки, пока процесс жив
Полезный паттерн, когда нужно не просто запустить команду, а видеть, что с ней происходит прямо сейчас.
Скажи мне 5 главных слов: на GitVerse появилось зеркало PyPI! 😎
Все нужные Python‑пакеты живут на российской платформе для разработчиков GitVerse — вы не потеряете доступ к ним, даже если основной PyPI решит «повиснуть».
А ещё такое зеркало — плюс к скорости: меньше сетевых прыжков — быстрее загрузка.
Ставьте его как основной источник или держите как резерв. Тут рассказали, как подключить зеркало!
🔍Тестовое собеседование на Middle Python с разработчиком из Авито завтра вечером
Уже завтра вечером в 19:00 по мск приходи онлайн на открытое собеседование, чтобы посмотреть на настоящее интервью на Middle Python-разработчика.
Как это будет:
📂 Даня, старший разработчик в Авито, будет задавать реальные вопросы и задачи разработчику-добровольцу
📂 Даня будет комментировать каждый ответ респондента, чтобы дать понять чего от вас ожидает собеседующий на интервью
📂 В конце можно будет задать любой вопрос Дане
Это бесплатно. Эфир проходит в рамках менторской программы от ШОРТКАТ для Python-разработчиков, которые хотят повысить свой грейд, ЗП и прокачать скиллы.
Переходи в нашего бота, чтобы получить ссылку на эфир → @shortcut_py_bot
Реклама.
О рекламодателе.
Pew Research опубликовали свежий отчёт «Americans and AI 2026».
Только 16% американцев теперь ожидают, что ИИ принесёт пользу обществу в следующие 20 лет, а 40% считают, что ИИ навредит обществу за тот же период.
24% американцев используют чат-боты ежедневно: 12% - несколько раз в день, 4%, почти постоянно.
51% взрослых жителей США всё ещё вообще не пользуются ИИ-чат-ботами.
42% используют чат-боты для поиска информации, и это делает поиск главным сценарием применения.
38% работающих взрослых используют чат-боты для рабочих задач.
10% используют их для эмоциональной поддержки или советов, а 4% - для общения и чувства компании.
ChatGPT доминирует по уровню использования: 44% взрослых американцев сообщили, что пользовались им.
Дальше идут Gemini - 24%, Copilot — 17%, Meta AI — 14%, Grok — 8%, Claude — 6% и Character.ai — 3%.
Взрослые младше 50 лет примерно в два раза чаще пользуются ChatGPT, чем люди старшего возраста: 57% против 28%.
30% говорят, что чат-боты помогают им с продуктивностью, и только 5% считают, что они ей вредят.
28% говорят, что чат-боты помогают им оставаться в курсе событий, и только 5% считают, что они мешают этому.
60% взрослых жителей США читают ИИ-сводки в поиске. Это значит, что ИИ уже влияет на потребление информации даже у тех, кто может активно не пользоваться чат-ботами.
https://www.pewresearch.org/internet/2026/06/17/americans-and-ai-2026-chatbots-smart-devices-and-views-on-impact/
⚡️ Linux Roadmap: подробный практический курс от нуля до уверенного администратора
Это пошаговый маршрут изучения Linux с упором на практику. Каждый раздел содержит объяснение «почему это устроено именно так», разбор команд и обязательные задания, которые нужно выполнить руками в терминале. Чтение без повторения навыка не даёт — держите терминал открытым рядом с этим текстом.
Как работать с этим курсом: идите сверху вниз, не перепрыгивайте разделы; каждую команду набирайте руками, а не копируйте; в конце каждого блока выполняйте задание; специально ломайте систему в виртуалке и чините — это лучший способ учиться.
https://github.com/justxor/linuxfullroadmap/
🖥 На stepik обновили курс Python в 2026 - рабочий инструмент для автоматизации, ботов, парсинга, API, данных и разработки с ИИ.
Проблема новичков в том, что они учат Python кусками: синтаксис, пару задач, немного теории - и потом не понимают, как собрать из этого реальный проект.
Этот курс закрывает именно этот разрыв. Здесь вы не просто смотрите уроки, а учитесь писать код, разбирать ошибки и собирать рабочие решения на практике.
Внутри:
- Python с нуля
- много практики без сухой теории
- реальные задачи и проекты
- автоматизация рутины
- работа с файлами, данными и API
- понятная логика программирования
- современная разработка с ИИ
- отдельный блок по вайбкодингу
Вайбкодинг это нормальный навык 2026 года и вас научат- правильно ставить задачу, проверять код, понимать результат и быстрее доводить проект до рабочего состояния.
48 часов скидка 60%: https://stepik.org/course/288218/
GLM-5.2 теперь можно запускать локально.
2-битная версия сохраняет около 82% точности после сжатия модели с 1,51 ТБ до 238 ГБ, то есть размер уменьшили на 84%.
Запуск возможен на Mac с 256 ГБ памяти или на системах с достаточным объёмом RAM/VRAM.
GLM-5.2 называют самой сильной открытой моделью на данный момент.
Гайд: https://unsloth.ai/docs/models/glm-5.2
GGUF: https://huggingface.co/unsloth/GLM-5.2-GGUF
💻Инженерный университет нового типа НЕЙМАРК открыл приёмную кампанию — и вот почему это интересно.
Здесь ушли от скучной теории и учат системному мышлению и работе с ИИ — метанавыкам, которые позволяют не конкурировать с нейросетями, а создавать и масштабировать работающие продукты!
Что дает университет:
- два диплома сразу благодаря совместным программам с НИУ ВШЭ, ННГУ и другими ведущими вузами
- актуальная база в кибербезопасности, робототехнике, ИИ или телекоме
- индивидуальная траектория с ментором и реальные кейсы в портфолио с первого курса.
⚡️Приёмная кампания на 2026 год уже открыта. Собственные ИТ-проекты, личные достижения и олимпиады дают преимущество и возможность учиться по гранту.
Выбирай направление и подавай заявку по ссылке: neimark-it.ru
SQLModel использует аннотации типов Python, чтобы объединить Pydantic и SQLAlchemy и уменьшить дублирование кода при работе с SQL-базами.
* одна аннотация типа заменяет отдельные модели Pydantic и SQLAlchemy
* хорошо совместим с FastAPI, Pydantic и SQLAlchemy
* внутри работает на базе Pydantic и SQLAlchemy
* разумные настройки по умолчанию уменьшают количество шаблонного кода
https://github.com/fastapi/sqlmodel
TerminalTextEffects - это Python-библиотека без внешних зависимостей для добавления анимированного текста прямо в терминал.
Что умеет:
- работает прямо в текущем терминале и не ломает привычный workflow
- поддерживает Xterm 256 и RGB HEX-цвета
- умеет сложное движение символов через кривые Безье и плавное ускорение
- эффекты можно настраивать через типизированный config dataclass
- CLI-аргументы генерируются автоматически из конфигурации
https://github.com/ChrisBuilds/terminaltexteffects
🚀 GPU-библиотека для классического машинного обучения
FlashLib предлагает высокопроизводительные реализации операторов машинного обучения, таких как kmeans, PCA и DBSCAN, с использованием Triton и CuteDSL. Библиотека позволяет эффективно обрабатывать данные на GPU, обеспечивая простоту использования и высокую скорость выполнения.
🚀Основные моменты:
- Поддержка 15 высокоуровневых примитивов для машинного обучения.
- Информативный API для оценки производительности операций.
- Оптимизированные реализации для кластеризации, регрессии и декомпозиции.
- Легкая интеграция с PyTorch и sklearn.
📌 GitHub: https://github.com/FlashML-org/flashlib
#python
🖥 Python не медленный. Медленным его часто делает ваш код.
У Python есть странная репутация: стоит программе начать тормозить, виноват сразу язык. Но в реальности большая часть быстрых сценариев в Python работает не потому, что интерпретатор внезапно стал магическим, а потому что тяжёлая работа уходит ниже - в C, C++ или Rust.
CPython написан на C. Многие встроенные операции тоже выполняются в C:
- len()
- list.append()
- dict.get()
- sum()
- сортировка
- операции со строками
- часть работы со списками и словарями
Когда вы вызываете list.append(), Python не крутит всю логику добавления элемента на уровне байткода. Он платит небольшой overhead за вызов, а дальше попадает в C-функцию внутри CPython.
Медленный путь начинается там, где мы вручную гоняем данные по одному элементу:
total = 0
for x in data:
total += x
total = sum(data)
total = np.sum(data)
🖥 Python умеет читать бинарные файлы блоками очень элегантно - без ручного while True.
Вот такой приём через functools.partial:
`iter(partial(f.read, 64), b'')`
Читать полностью…
from functools import partial
with open("mydata.db", "rb") as f:
for block in iter(partial(f.read, 64), b""):
process_block(block)
O(1) не значит «быстро»
Одна из самых частых ошибок в алгоритмах: считать, что O(1) всегда быстрее O(n).
На практике это не так.
O(1) означает только одно: время работы не растёт вместе с размером входных данных.
Но сама операция может быть дорогой.
Например, хеш-таблица формально даёт O(1) для поиска, но если данные не в кэше CPU, один cache miss может сделать её медленнее, чем простой линейный проход по маленькому массиву.
Именно поэтому в Go, Python и даже C-библиотеках для маленьких map/таблиц иногда используют обычный linear search.
Парадоксально, но:O(n) при n = 16 и тёплом кэше может быть быстрее, чем O(1) с холодным cache miss.
Big O описывает асимптотический рост, а не реальную скорость на маленьких данных.
✔️ Run Llama выкатили LiteParse - open-source инструмент для быстрого локального парсинга документов.
Если задача - быстро достать текст, координаты, структуру страниц и скриншоты, это можно делать локально.
Что умеет LiteParse:
- парсит PDF через PDFium
- сохраняет bounding boxes для текста
- умеет OCR через встроенный Tesseract
- поддерживает внешние OCR-серверы вроде EasyOCR или PaddleOCR
- генерирует скриншоты страниц для LLM-агентов
- отдаёт результат в JSON или обычный текст
- работает из Rust, Python, Node.js/TypeScript и WASM
- запускается на Linux, macOS и Windows
Авторы прямо разделяют сценарии: LiteParse для быстрых локальных задач, LlamaParse - для тяжёлых случаев с таблицами, сложной версткой, графиками, рукописным текстом и сканами.
https://github.com/run-llama/liteparse
⚡️ УЧИШЬ НЕЙРОСЕТИ ОТВЕЧАТЬ ПРАВИЛЬНО? ТЕБЕ К НАМ НА СТАЖИРОВКУ
Промт-инженер — тот, кто пишет инструкции для AI-моделей и проектирует «мозг» AI-агентов. Одна из самых востребованных профессий в AI — и прямо сейчас мы ищем стажёров в это направление.
➡️ Учишься на 2+ курсе, знаешь Python, JSON и работаешь с LLM-стеком? Выбирай команду и присоединяйся к Сберу.
Какие направления доступны:
✅AI и продуктовая аналитика
✅Управление бизнес-моделью
✅AI-помощники Phygital
🟢Гибрид или офис, Москва
🟢От 20 часов в неделю
🟢Зарплата до 81 300 ₽ в месяц
Заходи на сайт, выбирай направление Prompt Engineering и регистрируйся 👉 sberstudent.ru/internship