Telegram-канал python_job_interview - Python вопросы с собеседований: Unsorted - каталог телеграмм

python_job_interview | Unsorted

Subscribe to a channel

Telegram-канал python_job_interview - Python вопросы с собеседований

24940

Вопросы с собеседований по Python @workakkk - админ @machinelearning_interview - вопросы с собесдований по Ml @pro_python_code - Python @data_analysis_ml - анализ данных на Python @itchannels_telegram - 🔥 главное в ит РКН: clck.ru/3FmrFd

Subscribe to a channel

Python вопросы с собеседований

12 June 2026 16:01

Когда-то в Python файлы открывали вот так:

f_obj = open(path, 'w')
f_obj.write(some_data)
f_obj.close()

Код короткий, выглядит понятно, но есть проблема: если между open() и close() что-то упадёт, файл может остаться незакрытым.

Поэтому приходилось руками оборачивать всё в try / finally, следить за закрытием ресурса и не забывать cleanup на ошибках.

Потом в Python появился with, и этот бытовой ад стал намного чище:

with open(path, 'w') as f_obj:
f_obj.write(some_data)

Теперь файл закроется автоматически, даже если внутри блока случится исключение.

Это одна из тех фич Python, которые выглядят мелко, но сильно меняют стиль кода. with убирает ручное управление ресурсами и делает намерение очевидным: вот ресурс, вот область, где он нужен, после выхода из блока его надо корректно закрыть.

Используется не только для файлов:

- соединения с базой
- lock'и
- временные файлы
- сетевые подключения
- транзакции
- любые объекты с контекстным менеджером

Хороший Python-код часто начинается с простого правила: если ресурс надо открыть и потом закрыть, почти всегда нужен with.

#python

Читать полностью…

Python вопросы с собеседований

07 June 2026 16:00

🚀 Мощный мультимодальный ИИ: Step 3.7 Flash

Step 3.7 Flash — это 198B-параметрическая модель, объединяющая языковую и визуальную обработку для высокопроизводительных задач. Она активирует около 11B параметров на токен, обеспечивая скорость до 400 токенов в секунду и поддерживая контекст до 256k. Идеально подходит для сложных рабочих процессов, таких как анализ финансовых отчетов и взаимодействие с API.

🚀 Основные моменты:
- Высокая производительность в визуальном восприятии и обработке.
- Поддержка многопараметрических задач с высокой точностью.
- Гибкость развертывания в облаке и локально.
- Интеграция с популярными инструментами и платформами.

📌 GitHub: https://github.com/stepfun-ai/Step-3.7-Flash

#python

Читать полностью…

Python вопросы с собеседований

01 June 2026 15:40

Ночью сервер сломался, конфиг «никто не трогал», а деплой «точно не виноват»?

Есть простая команда:

find /etc -mtime -1 -type f

Она покажет все файлы в /etc, которые менялись за последние 24 часа.

Нужно проверить сайт - меняешь /etc на /var/www.

Когда все говорят «это не я», find быстро показывает, что реально трогали.

Читать полностью…

Python вопросы с собеседований

29 May 2026 13:50

Агенты наконец-то получают нормальную память

agentmemory - это локальный слой памяти для AI coding agents, который решает одну из самых раздражающих проблем: каждый новый сеанс агент снова «забывает» архитектуру проекта, ваши правки, договорённости, баги и стиль работы.

Вместо того чтобы каждый раз заново объяснять Claude Code, Cursor, Codex или другому агенту, как устроен проект, agentmemory тихо сохраняет полезный контекст, сжимает его в searchable memory и подставляет нужные куски в следующих сессиях.

Что важно:

- работает с Claude Code, Cursor, Codex CLI, Gemini CLI, Windsurf, Roo Code, Cline, Aider и другими агентами
- поддерживает MCP, hooks и REST API
- один общий memory server для разных инструментов
- память шарится между агентами, а не живёт внутри одного клиента
- можно поднимать локально, без завязки на внешний сервис
- помогает не раздувать CLAUDE.md, .cursorrules и другие ручные файлы контекста

Идея простая: агент должен не просто выполнять задачу, а накапливать опыт по проекту.

https://github.com/rohitg00/agentmemory

Читать полностью…

Python вопросы с собеседований

27 May 2026 20:00

🐍 Python Pop Quiz: что окажется внутри `silly_dict`?

Вопрос звучит просто, но тут ловушка в том, как Python работает с ключами словаря.

Варианты:

A) {"py": "amazing"}
B) {"py": 10}
C) {"py": "amazing", <__main__.MyClass object at ...>: 10}
D) None of the above

Суть в том, что ключи в dict сравниваются не по тому, как они выглядят в коде, а через __hash__ и __eq__.

Если объект пользовательского класса имеет такой же хеш, как строка "py", и при сравнении считается равным этой строке, то Python решит: это один и тот же ключ.

В таком случае новое значение просто перезапишет старое.

Ответ: B) `{"py": 10}`

Маленький пример, но отлично показывает важную вещь: в Python ключ словаря - это не “текстовое имя”, а объект с правилами хеширования и сравнения.

Читать полностью…

Python вопросы с собеседований

25 May 2026 20:03

Pyinstrument - профилировщик Python, который показывает, где код реально тормозит 👀

Pyinstrument помогает быстро найти самые медленные участки Python-кода, чтобы не оптимизировать вслепую.

Что умеет:

- поддерживает Python 3.8+
- ставится обычным pip install pyinstrument
- строит интерактивные HTML-профили
- показывает выполнение в timeline mode
- интегрируется с Django через middleware
- работает с FastAPI
- автоматически подстраивает точность отображения времени под интервал профилирования

Удобная штука, когда нужно понять не «какая функция кажется подозрительной», а где программа действительно теряет время.

Для Python-проектов это один из тех инструментов, которые лучше подключить до того, как оптимизация превращается в гадание по логам.

https://github.com/joerick/pyinstrument

Читать полностью…

Python вопросы с собеседований

25 May 2026 11:51

Что выведет код?

def maker(f, args, kwargs):
    return 1 + f(*args, **kwargs)
m1 = maker(lambda a, b: a + b, (5, ), {"b": 2})
m2 = maker(lambda a, b: a * b, [4, 5], {})
print(m1 + m2)

Читать полностью…

Python вопросы с собеседований

23 May 2026 21:13

В Python 3.14.5 из-за утечек памяти возвращён старый сборщик мусора

Опубликован корректирующий выпуск языка программирования Python 3.14.5, в котором, помимо исправления ошибок и незначительных уязвимостей, осуществлён возврат на старый сборщик мусора, применявшийся до ветки 3.14.x. В качестве причин внесения нетипичного для промежуточных выпусков значительного изменения называются жалобы пользователей на существенное повышение потребления памяти после перевода рабочих систем на ветку 3.14 и появление утечек памяти.

Подробнее:
https://opennet.ru/65445/
https://opennet.me/65445/

Читать полностью…

Python вопросы с собеседований

16 May 2026 12:36

10 open-source репозиториев, которые можно форкнуть и превратить в SaaS с выручкой от $50 до $5 млн в год

Подборка проектов с GitHub, у каждого из которых уже есть основатели, поднявшие миллионы на той же кодовой базе. Лицензии позволяют форкать, перепаковывать и продавать как сервис.

Cal.com, open-source аналог Calendly. Форкаешь, делаешь белый лейбл, продаёшь стоматологам и юристам за $200 в месяц. Сами основатели Cal.com сделали $5M ARR за 3 года ровно по этой модели. Репозиторий: github.com/calcom/cal.com

Plausible Analytics, приватная альтернатива Google Analytics. Self-hosted, перепродаёшь агентствам по $50 в месяц за клиента. Два фаундера вытащили проект до семизначной выручки на бутстрапе. Репозиторий: github.com/plausible/analytics

Ghost, open-source движок для блогов и рассылок, прямой конкурент Substack. Маржа стремится к 100%. Тысяча читателей по $5 в месяц, это $60 000 в год, и так каждый год. Репозиторий: github.com/TryGhost/Ghost

n8n, open-source Zapier для автоматизаций. Продаёшь настройку интеграций за $500–$2000 за внедрение, дальше идёт поддержка. Сама n8n подняла $14M, потому что агентская модель поверх их кода работает. Репозиторий: github.com/n8n-io/n8n

Supabase, бесплатная замена Firebase. Поднимаешь SaaS за выходные, берёшь $29–$99 в месяц с пользователя. Сами Supabase подняли $116M, и не просто так. Репозиторий: github.com/supabase/supabase

Medusa, open-source Shopify. Берёшь 5% с каждой продажи навсегда, ничего не отдаёшь самой платформе. Репозиторий: github.com/medusajs/medusa

AppFlowy, open-source Notion. Продаёшь self-hosted версию корпоратам, которые параноят за свои данные. Сама AppFlowy подняла $30M, потому что рынок огромный. Репозиторий: github.com/AppFlowy-IO/AppFlowy

Coolify, open-source Vercel и Heroku в одном флаконе. Берёшь с разработчиков $20 в месяц за управление деплоями вместо их $200 чека от Vercel. Репозиторий: github.com/coollabsio/coolify

Listmonk, open-source Mailchimp. Шлёшь безлимит писем за стоимость AWS, перепродаёшь агентствам с десятикратной наценкой. Репозиторий: github.com/knadh/listmonk

Penpot, open-source Figma. Продаёшь self-hosted дизайн-инструменты агентствам, которые не готовы заливать файлы клиентов в облако. Репозиторий: github.com/penpot/penpot

Разница между разработчиком, который пишет фичи, и разработчиком, который строит бизнес, это одно решение. Выбираешь проект, форкаешь на выходных, отгружаешь на следующей неделе. Фаундеры этих репозиториев уже доказали, что модель работает. Лицензии 100% свободные, исходники 100% открыты.

Читать полностью…

Python вопросы с собеседований

14 May 2026 16:53

👣 На Stepik обновили курс «Rust: полный курс разработчика. С нуля до профи»

Представьте: через три месяца вы открываете чужой Rust-код и читаете его как книгу.

Arc<Mutex<T>> не вызывает панику. impl Future не пугает. Вы точно знаете, почему компилятор ругается и как это починить за 10 секунд.

Это не фантазия. Это результат 50 уроков, в которых каждая концепция объясняется через код и закрепляется практикой.

Ownership, traits, generics, async, unsafe - всё, что казалось магией, станет рабочим инструментом.

А бонусом - портфолио проектов: от CLI-утилит до REST API и WebAssembly.

Вы и так знаете, что Rust - ваш следующий язык. Этот курс просто сделает это реальностью.

Сегодня - 55% процентов от цены, торопись: https://stepik.org/a/269250/

Читать полностью…

Python вопросы с собеседований

12 May 2026 14:02

✔️ Релиз Ernie 5.1: треть параметров Ernie 5.0 и 4 место в Arena Search Leaderboard

Baidu выпустила языковую модель Ernie 5.1 с закрытыми весами. Затраты на претрейн составили 6% от типичного бюджета для моделей этого класса.

Новинка построена на базе Ernie 5.0, но содержит треть от общего числа параметров и использует вдвое меньше активных параметров при инференсе.

В Arena Search Leaderboard модель заняла 1 место среди китайских сетей и 4 в мире. По заявлению Baidu, в тестах агентов Ernie 5.1 обходит DeepSeek-V4-Pro, а в логике и математике сопоставима с Gemini 3.1 Pro.

Экономия вычислений достигнута за счет методики Once-For-All. Baidu обучала семейство моделей за один проход: сети делят общие веса, варьируясь по глубине и количеству активных блоков MoE.

Основной претрейн выполнили при создании Ernie 5.0, для версии 5.1 потребовалось только извлечь оптимальную конфигурацию.

Для борьбы с эффектом качелей (падение креативности при улучшении логики) применили четырехэтапный файнтюн: SFT, параллельная тренировка узкоспециализированных экспертов, дистилляция их навыков в единую модель-ученика и финальный RL.

Доступ к Ernie 5.1 открыт через онлайн-площадки компании.

@ai_machinelearning_big_data

#news #ai #ml

Читать полностью…

Python вопросы с собеседований

08 May 2026 13:02

⚙️ Генерация CAD моделей с текстом

Этот проект предоставляет открытый инструмент для создания 3D моделей с помощью текстовых описаний. Используйте кодовые агенты, такие как Codex, для генерации и экспорта CAD моделей в различных форматах, включая STEP и STL. Локальный просмотрщик позволяет удобно инспектировать созданные модели.

🚀Основные моменты:
- Генерация CAD моделей с помощью текстовых описаний.
- Экспорт в форматы STEP, STL, DXF и URDF.
- Локальный просмотрщик для инспекции созданных геометрий.
- Поддержка стабильных ссылок для точных редактирований.
- Быстрая проверка и итерация моделей.

📌 GitHub: https://github.com/earthtojake/text-to-cad

Читать полностью…

Python вопросы с собеседований

06 May 2026 15:04

⚡️ Векторные базы данных хорошо ищут похожие куски текста, но плохо понимают связи между ними.

Обычный поиск работает так: есть вопрос - база находит top-k самых похожих фрагментов. Это удобно, если нужно вытащить один факт.

Но если ответ спрятан в нескольких местах, например в разных документах, сообщениях или частях отчёта, простого similarity search уже мало. Нужно понять, как связаны люди, события, компании, причины и последствия.

На этом и делает акцент FalkorDB GraphRAG-Bench. Самый большой отрыв у GraphRAG виден именно в сложных задачах: Complex Reasoning - 83.61 и Contextual Summarization - 85.08. То есть там, где нужно не просто найти похожий текст, а собрать смысл из нескольких связанных фрагментов.

Простой вывод: если у вас база знаний, длинные документы или корпоративные данные, одного Vector DB может быть недостаточно. GraphRAG помогает модели не просто искать, а идти по связям.

GraphRAG SDK полностью open-source: https://github.com/FalkorDB/GraphRAG-SDK

Читать полностью…

Python вопросы с собеседований

04 May 2026 13:02

📚🤖 Переводите книги с помощью ИИ!

Этот проект позволяет переводить книги, субтитры и документы с использованием ИИ как локально, так и в облаке. Поддерживает форматы EPUB, SRT, DOCX и TXT, сохраняя оригинальное форматирование и структуру. Умная система обработки позволяет работать с документами любой длины, а функция сохранения прогресса помогает продолжать перевод с того места, где вы остановились.

🚀Основные моменты:
- Поддержка множества форматов: EPUB, SRT, DOCX, TXT
- Сохранение оригинального форматирования и стилей
- Умная обработка больших документов без потери контекста
- Возможность продолжить перевод с последнего сохраненного места
- Интеграция с различными провайдерами ИИ

📌 GitHub: https://github.com/hydropix/TranslateBooksWithLLMs

#python

Читать полностью…

Python вопросы с собеседований

03 May 2026 10:06

🖥 Курс «Git Pro: от первого коммита до уровня senior» - на Stepik

project_final_v2_FINAL_truly_final - знакомо?

Значит, пора.

Большинство разработчиков знают 5 команд Git и боятся шестую. Коммитят в main, гуглят «how to undo» и копируют папку «на всякий случай».

Это не работа - это выживание.

После курса вы:
— делаете rebase, не задерживая дыхание;
— разбираете конфликт на 200 файлов по алгоритму;
— возвращаете «потерянные навсегда» коммиты за 30 секунд через reflog;
— пишете историю, которую не стыдно показать на code review.
Git Flow, trunk-based, Pull Request, защита веток, CI/CD-хуки — всё, что отличает джуна от senior в командной работе.

Скидка 53%, 48 часов: https://stepik.org/course/284799/

Читать полностью…

Python вопросы с собеседований

09 June 2026 17:01

Python не медленный. Медленным его часто делает ваш код.

У Python есть странная репутация: стоит программе начать тормозить, виноват сразу язык. Но в реальности большая часть быстрых сценариев в Python работает не потому, что интерпретатор внезапно стал магическим, а потому что тяжёлая работа уходит ниже - в C, C++ или Rust.

CPython написан на C. Многие встроенные операции тоже выполняются в C:

- len()
- list.append()
- dict.get()
- sum()
- сортировка
- операции со строками
- часть работы со списками и словарями

Когда вы вызываете list.append(), Python не крутит всю логику добавления элемента на уровне байткода. Он платит небольшой overhead за вызов, а дальше попадает в C-функцию внутри CPython.

Медленный путь начинается там, где мы вручную гоняем данные по одному элементу:


total = 0

for x in data:
    total += x

На каждой итерации интерпретатор должен выполнить байткод, достать объект, проверить типы, сделать операцию, обновить значение и перейти к следующему элементу. Для маленьких списков это незаметно. Для миллионов элементов это уже цена, которую вы платите за каждую итерацию.

Быстрый путь выглядит иначе:


total = sum(data)

Здесь цикл проталкивается внутрь реализации. Python остаётся удобной оболочкой, а основная работа выполняется ближе к нативному коду.

С NumPy та же идея, только ещё жёстче:


total = np.sum(data)

Внутренний цикл почти не возвращается в Python. Массив обрабатывается внутри оптимизированного нативного кода, а обратно приходит уже готовый результат.

Поэтому фраза «Python медленный» слишком грубая.

Точнее так:

Python-циклы дорогие
C-циклы дешёвые
built-in функции часто быстрее ручного кода
NumPy быстрый не из-за синтаксиса, а потому что не гоняет каждый элемент через интерпретатор
хороший Python-код старается как можно дольше оставаться внутри готовых операций и библиотек

Оптимизация Python часто начинается не с переписывания проекта на Go или Rust, а с простого вопроса:

можно ли убрать ручной цикл и отдать работу тому коду, который уже написан на C, C++ или Rust?

Python хорош не как самый быстрый исполнитель каждой операции.

Он хорош как удобный слой управления над быстрыми нативными кусками.

Читать полностью…

Python вопросы с собеседований

04 June 2026 15:03

PaddleOCR-VL 1.6 официально вышел

PaddlePaddle выпустили PaddleOCR-VL 1.6 - новую версию модели для распознавания документов.

Результат: 96.33% на OmniDocBench. Это новый SOTA, причём модель обошла как open-source, так и закрытые решения в распознавании текста, формул и таблиц.

Что улучшили:

- первое место на OmniDocBench v1.5 и Real5-OmniDocBench
- заметно лучше распознаёт таблицы, обычный текст и редкие символы
- улучшено распознавание печатей, отдельных фрагментов и графиков
- полная совместимость с архитектурой v1.5
- миграция не нужна - можно подключать как plug-and-play

Где это полезно:

- финансовые контракты
- юридические документы
- исследовательские отчёты
- исторические архивы
- RAG-пайплайны
- подготовка качественных данных для LLM

https://github.com/PaddlePaddle/PaddleOCR

#PaddlePaddle #PaddleOCR #AI #ComputerVision

Читать полностью…

Python вопросы с собеседований

01 June 2026 13:40

Docker и Kubernetes: основы разработки под облачную инфраструктуру

Курс для тех, кто хочет держать свой стэк и знания актуальными и глубоко разбираться, как устроены Docker, Kubernetes, и современная облачная инфраструктура в целом.

🌐 Чему вы научитесь:

🤩 Создавать облачную инфраструктуру «с нуля» управление и конфигурация серверов с Terraform, Ansible, cloud‑init
🤩 Уверенно работать с Docker: Dockerfile, слои, кэш, многоступенчатые сборки, реестры, безопасность, air‑gapped
🤩 Проектировать многоконтейнерные приложения: паттерны Sidecar, Ambassador, Adapter, проверки (liveness/readiness), DaemonSet и поды
🤩 Настраивать сеть и балансировку в Kubernetes
ClusterIP, Services, Ingress, MetalLB, TLS/SNI, сервис‑меши (Istio)
🤩 Организовывать хранение данных: PersistentVolumes / PVC, StorageClasses, резервное копирование. Упаковка в Helm и поддержка через Operator

🥸 Кто мы: R&D-центр Devhands. Автор курса — Николай Ихалайнен, эксперт по СУБД и бекенду (ex-Percona), со-основатель MyDB, энтузиаст открытого ПО.

🗓 Старт курса: 10 июня, 6 недель обучения.
Изучить программу и записаться можно здесь.

Ждем вас!

Реклама. ИП Рыбак А.А. ИНН 771407709607 Erid: 2VtzqxNnFKA

Читать полностью…

Python вопросы с собеседований

28 May 2026 16:03

🐍 Python Roadmap 2026: наконец-то полноценная актуальная карта изучения Python, а не список ссылок «разберись сам»

На GitHub выложили большой русскоязычный роадмап по Python на 2026 год - от первых скриптов до уровня Middle+/Senior.

Маршрут собран под современный Python:

- Python 3.13+
- free-threaded mode без GIL
- JIT
- uv вместо боли с pip/venv/poetry
- ruff, pyright, pytest, hypothesis
- async-first подход
- типизация
- CPython внутри
- web, базы, ML/AI, DevOps и архитектура

В роадмапе есть нормальная последовательность: сначала окружение и база, потом идиомы, ООП, типы, стандартная библиотека, асинхронность, тестирование, внутренности CPython, web, базы данных, AI-направление, продакшн и архитектура.

Отдельный плюс - практический формат. На каждом этапе есть задачи, чеклисты, примеры кода и бесплатные ресурсы. То есть это не мотивационная простыня, а маршрут, по которому реально можно идти несколько месяцев и видеть прогресс.

Для новичков - понятный путь без хаоса.
Для джунов - способ закрыть дыры.
Для тех, кто уже пишет на Python - хороший чеклист, чтобы понять, где ты всё ещё плаваешь.

Python в 2026 году - это tooling, типы, async, инфраструктура, AI и продакшн-дисциплина. И этот роадмап как раз про такой Python.

https://github.com/justxor/pythonroamap2026

Читать полностью…

Python вопросы с собеседований

27 May 2026 17:55

🖥 Python в 2026 - уже не просто «первый язык программирования».

Это инструмент, с которым можно автоматизировать задачи, писать скрипты, собирать проекты, работать с данными, делать ботов и использовать ИИ как ускоритель разработки.

Но есть проблема: большинство новичков учат Python кусками. Немного синтаксиса, пару задачек, немного теории - и потом ступор: «а что с этим делать дальше?»

Этот курс сделан иначе. Здесь упор на реальную практику: вы не просто смотрите уроки, а постепенно учитесь писать код, разбирать ошибки, собирать рабочие решения и понимать, как Python применяется в нормальных задачах.

Что внутри:

- Python с нуля понятным языком
- практика вместо бесконечной сухой теории
- реальные задачи и проекты
- автоматизация рутины
- работа с файлами, данными и API
- понятная логика программирования
- современный подход к разработке с ИИ
- отдельный акцент на вайбкодинг

Вайбкодинг -это умение правильно ставить задачу, проверять код, понимать результат и ускорять работу без слепого копирования. В 2026 году это уже не бонус, а нормальный навык разработчика.

Сегодня скидка 60 процентов: https://stepik.org/course/288218/info

Читать полностью…

Python вопросы с собеседований

25 May 2026 18:26

⚡️ Студкемп от Яндекса Образования и Томского политеха: 2 недели погружения в компьютерное зрение на реальных данных

Интенсив с упором на практику пройдет с 10 по 23 августа. Вот что вас ждет за это время:

— Обучение системам компьютерного зрения для робототехники, медицины, контроля качества.
— Погружение в современные технологии: от архитектур до мультиагентных систем на основе VLM.
— Нетворкинг со студентами и ML-специалистами со всей России.
— Практика на исследовательских данных и работа над собственным проектом.

Студкемп пройдёт на базе ТПУ. Участие бесплатное, для прошедших отбор Яндекс Образование оплатит дорогу и проживание. Потребуются знания линейной алгебры, теории вероятностей, матстата. Python + базовые ML/CV-библиотеки.

Регистрируйтесь на студкемп по ссылке, до 14 июня

Читать полностью…

Python вопросы с собеседований

24 May 2026 10:02

Готовы проверить свои знания в Golang?

Пройдите быстрый тест, чтобы выявить сильные и слабые стороны и стать еще круче в Go 😎

5 вопросов по синтаксису и стандартной библиотеке разных уровней сложности ждут вас 👇

ПРОЙТИ ТЕСТ

Читать полностью…

Python вопросы с собеседований

19 May 2026 13:03

⚡️ Machine Learning Roadmap 2025: большая карта входа в ML без сказок про “нейросети за месяц

Большой русскоязычный roadmap по машинному обучению: от первого import numpy до LLM, RAG, fine-tuning, AI-агентов и MLOps и даже вабкодинга.

Внутри нормальная структура: что учить, в каком порядке, зачем это нужно и что должно получиться на практике после каждого этапа.

Roadmap разбит на 7 треков:

1. Фундамент: Python, математика, статистика, инструменты
2. Классический ML: scikit-learn, табличные данные, метрики, валидация
3. Deep Learning: PyTorch, CNN, RNN, training loop
4. LLM и трансформеры: attention, KV-cache, RAG, LoRA, агенты
5. Generative AI: изображения, видео, аудио, мультимодальность
6. MLOps и прод: Docker, Kubernetes, CI/CD, monitoring, serving
7. Специализация: CV, NLP, RecSys, RL, Safety

Roadmap не продаёт иллюзию “обучил модель - стал ML-инженером”.

В реальной работе много времени уходит на данные, метрики, деплой, мониторинг, воспроизводимость и разбор ошибок. Модель - только часть системы.

Хорошая мысль из roadmap: LLM не делает джуна сеньором. Она ускоряет того, кто уже понимает базу. Без базы человек просто становится оператором Copilot, который не может объяснить, почему всё сломалось.

По времени тоже без сказок:

1. 0-3 месяца: Python, математика, классический ML
2. 3-6 месяцев: Deep Learning и PyTorch
3. 6-12 месяцев: LLM, RAG, fine-tuning, AI-агенты
4. 12+ месяцев: MLOps, прод, масштабирование, специализация

Тут же собрано 7 болших бесплатных курсов по машинному обучению, математике и вайбкодингу!

Если давно хотели зайти в ML системно, а не прыгать между роликами про ChatGPT, Stable Diffusion и “топ-10 библиотек”, это хороший ориентир.

https://github.com/justxor/MachineLearningRoadmap

Читать полностью…

Python вопросы с собеседований

15 May 2026 10:18

✔️ Пекин заблокировал экспорт Nvidia H200 после одобрения Минторгом США

Разрешения получили около 10 компаний (Alibaba, Tencent, ByteDance и JD и дистрибьюторы Lenovo и Foxconn). Квота составляет до 75 тысяч чипов на клиента. Правительство КНР остановило сделки для перевода инфраструктуры на локальные аналоги.

Дополнительным барьером стала новая схема логистики от администрации США. Ведомство требует 25% выручки от продаж, для чего обязали физически провозить электронику через американскую территорию перед отправкой заказчикам. Китайские регуляторы видят в таком маршруте риск компрометации цепочек поставок и установки аппаратных закладок.

Для проведения переговоров по контрактам глава Nvidia присоединился к миссии США в Пекине.
reuters.com

✔️ Anthropic временно увеличила лимиты для Claude Code на 50%

До 13 июля пользователи платных тарифов Pro, Max, Team и Enterprise смогут обращаться к ИИ-ассистенту в полтора раза чаще. Новые еженедельные квоты и действуют во всех рабочих средах: CLI, расширениях для IDE, а также в десктопной и веб-версиях.

Это расширение станет отличным подспорьем для разработчиков, поскольку 50-процентная надбавка суммируется с обновлением прошлой недели, когда Anthropic в 2 раза увеличила лимиты на пятичасовые сессии. Никаких дополнительных действий для активации нового лимита не требуется.
ClaudeDevs в сети Х

✔️ Управлять Codex теперь можно с iOS и Android

OpenAI добавила функцию удаленного управления Codex в мобильное приложение ChatGPT. Мобильный клиент в реальном времени транслирует скриншоты среды, логи терминала, результаты тестов и diff-файлы. Пользователь может проверять промежуточные результаты, корректировать действия ИИ и подтверждать выполнение команд без физического доступа к ПК.

Соединение устройств идет через внутренний ретранслятор без прямого доступа к машине из публичного интернета. Исходный код, ключи и локальные настройки не покидают рабочую среду. Одновременно OpenAI выпустила функцию Remote SSH для запуска агента в корпоративных инфраструктурах.

Управление агентом со смартфона доступно на всех тарифах. Для подключения необходимо обновить мобильный ChatGPT и десктопный клиент для macOS. Поддержка Windows ожидается позже.
openai.com

✔️ arXiv начнет банить авторов на год за невычитанные тексты от LLM

О новых правилах объявил Томас Дитерих. Согласно политике, авторы несут полную ответственность за содержимое препринтов, включая плагиат, предвзятость и фактические ошибки языковых моделей.

Поводом для блокировки аккаунта станут явные следы ИИ-генерации: выдуманные источники в списке литературы, забытые ответы чат-ботов или просьбы заполнить таблицу реальными данными экспериментов.

Нарушители лишаются права публиковаться на один год. После истечения бана прямая загрузка препринтов для них останется недоступной, для размещения статьи потребуется предоставить доказательства ее принятия авторитетным рецензируемым изданием или конференцией.
Ведущий модератор раздела CS.LG сервиса arXiv

✔️ GPT-5.5 и Claude Mythos прошли стенды AISI на автономный взлом

Британский институт безопасности ИИ протестировал модели GPT-5.5 и Claude Mythos на способность к автономному хакингу. По данным исследователей, нейросети прервали предыдущий тренд на удвоение сложности решаемых задач каждые 4,7 месяца, показав результаты за пределами измерительной шкалы института.

Модели проверяли на изолированных стендах с имитацией корпоративных сетей. Задачи включали поиск уязвимостей, веб-эксплуатацию и реверс-инжиниринг. Для тестов контекстное окно ограничивали 2,5 млн токенов. В этих условиях Claude Mythos первым прошел оба комплексных сценария: "The Last Ones" и инфраструктуру "Cooling Tower", требующих планирования многоэтапной атаки. GPT-5.5 также показала высокие результаты.

По оценкам AISI, при использовании агентной архитектуры и снятии лимита на токены доля успешных взломов приближается к 100%, из-за чего вычислить предел возможностей новых моделей пока не удается.
aisi.gov.uk

@ai_machinelearning_big_data

#news #ai #ml

Читать полностью…

Python вопросы с собеседований

14 May 2026 09:27

В Python 3.14.5 из-за утечек памяти возвращён старый сборщик мусора

Опубликован корректирующий выпуск языка программирования Python 3.14.5, в котором помимо исправления ошибок и незначительных уязвимостей, осуществлён возврат на старый сборщик мусора, применявшийся до ветки 3.14.x. В качестве причин внесения нетипичного для промежуточных выпусков значительного изменения называются жалобы пользователей на существенное повышение потребления памяти после перевода рабочих систем на ветку 3.14 и появление утечек памяти.

Подробнее:
https://opennet.ru/65445/
https://opennet.me/65445/

Читать полностью…

Python вопросы с собеседований

12 May 2026 12:24

Python 3.15 beta 1 вышела в релиз 🐍

Это значит, что крупные фичи для релиза фактически зафиксированы. Дальше - бета, тесты, багфиксы и подготовка к финальному релизу.

Что интересного в 3.15:
- lazy imports через ключевое слово lazy
- встроенные frozendict и sentinel
- JIT стал быстрее на x86-64 Linux
- распаковка прямо внутри comprehensions
- новый статистический profiler с низким overhead
- frame pointers включены по умолчанию

Python 3.15.0b1 вышел 7 мая 2026 года, это первая из четырёх запланированных beta-версий и точка feature freeze; финальный релиз запланирован на 1 октября 2026 года.

https://blog.python.org/2026/05/python-3150-beta-1/

Читать полностью…

Python вопросы с собеседований

07 May 2026 12:16

Когда Вайбкодера просят объяснить логику работы Кода.

Читать полностью…

Python вопросы с собеседований

04 May 2026 21:40

🌟 CocoIndex v1: релиз инкрементального движка для агентов.

CocoIndex выпустила первую стабильную версию своего движка для построения данных под агентов длительного действия - тех, которые обслуживают RAG, графы знаний, память и контекст в продакшн-системах.

CocoIndex - специализированный опенсорсный инкрементальный ETL-движок (Extract, Transform, Load) для создания ИИ-систем. Он используется для автоматизации обработки данных и их мгновенной индексации в векторные базы или графы знаний.

Инструмент любят за его способность обновлять информацию в реальном времени: как только исходные данные меняются, CocoIndex точечно пересчитывает только нужные части индекса, избавляя от необходимости полной и дорогостоящей переиндексации всей базы.

🟡Главное изменение v1 - полный отказ от DSL

Весь пайплайн теперь описывается обычными асинхронными функциями Python, которые вызывают друг друга. Движок продолжает отслеживать изменения и материализовать целевые состояния, но делает это за нативным Python-API, а не за отдельной системой типов.

Авторы вдохновлялись тезисом Джеффа Дина и Билла Далли с GTC 2026: агенты работают примерно в 50 раз быстрее человека, но опираются на инструменты, рассчитанные на человеческий темп.

Ночные пересборки индексов в этой логике становятся проблемой - нужен движок, который синхронизирует производные данные с источником инкрементально, переобрабатывая только изменившиеся чанки и перезаписывая только изменившиеся строки.

🟡Помимо отказа от DSL, релиз принёс ещё 3 изменения

🟢Во-первых, движок использует систему типов самого Python: PIL.Image, pyarrow.Table, torch.Tensor и любой класс из импортированной библиотеки можно передавать в функции напрямую, без обёрток и двусторонней конверсии.

🟢Во-вторых, Postgres больше не нужен - состояние движка хранится в одном локальном файле. Postgres остался полноценным таргетом, просто перестал быть обязательной зависимостью.

🟢В-третьих, источники и таргеты создаются во время выполнения: можно монтировать отдельный таргет на каждого тенанта, строить топологию по строкам конфигурационной таблицы или подключать Kafka-топик по фича-флагу.

🟡Ядро по-прежнему на Rust

Вся горячая логика по детекции и применению изменений живёт там. На уровне Python декоратор подключает функцию к отслеживанию изменений, а отдельный флаг кеширует её результат по хешу аргументов и кода: правка хелпера инвалидирует только тех вызывающих, кто реально от него зависит.

🟡Контракт управляемых таргетов сохранился

Разработчик декларирует, как должна выглядеть таблица, граф или директория, а CocoIndex сам выполняет create/alter/drop для контейнеров и insert/update/delete для содержимого, включая удаление осиротевших объектов при изменении схемы. Если перестать декларировать сущность, она исчезает из таргета.

Контракт работает одинаково для Postgres, LanceDB, Neo4j, Kafka, S3 и обычных файлов на диске.

Примеры пайплайнов, от эмбеддингов кода в LanceDB и обработки PDF до сборки графа знаний из разговоров, лежат в репозитории на GitHub.

📌Лицензирование: Apache 2.0 License.

🟡Документация
🖥 GitHub

@ai_machinelearning_big_data

#AI #ML #ETL #RAG #Agents #СocoIndex

Читать полностью…

Python вопросы с собеседований

03 May 2026 12:06

LeRobot — современное машинное обучение для реальной робототехники в Pytorch.

LeRobot стремится предоставить модели, наборы данных и инструменты для робототехники реального мира в PyTorch.

Читать полностью…

Python вопросы с собеседований

02 May 2026 13:02

✔️ CLAUDE.md - это не README для людей. Это инструкция для AI-агента, который будет работать с вашим кодом.

Если файл написан плохо, Claude начинает гадать: какой стек, какие команды запускать, где лежат компоненты, какой стиль кода использовать и что вообще можно менять.

Нормальный CLAUDE.md держится на трёх уровнях.

Глобальный - ваши правила для всех проектов: стиль, предпочтения, запреты.

Проектный - правила конкретного репозитория: стек, команды сборки, тесты, архитектура, соглашения команды.

Папочный - локальный контекст для отдельных модулей: API, компоненты, utils, backend, frontend.

Главный принцип простой: чем ближе CLAUDE.md к файлу, тем важнее его правила. Если есть конфликт, побеждает последний уровень.

Хороший CLAUDE.md отвечает на три вопроса.

Что это за проект: название, цель, стек, структура, зависимости.

Зачем всё устроено именно так: архитектурные решения, стиль кода, naming, анти-паттерны.

Как с этим работать: команды build, test, lint, формат коммитов, деплой, CI/CD.

И самое важное - не пиши абстракции типа «пиши чистый код». Это бесполезно.

Пиши конкретно: «используй camelCase для переменных, PascalCase для компонентов, перед коммитом запускай npm test, не трогай server components без причины».

CLAUDE.md должен быть коротким, живым и практичным. Не больше 500 строк, обновлять раз в месяц, ссылки на package.json и tsconfig вместо копипаста.

Потому что AI-агенту не нужен красивый документ. Ему нужен рабочий контекст, который не даёт ломать проект.

https://www.youtube.com/shorts/63QIyLioafI?feature=share

Читать полностью…

Subscribe to a channel