Python Academy — один канал вместо тысячи учебников Чат канала: @python_academy_chat Сотрудничество: @zubar89 Канал включён в перечень РКН: https://rkn.link/TVu
Как мы строим новое облако MWS — рассказываем в технических статьях «под капотом».
Читайте и берите идеи в свои проекты.
➡️ Сетевая телеметрия для облака — от протоколов до продакшена
Про BFD, TWAMP и STAMP, зачем нам push-модель и gNMI, и что происходит, когда Telegraf не дружит с Kafka.
➡️ Как мы наливаем Kubernetes на железо и управляем десятками кластеров
Рассказываем про платформу собственной разработки — Piñata.
➡️ IAM в облаке: от логина до сервисных агентов
RBAC, сервисные учётки, HMAC-ключи — и почему у нас нет «режима бога».
➡️ Как устроен Compute: декларативный API, реконсиляция и немного геймдева
Рассказываем про архитектуру Compute в MWS и наш подход к его разработке.
🔗 Подпишись на облачный хаб MWS
⏩️Там регулярно рассказываем, как строим новое облако с нуля.
Получаем гласные
Этот пример возвращает в строке найденные гласные "a e i o u". Это может оказаться полезным при поиске или обнаружении гласных.
Сокращение ссылок с помощью PyShorteners
Вы наверняка сталкивались с сервисами по сокращению ссылок, даже если никогда не использовали их сами. Сокращённые ссылки часто встречаются в описаниях к видео на YouTube, в статьях и на множестве других ресурсов в интернете.
Создание сокращенной ссылки может показаться сложной задачей, но на самом деле это можно сделать всего за три строчки кода с помощью библиотеки PyShorteners
, пример кода можно найти на фото.
#python #pyshorteners
Преобразование текста в аудио на Python
Используя библиотеку gTTS (Google Text-to-Speech)
для Python
, можно легко преобразовывать текст в аудиофайлы. Эта библиотека использует API Google Translate
для синтеза речи, обеспечивая высокое качество преобразования. Установка библиотеки производится стандартным способом через pip
.
Для начала работы с gTTS
необходимо создать его экземпляр, передав текст, который нужно озвучить, в качестве первого аргумента. Также есть возможность указать язык озвучивания через опциональный аргумент, который по умолчанию установлен на английский.
Чтобы сохранить синтезированную речь в аудиофайл, используется метод save
, аргументом которого является имя файла.
#python #gtts
Обрабатываем номера телефонов
Пакет phonenumbers
основан на библиотеке libphonenumber от Google, которая позволяет форматировать, парсить и проверять номера телефонов.
Основным классом, который представляет номер, является PhoneNumber
. Объект можно создать, вызвав метод parse()
и передав в аргументы номер телефона в виде строки. Вторым аргументом также можно указать страну.
В целом, пакет использовать достаточно просто, базовые примеры есть на картинке. Также можете посмотреть документацию для более продвинутого использования.
#python #phonenumbers
МТС приглашает разработчиков на масштабную ИТ-конференцию True Tech Day 6 июня. Участие бесплатное.
6 июня в Москве соберутся эксперты крупных ИТ-компаний, чтобы обсудить кейсы внедрения ИИ в бигтехах и будущее разработки.
В программе:
— Выступления зарубежных спикеров с индексом Хирша более 50.
— Множество практических кейсов: узнай, как создаются крупные ML-проекты.
— Доклады по архитектуре, бэкенд-разработке и построению ИТ-платформ.
— AI-интерактивы и технологические квесты: собери сервак, взломай Теслу, создай ИИ-ассистента и поучаствуй в экстрим-кодинге.
— Пространство для нетворкинга,
…а еще after-party со звездным лайн-апом.
Участвуй очно или онлайн, обменивайся опытом и знакомься с ведущими специалистами со всей страны!
Ждем тебя и коллег 6 июня в МТС Live Холл.
Участие бесплатное, но офлайн-места ограничены.
Регистрируйся по ссылке: https://truetechday.ru/
Многопоточность
В модуле threading
новый поток выполнения может начинаться с нового threading.Thread
и присвоения ему функции для выполнения.
Параметр target
ссылается на функцию (или вызываемый объект), который будет работать. Нить не начнет выполнение до start
, также не будет вызываться Thread
объекта.
Когда my_thread
завершается, вызов start
выкинет исключение RuntimeError. Если вы хотите запустить Thread в фоновом режиме, то передавайте daemon=True
или установите my_thread.daemon
в True
перед вызовом start()
.
#потоки #многопоточность
Как работают статические методы
Статические методы создаются в классе при помощи декоратора @staticmethod
. Такие методы привязаны к классу, а не объекту — в этом и есть основное отличие.
Такой тип методов не может модифицировать ни объект, ни сам класс. То есть передавать объект или класс и прописывать self
или cls
в аргументах не нужно.
Обычную функцию стоит вносить в класс в качестве статического метода в том случае, когда эта функция логически относится к классу и имеет смысл там быть.
#ооп
FastAPI
FastAPI – фреймворк, про который однозначно стоит рассказать. Честно, синтаксис мне кажется намного приятнее, чем у других фреймворков.
Интересно, что автор фреймворка глубоко изучил несколько других фреймворков, от классических, таких как Django, до более современных, таких как Sanic, а также изучил различные технологии в NestJS (веб-фреймворк Node.js, Typescript).
Фреймворк имеет важную особенность – автоматическая генерация документации: как только ваши конечные точки будут реализованы, вы сможете поиграться с API, используя соответствующий стандартам пользовательский интерфейс. Поддерживаются SwaggerUI, ReDoc и другие.
FastAPI построен на удивительной библиотеке Starlette, в результате чего производительность сравнима с Node.js, а в некоторых случаях даже Go! В целом, складывается стойкое предчувствие, что FastAPI будет мчаться вперёд как лучший асинхронный фреймворк для Python.
#фреймворки #web
FFmpeg: Лучшее решение для обработки мультимедийных файловFFmpeg
- это бесплатная и открытая библиотека и набор инструментов для обработки мультимедийных файлов. Она предоставляет мощные возможности для работы с видео, аудио и другими мультимедийными данными. FFmpeg
является одним из самых популярных и универсальных инструментов для обработки мультимедиа в мире.
Для начала использования FFmpeg
, вы можете установить библиотеку командой pip install ffmpeg-python
. После этого, вы можете создавать собственные скрипты для обработки видео и аудио файлов, определяя нужные операции и параметры. ffmpeg-python
обладает мощными возможностями для конвертации, обрезки, склеивания и многого другого.
Исходный код и документация доступны тут
Упрощенная работа с JSON
Казалось бы, куда еще проще, но есть один интересный пакет JMESpath
, который позволяет декларативно указать, как извлекать элементы из документа JSON.
Основные примеры использования показаны на картинке, там нет ничего сложного. Метод search
принимает паттерн, по которому требуется извлечь данные, а также словарь (который в общем-то похож на JSON).
Вообще возможностей у пакета достаточно, поэтому он достоен изучения и применения в проектах. Подробнее советую почитать в документации.
#json #jmespath
Создаем интерактивные веб-приложения с StreamlitStreamlit
позволяет превращать скрипты Python
в интерактивные веб-приложения за считанные минуты, а не за недели. Создавайте информационные панели, генерируйте отчеты или создавайте приложения для чата.
Создав приложение, вы можете использовать облачную платформу Community Cloud для развертывания, управления и распространения приложения.
Почему стоит выбрать Streamlit?
— Простота и питоничность: Пишите красивый, легко читаемый код.
— Быстрое интерактивное создание прототипов: Позвольте другим людям взаимодействовать с вашими данными и быстро предоставлять отзывы.
— Редактирование в реальном времени: Видите, как ваше приложение мгновенно обновляется по мере редактирования кода.
#python #streamlit
Перебираем все возможные 8 значные пароли состоящие из букв и цифр с помощью Python
В этом примере используется модуль itertools
, который позволяет генерировать все возможные комбинации символов из списка characters
длиной password_length
. Затем перебираются все комбинации и выводятся на экран.
Обратите внимание, что перебор всех возможных 8-значных паролей может занять большое количество времени, особенно если количество символов в characters
большое. Будьте осторожны и убедитесь, что ваше намерение соответствует законам и этическим правилам.
#python #itertools
Функция itertools.chain()
Функция itertools.chain()
в Python объединяет несколько итераторов в один. Она принимает в качестве аргумента один или несколько итераторов, и возвращает итератор, который последовательно возвращает элементы из этих итераторов.
Например, код сверху объединяет две строки в одну.
#python
Дробные числа
По умолчанию числа с плавающей точкой используют память привычным образом, то есть они хранятся в двоичном виде. Это означает, что вы обычно работаете с приблизительными значениями, а не точными.
Можно использовать тип данных Decimal
, который предоставит намного большую точность, но и его может не хватить в некоторых случаях.
Поэтому для идеальных вычислений лучше использовать Fraction
, который представляет и хранит число в виде рациональной дроби.
#числа #fraction
Упаковка параметров с помощью urlencode
Довольно часто приходится работать с разнообразными API и совершать get-запросы с передачей множества параметров. Чаще всего составление запроса в коде выглядит примерно так:url = 'https://example.com?item={}&size={}&color={}&amount={}'.format('t-shirt', 'M', 'white', 5)
Смотрится не слишком презентабельно, однако есть слегка более длинный, но значительно улучающий читаемость кода вариант – функция urlencode
из модуля urllib
.
#трюки #urllib
Обрабатываем естественный язык
TextBlob — удобный пакет для обработки текста. Он предоставляет простой API для погружения в общие задачи обработки естественного языка (NLP), такие как анализ тональности, пометку частей речи, перевод и многое другое.
Здесь особенно круто, что к объектам класса TextBlob
можно применять методы строк (upper
, split
, format
и т. д.) и в целом обращаться с ними как с обычными строками.
Документация находится здесь, но некоторые примеры есть и на картинке выше. Еще важно, что несколько функций, например translate()
, требуют подключения к интернету.
#textblob
Отлавливаем ошибки с помощью assert
Инструкция assert
принимает логическое выражение и необязательное сообщение. Она используется для проверки типов, значений аргумента и вывода функции, а также для отладки, поскольку останавливает программу в случае ошибки.
Если выполнить инструкцию assert
с логическим выражением, результат которого равен True
, ничего не произойдет. Но в случае с False
будет сгенерировано исключение AssertionError
.
Однако не нужно пытаться обработать исключение AssertionError
блоком try-except
. В таком случае assert
теряет свой смысл.
В примере мы проверили, является ли переданный аргумент числовым типом данных. Если не является, то будет вызвано исключение и выведено указанное сообщение.
#исключения #assert
Быстрый dequedeque
предпочтительнее, чем обычный список, когда нужны более быстрые операции добавления и вытаскивания элементов с начала и конца контейнера.deque
обеспечивает линейную сложность O(1) для операций добавления и выталкивания, у стандартного списка сложность по этим операциям O(n).
Для deque
есть возможность использовать стандартные функции — sum
, min
, max
и другие.
Полезные функции модуля itertools
Модуль itertools
- инструмент в Python
для работы с итерируемыми объектами. Он предоставляет различные функции для создания и манипулирования итераторами, что делает его незаменимым инструментом для разработчиков.
Давайте рассмотрим некоторые полезные функции из этого модуля:
1. itertools.count()
: Эта функция создает бесконечный итератор, который генерирует последовательность чисел, начиная с заданного значения. Это удобно использовать, например, при создании уникальных идентификаторов.
2. itertools.cycle()
: Эта функция создает итератор, который бесконечно повторяет элементы из исходной последовательности. Это может быть полезно, когда вам нужно обрабатывать данные циклически.
3. itertools.islice()
: С помощью этой функции можно получить срез элементов из итератора, подобно срезу для списков. Это позволяет работать с большими итерируемыми объектами без необходимости загрузки их в память целиком.
4. itertools.chain()
: Эта функция объединяет несколько итерируемых объектов в один, что упрощает итерацию по ним как по одному объекту.
5. itertools.groupby()
: Эта функция позволяет группировать элементы итерируемого объекта на основе заданного ключа. Это особенно полезно при анализе и обработке данных.
И это далеко не все функции, доступные в модуле itertools
. Он предоставляет множество возможностей для более эффективной итерации и манипуляции данными.
Indico
Indico — это мощная библиотека Python для извлечения информации из неструктурированных текстов, изображений и PDF-файлов. Она позволяет вам выполнять задачи обработки естественного языка (NLP), компьютерного зрения (CV) и машинного обучения (ML) с помощью простых и понятных API.
https://pypi.org/project/indico/
Удаление страниц PDF-файла
Библиотека PyMuPDF включает в себя довольно много сложных методов, которые упрощают удаление страниц из файла PDF. Он позволяет указать либо одну страницу (используя метод deletePage()), либо диапазон номеров страниц (используя метод deletePageRange()), либо список с номерами страниц (используя метод select()).
В следующем примере показано, как использовать список для выбора страниц, которые нужно сохранить в исходном документе. Имейте в виду, что страницы, которые не указаны, не будут частью выходного документа. В нашем случае выходной документ содержит только первую, вторую и четвертую страницы.
#python
Тестирование на pytestpytest
— ближе по духу к языку Python
нежели unittest
, которая накладывает определенные обязательства при разработке тестов. Например, создание классов-наследников от TestCase или выполнение определенной процедуры запуска тестов.
Но при разработке на pytest
ничего этого делать не нужно. Вы просто пишете функции, которые должны начинаться с "test_" и используете assert, встроенные в Python
.
Также он поддерживает запуск тестов на unittest
и nose
, то есть полная обратная совместимость с ними.
#python #pytest #assert
Selenium: Автоматизация веб-браузера в Pythonselenium
- это библиотека, предназначенная для автоматизации веб-браузера в языке программирования Python
. Она предоставляет удобные и эффективные средства для взаимодействия с веб-страницами, заполнения форм, нажатия кнопок и многих других действий, которые облегчают автоматизацию веб-процессов.
Одним из ключевых преимуществ selenium
является его гибкость и многофункциональность. Вы можете использовать эту библиотеку для создания скриптов, которые могут автоматизировать различные задачи в веб-браузере, такие как тестирование веб-приложений, сбор данных с веб-сайтов или даже управление аккаунтом в социальных сетях.
Для начала работы с selenium
, вам нужно установить библиотеку командой pip install selenium
. После установки, вы можете создавать скрипты, которые будут взаимодействовать с веб-сайтами, имитируя действия пользователя. selenium
предоставляет множество методов для работы с веб-элементами, что делает его одним из лучших инструментов для автоматизации веб-процессов.
С помощью selenium
, вы можете автоматизировать рутинные задачи в веб-браузере, что сэкономит вам время и уменьшит вероятность ошибок. Это также открывает возможности для тестирования и сбора данных, что может быть весьма полезно в различных сферах, начиная от веб-разработки и заканчивая маркетингом.
Отправка писем с использованием SMTP в PythonSMTP (Simple Mail Transfer Protocol)
- это протокол, который обеспечивает отправку электронных писем. В Python для работы с этим протоколом доступен модуль smtplib
из стандартной библиотеки.
Для начала соединения с почтовым сервером мы можем использовать класс SMTP_SSL
, который обеспечивает защищенное соединение. Этому классу мы передаем адрес сервера и порт.
Чтобы авторизоваться на сервере, используем метод login
, куда передаем логин и пароль пользователя. Для отправки электронной почты мы используем метод sendmail
. Он принимает адрес отправителя, адрес получателя и текст сообщения. Важно помнить, что после отправки сообщения необходимо закрыть соединение с сервером с помощью метода quit()
.
Стоит учитывать, что некоторые почтовые сервисы могут иметь ограничения и дополнительные требования безопасности. Например, для работы с Gmail может понадобиться включить поддержку "доступа к ненадежным приложениям" и настроить двухфакторную аутентификацию.
#python #smtp
Получаем и задаем лимит рекурсии
В Python не оптимизируется хвостовая рекурсия, из-за чего зачастую возникает RecursionError
во время создания рекурсивных алгоритмов.
Но с помощью модуля sys
можно посмотреть и даже изменить максимальную глубину рекурсии. Хотя делать это слегка опасно, так как каждый новый вызов занимает много памяти.
И вообще лучше стараться использовать не рекурсию, а обычные циклы, но это вы и так сами знаете.
#рекурсия #лимиты
Управление версионностью Python с помощью pyenv
Инструмент pyenv предоставляет простой способ для переключения между различными версиями Python, придерживаясь принципов UNIX, согласно которым каждый инструмент должен эффективно выполнять свою задачу.
Возможности pyenv
включают:
- Изменение глобальной версии Python
для пользователя;
- Управление версиями Python
для индивидуальных проектов;
- Переопределение версии Python
через переменную среды;
- Поиск и выполнение команд сразу из нескольких версий Python
.
#pyenv
Декоратор override@override
используется для переопределения методов в классах-наследниках. Он позволяет указать, что метод в подклассе переопределяет метод базового класса.
Это может быть полезно для:
— Повышения читабельности кода, так как сразу видно, какие методы переопределены.
— Выявления ошибок: если имя метода в дочернем классе не совпадает с именем в родительском, будет выдана ошибка.
— Проверки типов аргументов: декоратор гарантирует, что типы аргументов совпадают с базовым методом.
#python #decorators
Начинающие бэкендеры, последний шанс подать заявку в Летнюю школу Яндекса
Если уже умеете писать читаемый код в Python и разбираетесь в алгоритмах, то Летняя школа бэкенда — отличная возможность систематизировать знания и прокачаться в разработке высоконагруженных сервисов.
Вас ждут реальные задачи, знакомство с опытными специалистами, офлайн лекции в Москве и Санкт-Петербурге и онлайн — в других городах.
Более 50% выпускников школ становятся стажерами или сотрудниками Яндекса. Торопитесь, регистрация открыта до 27 апреля.
Слияние аудио и видео потоков
Проблема с получением видео в высоком качестве со звуком с YouTube
связана с использованием технологии DASH (Dynamic Adaptive Streaming over HTTP)
, которая не предусматривает наличие звуковой дорожки в потоке.
Решением является отдельное получение аудио и видео потоков и их последующее объединение с использованием программы ffmpeg
.
Необходимо выбрать соответствующие аудио и видео потоки, затем использовать полученные URL
в команде ffmpeg
для запуска процесса загрузки и слияния потоков.
#python #ffmpeg #pytube