devopslibrary | Unsorted

Telegram-канал devopslibrary - DevOps&SRE Library

17344

Библиотека статей по теме DevOps и SRE. Реклама: @ostinostin Контент: @mxssl РКН: https://knd.gov.ru/license?id=67704b536aa9672b963777b3®istryType=bloggersPermission

Subscribe to a channel

DevOps&SRE Library

🤔 Как не дать развалиться системе из 1500 микросервисов под пиковой нагрузкой? И что делать при DDoS-атаке на 1 млн RPS?

Команда Яндекс Маркета выкатила детальный разбор своей инженерии надёжности. Внутри — честно о том, как на практике работает Graceful Degradation, зачем нужны war rooms и как они проводят нагрузочные тесты прямо на проде.

✅Философия Graceful Degradation.
✅Must-have архитектурные паттерны.
✅Распределение процессов во время инцидентов.
✅Нагрузочное тестирование на проде.

Статья будет полезна тем, кто строит и поддерживает высоконагруженные и распределённые системы. Отличная возможность заглянуть под капот гиганта e-commerce и сравнить их подходы со своими.


Реклама. Рекламодатель ООО «Яндекс.Такси». ИНН 7704340310

Читать полностью…

DevOps&SRE Library

Understanding the Circuit Breaker: A Key Design Pattern for Resilient Systems

The Circuit Breaker Pattern is a key design pattern for building resilient systems by preventing cascading failures and ensuring graceful degradation.


https://dzone.com/articles/circuit-breaker-pattern-resilient-systems

Читать полностью…

DevOps&SRE Library

Argo Rollouts — Canary Deployment with Istio

https://medium.chuklee.com/argo-rollouts-canary-deployment-with-istio-b432bc141ba9

Читать полностью…

DevOps&SRE Library

Why Every Platform Engineer Should Care About Kubernetes Operators

https://www.pulumi.com/blog/why-every-platform-engineer-should-care-about-kubernetes-operators

Читать полностью…

DevOps&SRE Library

How Kubernetes HPA Decides Which Pod to Terminate When Scaling Down

AlexanderObregon/how-kubernetes-hpa-decides-which-pod-to-terminate-when-scaling-down-6675ebbdf56f" rel="nofollow">https://medium.com/@AlexanderObregon/how-kubernetes-hpa-decides-which-pod-to-terminate-when-scaling-down-6675ebbdf56f

Читать полностью…

DevOps&SRE Library

Can Configuration Languages (config DSLs) solve configuration complexity?

https://itnext.io/can-configuration-languages-dsls-solve-configuration-complexity-eee8f124e13a

Читать полностью…

DevOps&SRE Library

FacetController: How we made infrastructure changes at Lyft simple

https://eng.lyft.com/facetcontroller-how-we-made-infrastructure-changes-at-lyft-simple-dab49f5b27c7

Читать полностью…

DevOps&SRE Library

How We Integrated Native macOS Workloads with Kubernetes

https://medium.com/agoda-engineering/how-we-integrated-native-macos-workloads-with-kubernetes-b4d3c14881a0

Читать полностью…

DevOps&SRE Library

canine

Canine is an easy to use intuitive deployment platform for Kubernetes clusters.


https://github.com/czhu12/canine

Читать полностью…

DevOps&SRE Library

Staying on Nix

I have been using Nix regularly since roughly 2019, when I set up my primary build server to use Nix to manage the various toolchains, though it wasn't until 2022 that I really invested heavily, and I'm now using Nix in combination with other more traditional DevOps tools to provision and manage more than 10 physical machines and 50 VMs in my homelab.


https://pid1.sh/blog/staying-on-nix

Читать полностью…

DevOps&SRE Library

pgrwl

pgrwl is a PostgreSQL write-ahead log (WAL) receiver written in Go. It’s a drop-in, container-friendly alternative to pg_receivewal, supporting streaming replication, encryption, compression, and remote storage (S3, SFTP).

Designed for disaster recovery and PITR (Point-in-Time Recovery), pgrwl ensures zero data loss (RPO=0) and seamless integration with Kubernetes environments.


https://github.com/hashmap-kz/pgrwl

Читать полностью…

DevOps&SRE Library

kl

An interactive Kubernetes log viewer for your terminal.


https://github.com/robinovitch61/kl

Читать полностью…

DevOps&SRE Library

Лето больших возможностей 💫

ИТ-лагерь Т1 — бесплатный интенсив по погружению в профессию для студентов вузов по техническим и ИТ-направлениям. Можно участвовать даже без опыта и из любого города РФ!

Тебя ждет:
— бесплатное онлайн-обучение
— командная работа над проектом при поддержке опытных менторов
— актуальные навыки для работы в бигтехе
— очное финальное соревнование в атмосфере летнего лагеря

🎓Лучших участников ждет собеседование на оплачиваемую стажировку в Т1 — одну из крупнейших ИТ-компаний России!

Выбирай направление:
🔹 тестирование
🔹 системный анализ
🔹 разработка frontend (JS+React)
🔹 разработка backend (Java)
🔹 прикладное администрирование (старт в DevOps)

📆 Подавай заявку до 3 июля — начни карьеру с ИТ-лагеря Т1!

Информация о рекламодателе.

Читать полностью…

DevOps&SRE Library

OpenTelemetry Resource Attributes: Best Practices for Kubernetes

https://www.dash0.com/guides/opentelemetry-kubernetes-attributes-best-practices

Читать полностью…

DevOps&SRE Library

Debugging Distroless Kubernetes Containers

https://levelup.gitconnected.com/debugging-distroless-kubernetes-containers-74cfde06b196

Читать полностью…

DevOps&SRE Library

Load Testing with Impulse at Airbnb

Comprehensive Load Testing with Load Generator, Dependency Mocker, Traffic Collector, and More


https://medium.com/airbnb-engineering/load-testing-with-impulse-at-airbnb-f466874d03d2

Читать полностью…

DevOps&SRE Library

kpatch

kpatch is a Linux dynamic kernel patching infrastructure which allows you to patch a running kernel without rebooting or restarting any processes. It enables sysadmins to apply critical security patches to the kernel immediately, without having to wait for long-running tasks to complete, for users to log off, or for scheduled reboot windows. It gives more control over uptime without sacrificing security or stability.


https://github.com/dynup/kpatch

Читать полностью…

DevOps&SRE Library

Demystifying Swap in Kubernetes: A Handbook for DevOps Engineers

robertbotez/demystifying-swap-in-kubernetes-a-handbook-for-devops-engineers-e5ef934593e3" rel="nofollow">https://medium.com/@robertbotez/demystifying-swap-in-kubernetes-a-handbook-for-devops-engineers-e5ef934593e3

Читать полностью…

DevOps&SRE Library

Load Balancing gRPC traffic with Istio

https://dev.to/visepol/load-balancing-grpc-traffic-with-istio-1k49

Читать полностью…

DevOps&SRE Library

GKE Cost Cutting — Three Key Lookout Points to view your Potential Savings

https://medium.com/google-cloud/gke-cost-cutting-three-key-lookout-points-to-view-your-potential-savings-10f271dc4fa9

Читать полностью…

DevOps&SRE Library

Operational Considerations for Managing Stateful Workloads

When managing stateful workloads, whether in Kubernetes or traditional infrastructure, operational concerns like isolation, lifecycle management, security, disaster recovery, scalability, and observability take center stage. While the examples focus on AWS, PostgreSQL, and Kubernetes, the principles and best practices discussed here are broadly applicable to any environment. This article approaches these topics from an operations perspective, prioritizing reliability, maintainability, and resilience. The goal is not just to run a database, but to ensure it operates efficiently, scales properly, and remains secure in real-world conditions. We’ll explore key aspects of running stateful workloads, from managing failure domains to ensuring observability, and how these impact both operations teams and developers. Whether you’re running a database in a cloud-native setup or on bare metal, these strategies will help you build a robust, well-managed system.


https://dev.to/pampatzoglou/operational-considerations-for-managing-stateful-workloads-20c3

Читать полностью…

DevOps&SRE Library

Why Our Pods Were Breaking Bad (and How We Fixed Them)

In this article, we’ll walk through the process of diagnosing a memory leak, analyzing the root cause, and implementing effective solutions to mitigate its impact. We’ll explore practical steps that any application, regardless of the underlying stack or architecture, can follow to troubleshoot and optimize performance.


https://kshitij-nawandar.medium.com/why-our-pods-were-breaking-bad-and-how-we-fixed-them-b3c3e9e8003b

Читать полностью…

DevOps&SRE Library

How We Migrated 30+ Kubernetes Clusters to Terraform

https://medium.com/learnings-from-the-paas/how-we-migrated-30-kubernetes-clusters-to-terraform-cd2b1cef8b84

Читать полностью…

DevOps&SRE Library

lstr

A blazingly fast, minimalist directory tree viewer, written in Rust. Inspired by the command line program tree, with a powerful interactive mode.


https://github.com/bgreenwell/lstr

Читать полностью…

DevOps&SRE Library

Moving on from Nix

After using nix in my dotfiles for over 2 years, I’m now moving away from it.

Here’s why.


https://carlosbecker.com/posts/bye-nix

Читать полностью…

DevOps&SRE Library

⚡️Приложение растёт: новые фичи, исправления, интеграции… Но код становится всё сложнее, тесты — хрупкими, а добавление функций — болезненным. Хотите сделать архитектуру своего Python-проекта устойчивой к росту?

1 июля в 20:00 МСК OTUS проводит открытый вебинар «Шик, блеск, чистота: clean architecture в Python». На примере Flask-приложения мы разберём ключевые принципы чистой архитектуры: разделение слоёв, инверсия зависимостей, независимость от фреймворков. Вы увидите, как эти подходы помогают создавать долгоживущие, легко тестируемые и расширяемые сервисы.

Clean architecture повысит качество вашего продукта и упростит работу команды, а мастерство её применения войдёт в ваше профессиональное портфолио.

👉Открытый урок проходит в преддверии старта курса «Python Developer. Professional». Все участники вебинара получат скидку на обучение. Регистрация открыта: https://otus.pw/oQlx/

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2VtzqxQ6w3k

Читать полностью…

DevOps&SRE Library

dockprom

Docker hosts and containers monitoring with Prometheus, Grafana, cAdvisor, NodeExporter and AlertManager


https://github.com/stefanprodan/dockprom

Читать полностью…

DevOps&SRE Library

Helm Chart Validation Just Got Smarter Thanks to This Google-Powered Tool

https://hackernoon.com/helm-chart-validation-just-got-smarter-thanks-to-this-google-powered-tool

Читать полностью…

DevOps&SRE Library

🐳 Как управлять данными и сетями в Docker, чтобы гарантировать безопасность и производительность на высоком уровне?

👉 Приглашаем вас на открытый вебинар «Работа с данными и сетями в Docker» 2 июля в 20:00 МСК.

Разберём:
- Основы работы с данными в Docker: тома, bind-mount, tmpfs.
- Как изолировать и безопасно использовать данные в контейнерах.
- Типы Docker-сетей и их применение: мост, хост, оверлей и другие.
- Практику настройки взаимодействия контейнеров через сеть и безопасность в Docker.

Вы научитесь настраивать сетевые решения, масштабировать инфраструктуру и обеспечивать защиту данных в контейнерах. Эти навыки незаменимы для успешной работы в современных микросервисных архитектурах.

Вебинар проходит в преддверии старта курса «DevOps практики и инструменты».

👉 Для участия зарегистрируйтесь: https://vk.cc/cN6XnX

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru, erid: 2VtzqufVF3c

Читать полностью…

DevOps&SRE Library

From LB Ingress to ZTM — A New Approach to Cluster Service Exposure

https://addozhang.medium.com/from-lb-ingress-to-ztm-a-new-approach-to-cluster-service-exposure-99d32a3065ec

Читать полностью…
Subscribe to a channel