Библиотека статей по теме DevOps и SRE. Реклама: @ostinostin Контент: @mxssl РКН: https://knd.gov.ru/license?id=67704b536aa9672b963777b3®istryType=bloggersPermission
A CNI 'Chicken-and-Egg' Dilemma: How Does Calico Assign IPs to Itself?
While research CNI recently, I recalled an interesting issue I encountered during the development of network plugins and investigation of Calico: Calico assigns IP addresses to its own components’ Pods (e.g., calico-kube-controllers). How does Calico achieve this? From the installation of the Calico network plugin to assigning IPs to its own Pods, what happens at the underlying level?
This essentially poses a “chicken-and-egg” problem: running a Pod requires the CNI plugin, while the CNI plugin’s operation depends on the proper functioning of other Pods.
This analysis is based on Cilium v1.16.5, Calico v3.29.1, and Kubernetes v1.23.
Код истории пишут победители. Будь одним из них, приходи на «ВНЕДРЕЙД»
5 компаний‑держателей задач: Т‑банк, Авито, Lamoda, CDEK, Magnit Tech
48 часов, чтобы зарелизить фичу
4 дня на Эльбрусе — если твоя команда сделает это круче всех
Что получишь еще?
- фаст-трек в Orion soft
- жирный кейс в резюме
- буст IT‑мышц и респект комьюнити
Собирай команду из 3–5 человек и подавай заявку. Режим «ВНЕДРЕЙД» — ON
[Принять участие]
Zero-Touch Bare Metal at Scale
In this episode, we talk about how we operationalize the hardware once it’s installed.
Upgrading ECK Operator: A Side-by-Side Kubernetes Operator Upgrade Approach
To leverage the advancements in recently released ECK operator versions, we embarked on an upgrade project. Operator upgrades are inherently complex and risky, often involving significant changes that can affect system stability.
In this article, I’ll delve into the challenges we encountered and the strategies we employed to manage operator upgrades for stateful workloads like Elasticsearch. Additionally, I’ll detail how we modified the ECK operator to facilitate a more resilient side-by-side upgrade process.
Using MCPs to Run Terraform
We jump into a hands-on exploration of Model Context Protocol (MCP), sharing our experiment using a MCP client to run terraform init, plan, apply. We share our take on where agents add value and highlight security considerations when adding MCPs to your workflow.
rybbit
Rybbit is the modern open source and privacy friendly alternative to Google Analytics. It takes only a couple minutes to setup and is super intuitive to use.
Вы тратите кучу времени на ручной анализ, triage и отчёты по уязвимостям? Хотите выстроить безопасную разработку с нуля или оптимизировать зрелый DevSecOps? Приходите на вебинар Hexway Vampy — ASOC-платформы, которая упрощает безопасную разработку на всех этапах SDLC.
Посмотрите вживую:
✅ Как начать анализ кода без покупки сканеров – встроенные SAST/SCA + поддержка российских решений
✅ Как автоматизировать рутину – централизованный запуск сканеров, triage и назначение задач в едином интерфейсе
✅ Почему Hexway Vampy удобнее и надежнее DefectDojo
Для кого: AppSec, DevOps, ИБ-архитекторы, тимлиды в ИБ.
📅Зарегистрируйтесь, чтобы получить напоминание о трансляции, задать вопросы на эфире и получить запись.
Зарегистрироваться
Terraforming Your Grafana Alerts for Kubernetes Clusters
https://medium.com/h7w/terraforming-your-grafana-alerts-for-kubernetes-clusters-958616f89cc2
wave
Wave watches Deployments, StatefulSets and DaemonSets within a Kubernetes cluster and ensures that their Pods always have up to date configuration.
By monitoring mounted ConfigMaps and Secrets, Wave can trigger a Rolling Update of the Deployment when the mounted configuration is changed.
Tackling OOM: Strategies for Reliable ML Training on Kubernetes
Tackle OOMs => reliable training => win !
From four to five 9s of uptime by migrating to Kubernetes
When we launched User Management along with a free tier of up to 1 million MAUs, we faced several challenges using Heroku: the lack of an SLA, limited rollout functionality, and inadequate data locality options. To address these, we migrated to Kubernetes on EKS, developing a custom platform called Terrace to streamline deployment, secret management, and automated load balancing.
Kubernetes Authentication - Comparing Solutions
This post is a deep dive into comparing different solutions for authenticating into a Kubernetes cluster. The goal of this post is to give you an idea of what the various solutions provide for a typical cluster deployment using production capable configurations. We're also going to walk through deployments to get an idea as to how long it takes for each project and look at common operations tasks for the each solution. This blog post is written from the perspective of an enterprise deployment. If you're looking to run a Kubernetes lab, or use Kubernetes for a service provider, I think you'll still find this useful. We're not going to do a deep dive in how either OpenID connect or Kubernetes authentication actually works.
Replacing StatefulSets With a Custom K8s Operator in Our Postgres Cloud Platform
Over the last year, the platform team here at Timescale has been working hard on improving the stability, reliability and cost efficiency of our infrastructure. Our entire cloud is run on Kubernetes, and we have spent a lot of engineering time working out how best to orchestrate its various parts. We have written many different Kubernetes operators for this purpose, but until this year, we always used StatefulSets to manage customer database pods and their volumes.
StatefulSets are a native Kubernetes workload resource used to manage stateful applications. Unlike Deployments, StatefulSets provide unique, stable network identities and persistent storage for each pod, ensuring ordered and consistent scaling, rolling updates, and maintaining state across restarts, which is essential for stateful applications like databases or distributed systems.
However, working with StatefulSets was becoming increasingly painful and preventing us from innovating. In this blog post, we’re sharing how we replaced StatefulSets with our own Kubernetes custom resource and operator, which we called PatroniSets, without a single customer noticing the shift. This move has improved our stability considerably, minimized disruptions to the user, and helped us perform maintenance work that would have been impossible previously.
The Karpenter Effect: Redefining Our Kubernetes Operations
A reflection on our journey towards AWS Karpenter, improving our Upgrades, Flexibility, and Cost-Efficiency in a 2,000+ Nodes Fleet
Optimising Node.js Application Performance
In this post, I’d like to take you through the journey of optimising Aurora, our high-traffic GraphQL front end API built on Node.js. Running on Google Kubernetes Engine, we’ve managed to reduce our pod count by over 30% without compromising latency, thanks to improvements in resource utilisation and code efficiency.
I’ll share what worked, what didn’t, and why. So whether you’re facing similar challenges or simply curious about real-world Node.js optimisation, you should find practical insights here that you can apply to your own projects.
Amazon EKS Auto Mode vs Azure AKS Automatic: The Better Managed Kubernetes Solution?
https://pixelrobots.co.uk/2024/12/amazon-eks-auto-mode-vs-azure-aks-automatic-the-better-managed-kubernetes-solution
A Case Study in Synchronizing Database Schema Updates between Projects and Environments
If you’ve come across this post, you probably know about relational database schema migrations. You’ve likely worked with a relational database like PostgreSQL or MySQL and a tool for managing schema migrations via code.
This post doesn’t walk you through the basics of schema migrations but rather explains an especially complicated and non-typical schema migrations use case. This post will also show you the nuances of the custom schema migration solution we created here at DoubleVerify.
📥 Получено приглашение на Cloud․ru Tech Lab: DevOps
📅Когда: 22 мая в 18:00
📍Где: Москва, Гоэлро Лофт, м. Электрозаводская
В программе:
😶🌫ClusterAPI как цель, Terraform как мост: управляем жизненным циклом платформы
Олег Одинцов, старший инженер платформы App.Farm РСХБ-Интех
😶🌫Автомасштабирование K8s в ноль: от базы до хардкора
Илья Смирнов, архитектор решений Cloud․ru
😶🌫Calico CNI: жизнь после запуска
Александр Качмашев, лидер круга «Инфраструктура для разработчиков» Точка
😶🌫Как организовать сетевую связность Bare Metal Kubernetes
Антон Паус, DevOps-инженер Cloud․ru
Вечер завершится приятным afterparty c нетворкингом, легкими напитками и закусками.
⚡ Linux теперь в Telegram!
Ребята сделали крутейший канал про Linux, где на простых картинках и понятном языке обучают работе с этой ОС, делятся полезными фишками и инструментами
Подписывайтесь: @linuxos_tg
⚠️ Как настроить Nginx и Angie для стабильной и быстрой работы при большом количестве запросов?
👉 Приглашаем на вебинар: Оптимизация Nginx и Angie под высокие нагрузки
На вебинаре вы узнаете:
- Как оптимизировать системные параметры для повышения производительности
- Как правильно настроить TLS и сократить накладные расходы на шифрование
- Какие возможности по кэшированию есть у Nginx и Angie и как их эффективно использовать
- Как измерять и анализировать клиентскую и серверную производительность
В результате вебинара вы:
- Научитесь выявлять и настраивать ключевые параметры, влияющие на производительность
- Сможете оптимизировать конфигурацию Nginx и Angie под конкретные сценарии нагрузки
- Попробуете применять техники кэширования и настройки TLS для снижения нагрузки
- Поймёте, как оценивать эффективность настройки и устранять узкие места
Все участники получат скидку на большое обучение «Инфраструктура высоконагруженных систем».
👉 Для участия зарегистрируйтесь: https://vk.cc/cM6DXy
Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru, erid: 2VtzqxAy8AQ
Don't make these feature flag mistakes
https://newsletter.posthog.com/p/dont-make-these-classic-feature-flag
terraform-mcp-server
A Model Context Protocol (MCP) server that provides tools for interacting with the Terraform Registry API. This server enables AI agents to query provider information, resource details, and module metadata.
winter-soldier
Winter Soldier can be used to
- cleans up (delete) Kubernetes resources
- reduce workload pods to 0
at user defined time of the day and conditions. Winter Soldier is an operator which expects conditions to be defined using CRD hibernator.
Kubernetes -Network Policies
A NetworkPolicy is a Kubernetes resource that defines rules for controlling the traffic flow to/from pods. It works at layer 3 (IP) and layer 4 (TCP/UDP) of the OSI model. The policies are namespaced and use labels to identify the target pods and define allowed traffic.
Go-митап с инженерами MWS
10 июня в Екатеринбурге пройдёт технический митап Go Up от MWS для Go-разработчиков.
Спикеры:
• Эмиль Ибрагимов — о генерации CLI из OpenAPI
• Валерий Локтаев — об автоматизации Terraform
• Георгий Фатеев — о безопасности Go-кода
🌐 MPLS и корпоративные сети: невостребованные опции или жизненно необходимый функционал?
Понимание основ технологий MPLS позволяет на качественно новом уровне рассмотреть применение их в сегменте корпоративных сетей.
Также сравнение типов сервисов, предоставляемых набором технологий MPLS, позволяют выявить ограничения в использовании какого- либо иного сервиса в корпоративных сетях.
На уроке:
- Рассмотрим основы MPLS
- Узнаем, как реализуются сервисы на базе MPLS
- Реализуем на практике один из сервисов MPLS
👉 Регистрация и подробности о курсе Network Engineer. Professional https://vk.cc/cLUwNB
Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru, erid: 2Vtzqwp5V7r
⚠️ Terraform меняет правила игры в DevOps. Хотите освоить инструмент, с которым инфраструктура развертывается в несколько кликов?
⏰ На открытом вебинаре 20 мая в 20:00 МСК вы узнаете, как Terraform делает инфраструктуру управляемой, прозрачной и масштабируемой. Разберём ключевые понятия: провайдеры, состояние, модули и переменные. Вы узнаете, почему IaC стал золотым стандартом DevOps.
💪 Научитесь автоматизировать развёртывание ресурсов, избавьтесь от рутинной ручной работы и освободите время на действительно важные задачи.
👉 Регистрируйтесь прямо сейчас и получите скидку на программу обучения «DevOps-практики и инструменты»: https://vk.cc/cLWecK
Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru, erid: 2Vtzquo9Zat
❓ Да что вы знаете про DevSecOps?
Проверь себя – пройди тест по ДевСекОпс и узнай, можешь ли ты стать DevSecOps-инженером!
🫵 Ответишь успешно — пройдешь на курс «Внедрение и работа в DevSecOps» от Отус по специальной цене.
Освойте принципы и популярные инструменты DevSecOps-инженера, которые помогут повысить вашу востребованность и доход на онлайн-курсе «Внедрение и работа в DevSecOps» от OTUS.
Авторская программа подготовлена опытным инженером и завалидированная партнером StartX.
➡️ ПРОЙТИ ТЕСТ
💥 Бонусом за успешно пройденный тест получишь доступ на сайт курса к записям лучших открытых уроков.
Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2VtzqwdYVv4
Удаление бакетов в S3: что стоит учесть?
Объектное хранилище S3 — надёжный способ работать с большими объёмами данных. 27 мая проведем митап для тех, кто хочет точно понимать, как устроены ключевые процессы S3 — от настройки версионирования до безопасного удаления бакетов.
В формате демо разберём
🔹 настройку версионирования, multipart-загрузок и lifecycle-политик
🔹 автоматизацию очистки бакета (включая delete marker и незавершённые multipart-загрузки)
🔹 как подготовить бакет к удалению
🔹 настройку политик доступа, временных ссылок и шифрование на стороне сервера SSE
Спикер
Евгения Тарашкевич, инженер K2 Cloud
Формат
Онлайн-митап
Ждем администраторов, девопсов, системных архитекторов и всех, кто работает с S3.
Зарегистрироваться>>
L4-L7 Performance: Comparing LoxiLB, MetalLB, NGINX, HAProxy
As Kubernetes continues to dominate the cloud-native ecosystem, the need for high-performance, scalable, and efficient networking solutions has become paramount. This blog compares LoxiLB with MetalLB as Kubernetes service load balancers and pits LoxiLB against NGINX and HAProxy for Kubernetes ingress. These comparisons mainly focus on performance for modern cloud-native workloads.