Библиотека статей по теме DevOps и SRE. Реклама: @ostinostin Контент: @mxssl РКН: https://knd.gov.ru/license?id=67704b536aa9672b963777b3®istryType=bloggersPermission
Adrift in the Cloud: A Forensic Dive into Container Drift
Adding container drift detection to Google’s Container Explorer
Deploying Your AKS Cluster with Terraform: Key Points for a Successful Production Rollout
https://medium.com/h7w/deploying-your-aks-cluster-with-terraform-key-points-for-a-successful-production-rollout-e92f1238906f
Quality gate for helm charts
What is a quality gate? A quality gate is a milestone in an IT project that requires that predefined criteria be met before the project can proceed to the next phase. We set quality gates for code programs, run unit/integration/acceptance tests, and run static code analysis before merging code from the developer's branch into the main branch. But do we set quality gates for helm charts? Or should we?
We should and I will present an example of how to do that.
The Ripple Effect: How a Single Push Notification Brought Down Our Kubernetes Cluster
Ever notice how major system failures rarely start with major problems? That's exactly what happened to us when a simple push notification exposed the fragility of our Kubernetes infrastructure. But here's the twist: it wasn’t a bug that took us down—it was our own success.
❓ Сталкиваетесь с проблемами использования памяти в Linux? Хотите научиться оптимизировать работу системы и улучшить производительность?
🚀 Присоединяйтесь к открытому уроку 16 июня в 20:00 МСК, где мы разберем, как работает память в Linux. Вы узнаете, как управлять физической памятью, кэшем и подкачкой, а также как интерпретировать данные из /proc/meminfo и использовать инструменты, такие как top, free и vmstat для мониторинга памяти.
Понимание работы dirty pages и swap поможет вам диагностировать проблемы с производительностью и научит оптимизировать систему при нехватке ресурсов. Эти знания крайне полезны для системных администраторов, инженеров и технических специалистов.
⭐️ Спикер Андрей Буранов — системный администратор в VK, входит в топ-3 лучших преподавателей образовательных порталов.
Урок пройдет в преддверие старта курса «Administrator Linux. Professional». Все участники урока получат скидку на обучение.
👉 Регистрируйтесь для участия: https://vk.cc/cMFZI5
Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2VtzqwiH349
Vertical Pod Autoscaler (VPA): A Deep Dive - Part 1
In this post, I want to dive deep into VPA (version 1.3.0), explain why it could be useful for you, and provide a quick overview in the first section if you're short on time. This article mainly focuses on the Recommender component - I'll cover the other two in a future post.
Unleashing the Power of k3s for Edge Computing: Deploying 3000+ in-store Kubernetes Clusters — Part 1
https://jysk.tech/unleashing-the-power-of-k3s-for-edge-computing-deploying-3000-in-store-kubernetes-clusters-part-77ecc5378d31
3000+ Clusters Part 2: The journey in edge compute with Talos Linux
https://jysk.tech/3000-clusters-part-2-the-journey-in-edge-compute-with-talos-linux-82f42bf9f958
railpack
Railpack is a tool for building images from source code with minimal configuration. It is the successor to Nixpacks and incorporates many of the learnings from running Nixpacks in production at Railway for several years.
Steps to Break Up a Terralith
In this follow-up to our "What Is a Terralith?" article, we shift the focus from describing the problem to providing a detailed migration plan, practical guidance, and a handy checklist for breaking up a Terralith into smaller, more manageable root modules.
CI/CD Security: Using Checkov to enforce security with terraform
The purpose of this tutorial is to provide a solid starting point for enforcing security best practices in your Terraform scripts.
Solving the Terraform Backend Chicken-and-Egg Problem
My preferred way to store Terraform state files is close to the provisioned infrastructure. In my case this is mostly Azure Blob Storage. This approach offers built-in benefits like RBAC, versioning, locking, and identity-based authentication, making it an excellent solution for state management at almost no cost.
However, there’s a catch: you need to create the storage account before Terraform can use it. This creates a chicken and egg problem - how do you provision the state storage using Terraform itself without manual steps or external scripts?
In this article, I’ll walk through a fully automated solution to deploy Terraform state storage in Azure Blob and import “self” state there, ensuring everything is managed declaratively from the start.
012: The MTTI Manifesto
Mean Time to Isolate
А ты справишься с тестом по Kubernetes?
Пройди тест из 15 вопросов, проверь свой уровень знаний и получи скидку на онлайн-курс «Инфраструктурная платформа на основе Kubernetes» от OTUS!
Если успешно пройдешь тест, сможешь забронировать место в группе по выгодной цене! И еще дарим промокод Kuber_06
🔥 Пройти тест и забрать скидку: https://vk.cc/cMxMsr
🎫 Курс можно приобрести в рассрочкуРеклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2VtzqwcP4EH
Покажем, как создавать Telegram-ботов на сверхскорости ⚡
Зачем нужен бот?
📊 Соберет данные и построит отчеты за пару минут
🤖 Правильно переведет сложный текст для зарубежных коллег
🎬 Подберет фильмы по настроению для качественного отдыха
Какого бы помощника вы ни хотели запустить, это можно легко сделать в облаке без настройки серверов и затрат на инфраструктуру.
Облачный провайдер Cloud․ru расскажет на бесплатном вебинаре 5 июня, как создать бота в облаке и какие компоненты для этого нужны.
Будет демо — в прямом эфире эксперт покажет процесс и ответит на вопросы.
Зарегистрироваться на вебинар🖱
Месяц бесплатного размещения данных в объектном хранилище Selectel
Переносите и храните данные для работы сервисов и их бэкапы, данные аналитики и датасеты для ML в объектное S3 хранилище Selectel. Провайдер обеспечит:
- Надежность и катастрофоустойчивость. Объектное S3 хранилище от Selectel работает на базе дата-центров в Москве и Петербурге - данные можно хранить в бакетах в разных городах для большей надежности.
- Разные классы хранилищ под ваши задачи. Для размещения редко используемых данных выбирайте «холодное» хранилище и экономьте до 30%.
- Бесплатную миграцию. По акции Миграционные каникулы для вас будут бесплатными входящие запросы и целевое хранилище в течение 30 дней с момента подтверждения заявки.
Переносите данные и тестируйте сервис бесплатно по ссылке: https://slc.tl/5xtbr
Реклама. АО «Селектел», ИНН 7810962785, ERID: 2Vtzqv5mGGD
My PodDisruptionBudget bible to use with Karpenter and friends
https://dev.to/aws-builders/my-poddisruptionbudget-bible-to-use-with-karpenter-and-friends-59fl
How to Host a 100 CPU Core, 400 GB RAM Cluster on a Budget
In this article, I will share how I built a computing cluster with around 100 CPU cores and approximately 400 GB of RAM while keeping costs as low as possible.
⚠️ До старта курса «Administrator Linux. Basic» осталось совсем немного. Набор закрывается 27 июня.
👉 Успейте пройти вступительный тест и получить запись двух вебинаров бесплатно:
— «Что нужно знать, когда переходишь с Windows на Linux. Базовые понятия Linux, работа в консоли с базовыми командами»
— «Вся правда о рынке труда или как быть востребованным в современных реалиях»
💪 Курс построен так, чтобы даже без опыта в Linux вы быстро вошли в профессию. В программе только актуальное: Bash, сети, логика работы ОС, файловые системы и автоматизация.
👉 Пройдите бесплатное вступительное тестирование сегодня и получите запись двух вебинаров: https://vk.cc/cMIFSd
Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, www.otus.ru, erid: 2Vtzqxc8GER
Kubernetes Best Practices I Wish I Had Known Before
1. Don't Skimp on Resource Requests and Limits
2. Namespace Like Your Life Depends on It
3. Avoid Running Multiple Containers in One Pod Unless Necessary
4. Use a Package Manager for Your YAML Files
5. Ingress and Networking Best Practices
6. Lean On Liveness, Readiness, and Startup Probes
7. Mind Your Security: RBAC, Pod Security, and Secrets
8. Monitor Everything (And Then Monitor Some More)
9. Automate Deployments with CI/CD
10. Keep Your Kubernetes Cluster and Components Updated
11. Use Labels and Annotations Wisely
12. Adopt a Multi-Environment Approach
13. Optimize Your Container Images
14. Implement a Reliable Logging Strategy
15. Treat Kubernetes Like Cattle, Not a Pet
16. Consider a Higher-Level Approach for Complex Deployments
17. Final Thoughts
OPA memory usage considerations and lessons from our transition to Kyverno
https://medium.com/adevinta-tech-blog/opa-memory-usage-considerations-and-lessons-from-our-transition-to-kyverno-bd23bd8a68bf
❕ Приглашаем на урок по работе с чувствительными данными в Kubernetes-кластере!
⏺Открытый урок K8S + Vault — как получать секреты?
Бесплатно 17 июня в 20:00 МСК. Урок в рамках старта курса «Инфраструктурная платформа на основе Kubernetes» от Otus.
Поймете, как организовать безопасное и масштабируемое взаимодействие между Kubernetes и HashiCorp Vault. Разберём подход dynamic secrets и инструмент External Secrets Operator для интеграции секретов из Vault в кластер.
На уроке вы узнаете:
- как Kubernetes работает с секретами по умолчанию и его ограничения;
- способы интеграции Kubernetes и Vault;
- что такое External Secrets Operator и почему его выбирают для production-сред;
- пошаговую схему подключения Vault к K8s.
➡ Регистрация на вебинар: https://vk.cc/cMBCYtРеклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2VtzqvMZcRK
pgdog
PgDog is a transaction pooler and logical replication manager that can shard PostgreSQL. Written in Rust, PgDog is fast, secure and can manage hundreds of databases and hundreds of thousands of connections.
hyperfine
A command-line benchmarking tool.
Terraform Modules Monorepo On GitLab
After several years of working with GitHub and Azure DevOps on a daily basis, using different tools feels counterintuitive to me. However, one of my clients is deeply integrated with GitLab. Since I was hired to resolve some issues, I saw this as the perfect opportunity to dive deep into GitLab CI and implement a robust, version-controlled approach that supports collaboration while maintaining security and documentation standards.
This guide presents an advanced implementation of a Terraform modules monorepo using GitLab, featuring automated versioning, security scanning, and documentation generation.
Амбициозные проекты, удалёнка и рост в сфере DevOps — звучит как работа мечты! Отправляйте резюме до 8 июня и присоединяйтесь к команде YADRO! 🧑💻
Как получить оффер за 3 дня? Подробности на карточках выше — листайте!
Оставляйте заявку — мы ждём именно вас!
k8sGPT — ваш ИИ-ассистент для Kubernetes — CLI-утилита, которая помогает диагностировать проблемы в Kubernetes.
Полезна и при онбординге, и в проде: показывает ошибки ресурсов, объясняет, почему они возникли, и предлагает возможные шаги.
Особенно помогает тем, кто ещё не выучил все тонкости CrashLoopBackOff и ImagePullBackOff.
Узнайте, как внедрить утилиту в свой workflow →
In defence of deployment freezes
Many organizations have periods when they restrict deployments to production. You may find yourself working for one, so it's best to be prepared for it, and protect yourself from the downsides.
Is There A Purpose In Assigning Incident Severity?
https://uptimelabs.io/is-there-a-purpose-in-assigning-incident-severity
lnk
Git-native dotfiles management that doesn't suck.
Move your dotfiles to ~/.config/lnk, symlink them back, and use Git like normal. Supports both common configurations and host-specific setups.
f2
F2 is a cross-platform command-line tool for batch renaming files and directories quickly and safely. Written in Go!