Библиотека статей по теме DevOps и SRE. Реклама: @ostinostin Контент: @mxssl РКН: https://knd.gov.ru/license?id=67704b536aa9672b963777b3®istryType=bloggersPermission
Longhorn Backup and Restore
Article breaks down using Longhorn (version 1.7) for backups, self-hosting, and recovery. It’s for seasoned DevOps and SysAdmin folks who like doing things themselves. You’ll find a step-by-step guide on setting up and restoring backups with Longhorn, Velero, and GitOps. The goal is to show you a tried-and-true setup for getting your backups and restores working smoothly.
Automatic testing and rollback of your GitOps with Argo Rollouts
https://jason-umiker.medium.com/automatic-rollback-of-your-gitops-with-argo-rollouts-04f94baa2d03
Ваша инфраструктура — ваш код. Готовы управлять ею правильно?
GitOps — это способ автоматизировать управление приложениями в Kubernetes, минимизировать ошибки и ускорить развертывание.
⏺На открытом уроке 03.04.2025 в 20:00 мы разберем ключевые команды, работу с YAML-манифестами и научимся эффективно управлять приложениями в Kubernetes.
Записывайтесь на вебинар и получите гарантированную скидку на курс «GitOps»:
https://vk.cc/cK8LBzРеклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2Vtzqvs4ZCL
Overview of Kubernetes GPU Scheduling, Device Plugin, CDI, NFD, and GPU Operator
rifewang/overview-of-kubernetes-gpu-scheduling-device-plugin-cdi-nfd-and-gpu-operator-48a7c4213b28" rel="nofollow">https://medium.com/@rifewang/overview-of-kubernetes-gpu-scheduling-device-plugin-cdi-nfd-and-gpu-operator-48a7c4213b28
Auto-scaling with KEDA Using Custom RED Metrics from Prometheus
At the beginning of the year, we made a strategic decision to rewrite and optimize our legacy services that experience high load during peak times. Recognizing that these services don’t consistently operate under the same load levels, we opted for an auto-scaling approach. This decision was driven by two primary goals: enhancing reliability and evolving towards a more cloud-native architecture.
Terraform Infrastructure as Code: Essential Tools for Clean, Maintainable Production Environments
In this article, I’ll cover a few important tools that can help you keep your Terraform code in good shape. I’ll cover areas such as static analysis, documentation, security checks and ways to improve your workflow. These tools can alert you early on to potential problems, help you adhere to best practices, stimulate teamwork and reduce operational risks.
pg_mooncake
pg_mooncake is a Postgres extension that adds columnar storage and vectorized execution (DuckDB) for fast analytics within Postgres. Postgres + pg_mooncake ranks among the top 10 fastest in ClickBench.
wait4x
Wait4X is a powerful, zero-dependency tool that waits for services to be ready before continuing.
postgresql-embedded
Install and run a PostgreSQL database locally on Linux, MacOS or Windows. PostgreSQL can be bundled with your application, or downloaded on demand.
rsql
rsql is a command line SQL interface for data. rsql is a modern, feature-rich, and user-friendly client, that has been designed to be easy to use, and to provide a consistent experience across all supported data sources.
🌐 Правильная маршрутизация VLAN: безопасность и эффективность в одном флаконе!
Выбираете между роутером на палочке и коммутатором третьего уровня? 🤔 У нас есть ответы! Присоединяйтесь к нашему открытом вебинару, где мы подробно разберём все аспекты маршрутизации VLAN.
Что вас ждёт на вебинаре?
- Преимущества и подводные камни каждого метода.
- Практическая реализация на реальных кейсах.
- Рекомендации по выбору в зависимости от конкретных задач.
Кому будет полезно?
Сетевым инженерам, DevOps-специалистам, администраторам и всем, кто хочет разобраться в маршрутизации VLAN.
💡 Вебинар пройдет в преддверии старта курса «Network Engineer». Все участники получат максимальную скидку на обучение по промокоду "NETWORK_5".
📅 Встречаемся 19 марта в 20:00 МСК.
🔗 Регистрируйтесь прямо сейчас: https://vk.cc/cJHWmd
Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2VtzqvzWCXy
kubeip
Kubernetes' nodes don't necessarily need their own public IP addresses to communicate. However, there are certain situations where it's beneficial for nodes in a node pool to have their own unique public IP addresses.
For instance, in gaming applications, a console might need to establish a direct connection with a cloud virtual machine to reduce the number of hops.
Similarly, if you have multiple agents running on Kubernetes that need a direct server connection, and the server needs to whitelist all agent IPs, having dedicated public IPs can be useful. These scenarios, among others, can be handled on a cloud-managed Kubernetes cluster using Node Public IP.
KubeIP is a utility that assigns a static public IP to each node it manages. The IP is allocated to the node's primary network interface, chosen from a pool of reserved static IPs using platform-supported filtering and ordering.
If there are no static public IPs left, KubeIP will hold on until one becomes available. When a node is removed, KubeIP releases the static public IP back into the pool of reserved static IPs.
autotune
Kruize Autotune is an Autonomous Performance Tuning Tool for Kubernetes. Autotune accepts a user provided "slo" goal to optimize application performance. It uses Prometheus to identify "layers" of an application that it is monitoring and matches tunables from those layers to the user provided slo. It then runs experiments with the help of a hyperparameter optimization framework to arrive at the most optimal values for the identified set of tunables to get a better result for the user provided slo.
Autotune can take an arbitrarily large set of tunables and run experiments to continually optimize the user provided slo in incremental steps. For this reason, it does not necessarily have a "best" value for a set of tunables, only a "better" one than what is currently deployed.
Ensuring Effective Helm Charts with Linting, Testing, and Diff Checks
https://dev.to/hkhelil/ensuring-effective-helm-charts-with-linting-testing-and-diff-checks-ni0
Kubernetes: How kube-proxy and CNI Work Together
rifewang/kubernetes-how-kube-proxy-and-cni-work-together-1255d273f291" rel="nofollow">https://medium.com/@rifewang/kubernetes-how-kube-proxy-and-cni-work-together-1255d273f291
⚙️ Из каких частей состоит Kubernetes
Этот вебинар посвящён внутреннему устройству Kubernetes — одной из самых популярных платформ для контейнеризации и оркестрации. Вы узнаете, из каких ключевых компонентов состоит Kubernetes, как они взаимодействуют между собой и как настроить их для эффективного управления контейнерными приложениями.
На вебинаре вы узнаете:
1. Основные компоненты архитектуры Kubernetes: Control Plane, Worker Nodes, и их роли в системе.
2. Как работают ключевые элементы Control Plane: API Server, etcd, Scheduler, Controller Manager.
3. Функции Worker Nodes, включая kubelet, kube-proxy и контейнерный runtime (например, Docker или containerd).
4. Как работают Pods, Namespaces, ConfigMaps, Secrets, и их роль в управлении контейнерами.
5. Принципы масштабирования приложений и обеспечения отказоустойчивости с помощью Kubernetes.
6. Настройка сетевого взаимодействия и хранения данных с использованием Ingress, Persistent Volumes и Storage Classes.
👉 Регистрация и подробности о курсе "Инфраструктурная платформа на основе Kubernetes": https://vk.cc/cK9QRl
Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2VtzqwibRWx
Learn Kustomize for Kubernetes — mini course
josip.cloud/learn-kustomize-for-kubernetes-course-part-1-6cc4ab945f9d" rel="nofollow">https://medium.com/@josip.cloud/learn-kustomize-for-kubernetes-course-part-1-6cc4ab945f9d
Image Management on Kubernetes Node
rifewang/image-management-on-kubernetes-node-18649e16bc26" rel="nofollow">https://medium.com/@rifewang/image-management-on-kubernetes-node-18649e16bc26
The Power of Preview Deployments: Catching Bugs Before They Bite using Argo CD
A Step-by-Step Guide to Configuring Argo CD Pull Request Generator for Preview Deployments.
tenv
Welcome to tenv, a versatile version manager for OpenTofu, Terraform, Terragrunt and Atmos, written in Go. Our tool simplifies the complexity of handling different versions of these powerful tools, ensuring developers and DevOps professionals can focus on what matters most - building and deploying efficiently.
Why I'm No Longer Talking to Architects About Microservices
https://blog.container-solutions.com/why-im-no-longer-talking-to-architects-about-microservices
🧐По каким причинам могут возникнуть сопротивления при внедрении изменений в процессы компании?
Узнайте на бесплатном вебинаре онлайн-курса «DevOps Lead» - «Как работать с сопротивлением во время изменений в компании»: регистрация
На бесплатном вебинаре рассмотрим:
- причины возникновения сопротивления;
- какие возможны последствия;
- концепции работы с сопротивлением.
После занятий вы будете знать:
- какие могут быть риски при возникновении подобных сопротивлений, если с ними не работать;
- некоторые фреймворки работы с сопротивлением.
🤝После вебинара продолжите обучение на курсе со скидкой и даже в рассрочку!
Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2VtzqviMoC3
Эффективное использование облаков — признак топового специалиста 💯
Уже завтра облачный провайдер Cloud․ru проведет онлайн-вебинар и покажет, как оптимизировать затраты на облачную IT-инфраструктуру:
В программе:
1⃣ анализ текущей утилизации ресурсов;
2⃣ использование Public API: тегирование ресурсов для лучшей аналитики затрат.
3⃣ анализ данных и оптимизация потребления;
4⃣ настройка лимитов бюджетов;
➡ Регистрируйтесь по ссылке
О! Астрологи объявили март месяцем DevOps ✨
27 марта пройдёт первый DevOps митап от Островка.
Программа митапа:
🟢 «Как правильно готовиться к работам, связанным с даунтаймами» — Иван Иостман, Senior Data Infrastructure Engineer, Островок.
🟢 Stand-up «Девопс — не лошадь» — Александр Чистяков, многодетный отец девопсов.
🟢 «Автоскейлинг инференса в Kubernetes» — Антон Алексеев, Selectel.
🟢 Stand-up «Ошибки капитального строительства» — Антон Жбанков, автор канала BeerPanda.
Ведущие:
🔹Александр Крылов — организатор DevOpsForLove, CPO "Штурвала" в Лаборатории Числитель.
🔹Денис Божок — Engineering Manager, Островок.
🔹Анна Афонина — организатор ProIT Fest.
Трансляции не будет, но мы выложим запись мероприятия на нашем канале в YouTube.
👉Регистрация по ссылке
Мы приглашаем поучаствовать очно в первую очередь DevOps-специалистов. Участие будет одобрено в течение 1-2 дней. Подтверждение и подробную информацию о мероприятии направим на почту, указанную при регистрации.
До встречи!
Реклама. ООО «Бронирование гостиниц», ИНН: 7703389880
pgrouting
pgRouting extends the PostGIS/PostgreSQL geospatial database to provide geospatial routing and other network analysis functionality.
The case of the vanishing CPU: A Linux kernel debugging story
A mysterious CPU spike in ClickHouse Cloud on GCP led to months of debugging, revealing a deeper issue within the Linux kernel’s memory management. What started as random performance degradation turned into a deep dive into kernel internals, where engineer Sergei Trifonov uncovered a hidden livelock. His journey through eBPF tracing, perf analysis, and a reproducible test case ultimately led to a surprising fix - only for another kernel bug to surface right after. Curious, read on…
Но ты не один
Посмотрим, сколько нас — на бесплатном вебинаре «Тулинг для построения более безопасной инфраструктуры в Kubernetes».
Разберём всё: от сканирования на уязвимости до деплоя в прод и постоянного мониторинга возможных инцидентов
А ещё:
- посмотрим, что есть в экосистеме k8s
- зачем это применять
- когда не оправдано закручивание гаек в инфраструктуре
Спикер: Виталий Лихачев, SRE в крупном нидерландском тревелтехе.
Дата: 27 марта 20:00
👉 Занять место — через бота.
В конце вебинара — подарок 🎁
Вебинар проходит в рамках курса «Kubernetes Мега»
Реклама ООО «Слёрм» ИНН 3652901451
Metal3
Metal3 (pronounced “metal cubed”) is an open-source project that provides a set of tools for managing bare-metal infrastructure using Kubernetes.
A practical guide to Kubernetes Gateway API
https://www.spectrocloud.com/blog/practical-guide-to-kubernetes-gateway-api
Securing Continuous Delivery: Argo CD Threat Detection
https://medium.com/exness-blog/securing-continuous-delivery-argo-cd-threat-detection-6296f97c9197