devopslibrary | Unsorted

Telegram-канал devopslibrary - DevOps&SRE Library

17344

Библиотека статей по теме DevOps и SRE. Реклама: @ostinostin Контент: @mxssl РКН: https://knd.gov.ru/license?id=67704b536aa9672b963777b3®istryType=bloggersPermission

Subscribe to a channel

DevOps&SRE Library

Longhorn Backup and Restore

Article breaks down using Longhorn (version 1.7) for backups, self-hosting, and recovery. It’s for seasoned DevOps and SysAdmin folks who like doing things themselves. You’ll find a step-by-step guide on setting up and restoring backups with Longhorn, Velero, and GitOps. The goal is to show you a tried-and-true setup for getting your backups and restores working smoothly.


https://reddec.net/posts/longhorn-backup-and-restore

Читать полностью…

DevOps&SRE Library

Automatic testing and rollback of your GitOps with Argo Rollouts

https://jason-umiker.medium.com/automatic-rollback-of-your-gitops-with-argo-rollouts-04f94baa2d03

Читать полностью…

DevOps&SRE Library

Ваша инфраструктура — ваш код. Готовы управлять ею правильно?

GitOps — это способ автоматизировать управление приложениями в Kubernetes, минимизировать ошибки и ускорить развертывание.

На открытом уроке 03.04.2025 в 20:00 мы разберем ключевые команды, работу с YAML-манифестами и научимся эффективно управлять приложениями в Kubernetes.

Записывайтесь на вебинар и получите гарантированную скидку на курс «GitOps»:
https://vk.cc/cK8LBz

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2Vtzqvs4ZCL

Читать полностью…

DevOps&SRE Library

Overview of Kubernetes GPU Scheduling, Device Plugin, CDI, NFD, and GPU Operator

rifewang/overview-of-kubernetes-gpu-scheduling-device-plugin-cdi-nfd-and-gpu-operator-48a7c4213b28" rel="nofollow">https://medium.com/@rifewang/overview-of-kubernetes-gpu-scheduling-device-plugin-cdi-nfd-and-gpu-operator-48a7c4213b28

Читать полностью…

DevOps&SRE Library

Auto-scaling with KEDA Using Custom RED Metrics from Prometheus

At the beginning of the year, we made a strategic decision to rewrite and optimize our legacy services that experience high load during peak times. Recognizing that these services don’t consistently operate under the same load levels, we opted for an auto-scaling approach. This decision was driven by two primary goals: enhancing reliability and evolving towards a more cloud-native architecture.


emreblblvv/auto-scaling-with-keda-using-custom-red-metrics-from-prometheus-76d50785e442" rel="nofollow">https://medium.com/@emreblblvv/auto-scaling-with-keda-using-custom-red-metrics-from-prometheus-76d50785e442

Читать полностью…

DevOps&SRE Library

Terraform Infrastructure as Code: Essential Tools for Clean, Maintainable Production Environments

In this article, I’ll cover a few important tools that can help you keep your Terraform code in good shape. I’ll cover areas such as static analysis, documentation, security checks and ways to improve your workflow. These tools can alert you early on to potential problems, help you adhere to best practices, stimulate teamwork and reduce operational risks.


https://awsmorocco.com/terraform-infrastructure-as-code-essential-tools-for-clean-maintainable-production-environments-e223bedac905

Читать полностью…

DevOps&SRE Library

pg_mooncake

pg_mooncake is a Postgres extension that adds columnar storage and vectorized execution (DuckDB) for fast analytics within Postgres. Postgres + pg_mooncake ranks among the top 10 fastest in ClickBench.


https://github.com/Mooncake-Labs/pg_mooncake

Читать полностью…

DevOps&SRE Library

wait4x

Wait4X is a powerful, zero-dependency tool that waits for services to be ready before continuing.


https://github.com/atkrad/wait4x

Читать полностью…

DevOps&SRE Library

postgresql-embedded

Install and run a PostgreSQL database locally on Linux, MacOS or Windows. PostgreSQL can be bundled with your application, or downloaded on demand.


https://github.com/theseus-rs/postgresql-embedded

Читать полностью…

DevOps&SRE Library

rsql

rsql is a command line SQL interface for data. rsql is a modern, feature-rich, and user-friendly client, that has been designed to be easy to use, and to provide a consistent experience across all supported data sources.


https://github.com/theseus-rs/rsql

Читать полностью…

DevOps&SRE Library

🌐 Правильная маршрутизация VLAN: безопасность и эффективность в одном флаконе!

Выбираете между роутером на палочке и коммутатором третьего уровня? 🤔 У нас есть ответы! Присоединяйтесь к нашему открытом вебинару, где мы подробно разберём все аспекты маршрутизации VLAN.

Что вас ждёт на вебинаре?
- Преимущества и подводные камни каждого метода.
- Практическая реализация на реальных кейсах.
- Рекомендации по выбору в зависимости от конкретных задач.

Кому будет полезно?
Сетевым инженерам, DevOps-специалистам, администраторам и всем, кто хочет разобраться в маршрутизации VLAN.

💡 Вебинар пройдет в преддверии старта курса «Network Engineer». Все участники получат максимальную скидку на обучение по промокоду "NETWORK_5".

📅 Встречаемся 19 марта в 20:00 МСК.

🔗 Регистрируйтесь прямо сейчас: https://vk.cc/cJHWmd

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2VtzqvzWCXy

Читать полностью…

DevOps&SRE Library

kubeip

Kubernetes' nodes don't necessarily need their own public IP addresses to communicate. However, there are certain situations where it's beneficial for nodes in a node pool to have their own unique public IP addresses.

For instance, in gaming applications, a console might need to establish a direct connection with a cloud virtual machine to reduce the number of hops.

Similarly, if you have multiple agents running on Kubernetes that need a direct server connection, and the server needs to whitelist all agent IPs, having dedicated public IPs can be useful. These scenarios, among others, can be handled on a cloud-managed Kubernetes cluster using Node Public IP.

KubeIP is a utility that assigns a static public IP to each node it manages. The IP is allocated to the node's primary network interface, chosen from a pool of reserved static IPs using platform-supported filtering and ordering.

If there are no static public IPs left, KubeIP will hold on until one becomes available. When a node is removed, KubeIP releases the static public IP back into the pool of reserved static IPs.


https://github.com/doitintl/kubeip

Читать полностью…

DevOps&SRE Library

autotune

Kruize Autotune is an Autonomous Performance Tuning Tool for Kubernetes. Autotune accepts a user provided "slo" goal to optimize application performance. It uses Prometheus to identify "layers" of an application that it is monitoring and matches tunables from those layers to the user provided slo. It then runs experiments with the help of a hyperparameter optimization framework to arrive at the most optimal values for the identified set of tunables to get a better result for the user provided slo.

Autotune can take an arbitrarily large set of tunables and run experiments to continually optimize the user provided slo in incremental steps. For this reason, it does not necessarily have a "best" value for a set of tunables, only a "better" one than what is currently deployed.


https://github.com/kruize/autotune

Читать полностью…

DevOps&SRE Library

Ensuring Effective Helm Charts with Linting, Testing, and Diff Checks

https://dev.to/hkhelil/ensuring-effective-helm-charts-with-linting-testing-and-diff-checks-ni0

Читать полностью…

DevOps&SRE Library

Kubernetes: How kube-proxy and CNI Work Together

rifewang/kubernetes-how-kube-proxy-and-cni-work-together-1255d273f291" rel="nofollow">https://medium.com/@rifewang/kubernetes-how-kube-proxy-and-cni-work-together-1255d273f291

Читать полностью…

DevOps&SRE Library

⚙️ Из каких частей состоит Kubernetes

Этот вебинар посвящён внутреннему устройству Kubernetes — одной из самых популярных платформ для контейнеризации и оркестрации. Вы узнаете, из каких ключевых компонентов состоит Kubernetes, как они взаимодействуют между собой и как настроить их для эффективного управления контейнерными приложениями.

На вебинаре вы узнаете:

1. Основные компоненты архитектуры Kubernetes: Control Plane, Worker Nodes, и их роли в системе.
2. Как работают ключевые элементы Control Plane: API Server, etcd, Scheduler, Controller Manager.
3. Функции Worker Nodes, включая kubelet, kube-proxy и контейнерный runtime (например, Docker или containerd).
4. Как работают Pods, Namespaces, ConfigMaps, Secrets, и их роль в управлении контейнерами.
5. Принципы масштабирования приложений и обеспечения отказоустойчивости с помощью Kubernetes.
6. Настройка сетевого взаимодействия и хранения данных с использованием Ingress, Persistent Volumes и Storage Classes.

👉 Регистрация и подробности о курсе "Инфраструктурная платформа на основе Kubernetes": https://vk.cc/cK9QRl

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2VtzqwibRWx

Читать полностью…

DevOps&SRE Library

Learn Kustomize for Kubernetes — mini course

josip.cloud/learn-kustomize-for-kubernetes-course-part-1-6cc4ab945f9d" rel="nofollow">https://medium.com/@josip.cloud/learn-kustomize-for-kubernetes-course-part-1-6cc4ab945f9d

Читать полностью…

DevOps&SRE Library

Image Management on Kubernetes Node

rifewang/image-management-on-kubernetes-node-18649e16bc26" rel="nofollow">https://medium.com/@rifewang/image-management-on-kubernetes-node-18649e16bc26

Читать полностью…

DevOps&SRE Library

The Power of Preview Deployments: Catching Bugs Before They Bite using Argo CD

A Step-by-Step Guide to Configuring Argo CD Pull Request Generator for Preview Deployments.


https://medium.com/hostspaceng/the-power-of-preview-deployments-catching-bugs-before-they-bite-using-argo-cd-c21c069b04c5

Читать полностью…

DevOps&SRE Library

tenv

Welcome to tenv, a versatile version manager for OpenTofu, Terraform, Terragrunt and Atmos, written in Go. Our tool simplifies the complexity of handling different versions of these powerful tools, ensuring developers and DevOps professionals can focus on what matters most - building and deploying efficiently.


https://github.com/tofuutils/tenv

Читать полностью…

DevOps&SRE Library

Why I'm No Longer Talking to Architects About Microservices

https://blog.container-solutions.com/why-im-no-longer-talking-to-architects-about-microservices

Читать полностью…

DevOps&SRE Library

🧐По каким причинам могут возникнуть сопротивления при внедрении изменений в процессы компании?

Узнайте на бесплатном вебинаре онлайн-курса «DevOps Lead» - «Как работать с сопротивлением во время изменений в компании»: регистрация

На бесплатном вебинаре рассмотрим:

- причины возникновения сопротивления;
- какие возможны последствия;
- концепции работы с сопротивлением.

После занятий вы будете знать:


- какие могут быть риски при возникновении подобных сопротивлений, если с ними не работать;
- некоторые фреймворки работы с сопротивлением.

🤝После вебинара продолжите обучение на курсе со скидкой и даже в рассрочку!

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2VtzqviMoC3

Читать полностью…

DevOps&SRE Library

Эффективное использование облаков — признак топового специалиста 💯

Уже завтра облачный провайдер Cloud․ru проведет онлайн-вебинар и покажет, как оптимизировать затраты на облачную IT-инфраструктуру:

В программе:
1⃣ анализ текущей утилизации ресурсов;
2⃣ использование Public API: тегирование ресурсов для лучшей аналитики затрат.
3⃣ анализ данных и оптимизация потребления;
4⃣ настройка лимитов бюджетов;

Регистрируйтесь по ссылке

Читать полностью…

DevOps&SRE Library

О! Астрологи объявили март месяцем DevOps

27 марта пройдёт первый DevOps митап от Островка.

Программа митапа:
🟢 «Как правильно готовиться к работам, связанным с даунтаймами» — Иван Иостман, Senior Data Infrastructure Engineer, Островок.

🟢 Stand-up «Девопс — не лошадь» — Александр Чистяков, многодетный отец девопсов.

🟢 «Автоскейлинг инференса в Kubernetes» — Антон Алексеев, Selectel.

🟢 Stand-up «Ошибки капитального строительства» — Антон Жбанков, автор канала BeerPanda.

Ведущие:
🔹Александр Крылов — организатор DevOpsForLove, CPO "Штурвала" в Лаборатории Числитель.
🔹Денис Божок — Engineering Manager, Островок.
🔹Анна Афонина — организатор ProIT Fest.

Трансляции не будет, но мы выложим запись мероприятия на нашем канале в YouTube.

👉Регистрация по ссылке

Мы приглашаем поучаствовать очно в первую очередь DevOps-специалистов. Участие будет одобрено в течение 1-2 дней. Подтверждение и подробную информацию о мероприятии направим на почту, указанную при регистрации.

До встречи!

Реклама. ООО «Бронирование гостиниц», ИНН: 7703389880

Читать полностью…

DevOps&SRE Library

pgrouting

pgRouting extends the PostGIS/PostgreSQL geospatial database to provide geospatial routing and other network analysis functionality.


https://github.com/pgRouting/pgrouting

Читать полностью…

DevOps&SRE Library

The case of the vanishing CPU: A Linux kernel debugging story

A mysterious CPU spike in ClickHouse Cloud on GCP led to months of debugging, revealing a deeper issue within the Linux kernel’s memory management. What started as random performance degradation turned into a deep dive into kernel internals, where engineer Sergei Trifonov uncovered a hidden livelock. His journey through eBPF tracing, perf analysis, and a reproducible test case ultimately led to a surprising fix - only for another kernel bug to surface right after. Curious, read on…


https://clickhouse.com/blog/a-case-of-the-vanishing-cpu-a-linux-kernel-debugging-story

Читать полностью…

DevOps&SRE Library

Но ты не один

Посмотрим, сколько нас — на бесплатном вебинаре «Тулинг для построения более безопасной инфраструктуры в Kubernetes».

Разберём всё: от сканирования на уязвимости до деплоя в прод и постоянного мониторинга возможных инцидентов

А ещё:
- посмотрим, что есть в экосистеме k8s
- зачем это применять
- когда не оправдано закручивание гаек в инфраструктуре

Спикер: Виталий Лихачев, SRE в крупном нидерландском тревелтехе.

Дата: 27 марта 20:00

👉 Занять место через бота.

В конце вебинара — подарок 🎁

Вебинар проходит в рамках курса «Kubernetes Мега»

Реклама ООО «Слёрм» ИНН 3652901451

Читать полностью…

DevOps&SRE Library

Metal3

Metal3 (pronounced “metal cubed”) is an open-source project that provides a set of tools for managing bare-metal infrastructure using Kubernetes.


https://metal3.io

Читать полностью…

DevOps&SRE Library

A practical guide to Kubernetes Gateway API

https://www.spectrocloud.com/blog/practical-guide-to-kubernetes-gateway-api

Читать полностью…

DevOps&SRE Library

Securing Continuous Delivery: Argo CD Threat Detection

https://medium.com/exness-blog/securing-continuous-delivery-argo-cd-threat-detection-6296f97c9197

Читать полностью…
Subscribe to a channel