Telegram-канал devopslibrary - DevOps&SRE Library: Unsorted

DevOps&SRE Library

11 April 2025 09:04

Anatomy of a Throttler

Part 1: https://planetscale.com/blog/anatomy-of-a-throttler-part-1

Part 2: https://planetscale.com/blog/anatomy-of-a-throttler-part-2

Part 3: https://planetscale.com/blog/anatomy-of-a-throttler-part-3

Читать полностью…

DevOps&SRE Library

10 April 2025 17:04

Beyond “5 Whys”: A Better Way to Learn from Incidents

We all can agree that the most important purpose of a post-incident review (or post-mortem) is to learn from incidents. Implied in this learning is improving the system (people, processes, technology, and their interactions). All my reflections on the “5 Whys” technique refer back to how the technique enhances our learning (or not) from incidents.

https://uptimelabs.io/beyond-5-whys-a-better-way-to-learn-from-incidents

Читать полностью…

DevOps&SRE Library

10 April 2025 09:04

openproject

OpenProject is the leading open source project management software.

https://github.com/opf/openproject

Читать полностью…

DevOps&SRE Library

09 April 2025 11:00

Как организовать безопасное подключение к облачной инфраструктуре?

Существует несколько способов. Об одном из них – новом сервисе К2 Облака Direct Connect – расскажет Владислав Одинцов, техлид, product owner сетевых сервисов K2 Cloud.

Вы узнаете из первых рук о возможностях сервиса и увидите демонстрацию его работы.

Подключайтесь и задавайте свои вопросы о создании гибридной инфраструктуры «облако+on premise».

22 апреля 11:00
Подробности и регистрация

Читать полностью…

DevOps&SRE Library

08 April 2025 18:00

🚀 23 апреля — не пропусти митап в Магнит OMNI!

Здесь соберутся инженеры, администраторы и разработчики, чтобы обсудить, как сделать инфраструктуру устойчивой к сбоям и не сойти с ума, когда все идет не по плану.

🔸 Что будет:
— Спикеры из Магнит OMNI, Лаборатории Касперского, Авито и других крутых компаний
— Разбор болей и кейсов, которые реально работают
— Розыгрыш призов (крутейший мерч!)
— Панельная дискуссия о том, как повышать устойчивость сервисов
— Живой нетворкинг (познакомься с теми, кто тоже не спит по ночам, пока чинит прод)

📅Когда?
23 апреля, 17:30. Приходи пораньше — welcome-зона ждет!

Где?
Москва, Ленинградский проспект 15/10.
Метро: Белорусская, БЦ Большевик.

Можно онлайн? Можно!

Не упусти шанс прокачать свои знания и завести полезные знакомства! Подробности и регистрация — по ссылке.

Реклама. Рекламодатель АО «Тандер», ИНН: 2310031475, erid: 2SDnjf3fPTz

Читать полностью…

DevOps&SRE Library

08 April 2025 09:03

falco

Falco is a cloud native runtime security tool for Linux operating systems. It is designed to detect and alert on abnormal behavior and potential security threats in real-time.

https://github.com/falcosecurity/falco

Читать полностью…

DevOps&SRE Library

07 April 2025 12:58

Инженеры, которые участвуют в разработке платформ, — это для вас

Есть планы на 23 апреля? Освободите вечер для Platform Engineering Night — встречи с профессионалами, которые создают инженерные платформы.

В программе — Productivity & AI:
— Кейсы по автоматизации процессов и повышению продуктивности платформенных команд.
— Ассистенты для кодинга и Observability.
— Решения для безопасности и аналитики.

А еще в программе — зона демонстрации AI-решений в платформах и нетворкинг.

Встреча пройдет 23 апреля в 19:00 в T-Space по адресу Москва, Грузинский Вал, 7. Трансляция тоже будет.

Мероприятие бесплатное, торопитесь занять место

Читать полностью…

DevOps&SRE Library

06 April 2025 17:06

Connecting K8S/Cilium cluster and K8S/Calico cluster using Submariner

yboaron/connecting-k8s-cilium-cluster-and-k8s-calico-cluster-using-submariner-d56d7c39f0cb" rel="nofollow">https://medium.com/@yboaron/connecting-k8s-cilium-cluster-and-k8s-calico-cluster-using-submariner-d56d7c39f0cb

Читать полностью…

DevOps&SRE Library

05 April 2025 17:04

Securing Argo CD in a Multi-Tenant Environment with Application Projects

https://medium.com/containers-101/securing-argo-cd-in-a-multi-tenant-environment-with-application-projects-39ad30893fd5

Читать полностью…

DevOps&SRE Library

04 April 2025 17:06

Managing Kubernetes CEPH cluster monitor: easier than it looks

In this article I will explain how you can safely fail over a rook-ceph Monitor to a new Kubernetes node.

I hope I will save you some time and if you find the content useful please leave a clap.Also let me know in the comments of the article if you need professional help with a common topic.

https://blog.devgenius.io/managing-kubernetes-ceph-cluster-monitor-easier-than-it-looks-56ee000e68ff

Читать полностью…

DevOps&SRE Library

03 April 2025 18:08

Живешь в мире масштабирования и аптайма? 🖱
GoCloud — конференция для IT-экспертов про облака и AI.

На GoCloud тебя ждут 30+ докладов, где расскажут и покажут:
➡как работают облачные сетевые сервисы
➡как подключать блочные хранилища к железным серверам
➡как запустить приложения в два клика, при этом сэкономив ресурсы
➡как реализована архитектура DBaaS поверх K8s

А еще будут ломать приложение в реальном времени и рассказывать про инструменты для защиты от уязвимостей.

Нетворкинг, презентации новых продуктов, live-демо и afterparty ждут тебя 10 апреля.
Регистрация по ссылке 👈

Читать полностью…

DevOps&SRE Library

03 April 2025 11:05

📐Основы Kubernetes: архитектура и абстракции

Как устроен Kubernetes и почему он стал стандартом для управления контейнерами?

Что разберемся на занятии:

1. Ключевые компоненты Kubernetes: контейнеры, поды, ноды, сервисы и их взаимодействие.
2. Как в Kubernetes происходит развертывание и управление микросервисами.
3. Принципы масштабируемости, отказоустойчивости и безопасности в Kubernetes.
4. Реальные кейсы использования Kubernetes для DevOps и архитекторов.

Что получится после урока?

• Фундаментальное понимание структуры Kubernetes и его ключевых абстракций.
• Навыки работы с необычными объектами для развертывания и масштабирования приложений.
• Практические знания, которые можно сразу применить в работе.

👉 Регистрация и подробности о курсе "Инфраструктурная платформа на основе Kubernetes": https://vk.cc/cKs1oQ

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2VtzqufP6fj

Читать полностью…

DevOps&SRE Library

02 April 2025 18:00

🚨 Команда Яндекс 360 в поиске SRE-инженера

Яндекс 360 — это 13 высоконагруженных сервисов (Почта, Диск, Календарь, Телемост и другие) и более 95 миллионов пользователей ежемесячно. Мы хотим предоставить бизнес-клиентам возможность использовать сервисы по модели on-premises — то есть на инфраструктуре заказчика.

Ищем SRE-инженера, который поможет сделать процесс установки, поддержки и обновления сервисов в клиентской инфраструктуре максимально простым и удобным. Детальное описание вакансии и задач ищите тут.

Что ожидаем:
🟠 Опыт автоматизации установки, конфигурации и обновления сложных микросервисных приложений в облаке
🟠Понимание принципов Infrastructure as Code, опыт работы с Terraform и Ansible
🟠 Понимание принципов GitOps, работа с Git
🟠 Опыт работы с любой CI/CD платформой
🟠 Опыт работы с публичными облаками (AWS, Azure, Yandex Cloud)

Подробнее про задачи, стек и вызовы читайте в описании вакансии. Откликайтесь — и ждём вас в команде 🙌

Читать полностью…

DevOps&SRE Library

02 April 2025 11:02

KORE, сети и железная леди: как строится кровеносная система любого big tech

В новом выпуске подкаста «Расскажите про MWS» мы беседуем с Геннадием Липенковым, руководителем направления Engineering & Servers Infrastructure MWS.

Обсудим всё — от сетей и серверов до команд, которые обеспечивают стабильность процессов. Разберемся, какие люди и подходы необходимы для непрерывной разработки продуктов, и, конечно, выясним, кто такая «железная леди».

Смотрите и слушайте на всех популярных площадках:
🎬 YouTube
🎬 VK Видео

🎧 Яндекс Музыка
🎧 Apple Podcasts
🎧 Mave Digital

Читать полностью…

DevOps&SRE Library

01 April 2025 18:04

➕ Открытый практикум DevOps by Rebrain: Managed Kubernetes и облачные сервисы. Как работать эффективнее с Yandex Cloud

↘️ Регистрация

Время проведения:

10 апреля (четверг) в 12:00 по МСК

Программа практикума:

🟢Ценность Kubernetes и облачных сервисов — зачем в этом нужно разбираться
🟢Работа с Yandex Managed Service for Kubernetes и другими сервисами
🟢Полезные практические сценарии — разбор интересных решений
🟢Типичные ошибки пользователей и сложности при работе на платформе Yandex Cloud — на демостенде

Кто ведёт?

Нурсултан Калниязов — архитектор облачных решений. Помогает развивать облачные сервисы, имеет большой опыт работы с Kubernetes. C 2022 года работает в Yandex Cloud.

Василий Озеров — Co-Founder Rebrain, руководитель международной команды Fevlake. Спикер RootConf / DevopsConf.

✉️ Вас ждут кейсы про первые шаги в Yandex Cloud и лайфхаки администрирования Managed Kubernetes®

Реклама. ООО "РЕБРЕИН", ИНН: 7727409582, erid: 2W5zFJcxsep

Читать полностью…

DevOps&SRE Library

10 April 2025 18:00

Привет! На связи KTS.

Мы подготовили новый челлендж для DevOps-инженеров в честь наступающего Дня Космонавтики.

Вы получите доступ к кластеру, в котором запущен ArgoCD. Через него вам нужно будет запустить приложение: оно рабочее и даже описано в Helm, но деплой выполнить не получается — каждый раз возникает какая-то проблема.

Ваша задача — найти ошибку в конфигурации и заставить приложение работать. Уверены в своих силах? Тогда переходите в бота и приступайте!

Десять самых успешных участников получат в награду наши фирменные футболки 💚

Реклама. ООО "Студия КТС", ИНН: 7733257480, erid: 2VtzqwjaZpV

Читать полностью…

DevOps&SRE Library

10 April 2025 11:48

Рассказываем на примере блочных устройств нового облака MWS.

➡Читайте новую статью на Хабр в хабе "Разработка публичных облаков".

Вы узнаете:
🔴 Как декларативный API облегчает управление циклами реконсиляции
🔴 На каких компонентах и технологиях написали управление циклами
🔴 Как работают межсервисные нотификации об изменении ресурсов

Подписаться на хаб

Читать полностью…

DevOps&SRE Library

09 April 2025 17:04

xan

xan is a command line tool that can be used to process CSV files directly from the shell.

https://github.com/medialab/xan

Читать полностью…

DevOps&SRE Library

09 April 2025 09:04

stu

STU is the TUI explorer application for Amazon S3 (AWS S3) written in Rust using ratatui.

https://github.com/lusingander/stu

Читать полностью…

DevOps&SRE Library

08 April 2025 17:07

dice

DiceDB is an open-source, fast, reactive, in-memory database optimized for modern hardware. Commonly used as a cache, it offers a familiar interface while enabling real-time data updates through query subscriptions. It delivers higher throughput and lower median latencies, making it ideal for modern workloads.

https://github.com/dicedb/dice

Читать полностью…

DevOps&SRE Library

07 April 2025 17:08

kubectl.nvim

Processes kubectl outputs to enable vim-like navigation in a buffer for your cluster.

https://github.com/Ramilito/kubectl.nvim

Читать полностью…

DevOps&SRE Library

07 April 2025 09:03

container-startup-autoscaler

container-startup-autoscaler (CSA) is a Kubernetes controller that modifies the CPU and/or memory resources of containers depending on whether they're starting up, according to the startup/post-startup settings you supply. CSA works at the pod level and is agnostic to how the pod is managed; it works with deployments, statefulsets, daemonsets and other workload management APIs.

https://github.com/ExpediaGroup/container-startup-autoscaler

Читать полностью…

DevOps&SRE Library

06 April 2025 09:07

How to mount secrets as files or environment variables in Kubernetes

https://itnext.io/how-to-mount-secrets-as-files-or-environment-variables-in-kubernetes-f03d545dcd89

Читать полностью…

DevOps&SRE Library

05 April 2025 09:05

How to Troubleshoot OOM Issues in Go Applications Running on Kubernetes

csepulvedab/how-to-troubleshoot-oom-issues-in-go-applications-running-on-kubernetes-149e8bb104ac" rel="nofollow">https://medium.com/@csepulvedab/how-to-troubleshoot-oom-issues-in-go-applications-running-on-kubernetes-149e8bb104ac

Читать полностью…

DevOps&SRE Library

04 April 2025 09:07

When is read-only not read-only?

Kubernetes RBAC has some tricky areas where the behaviour you get might not be exactly what you expect, and sometimes as in this case, those unexpected behaviours are not very apparent!

https://raesene.github.io/blog/2024/11/11/When-Is-Read-Only-Not-Read-Only

Читать полностью…

DevOps&SRE Library

03 April 2025 17:08

All My DevOps Pipelines from GitLab Commit to ArgoCD got beaten by FTP

davidpech_39825/all-my-devops-pipelines-from-gitlab-commit-to-argocd-got-beaten-by-ftp-205b34f61441" rel="nofollow">https://medium.com/@davidpech_39825/all-my-devops-pipelines-from-gitlab-commit-to-argocd-got-beaten-by-ftp-205b34f61441

Читать полностью…

DevOps&SRE Library

03 April 2025 09:06

From Autopilot to Standard GKE: The Key to 15x Cheaper Istio

TL;DR Istio proxy costs for 10-nodes GKE cluster reduced from $3065 to $185 per month.

https://medium.com/google-cloud/from-autopilot-to-standard-gke-the-key-to-15x-cheaper-istio-d755c1d3866d

Читать полностью…

DevOps&SRE Library

02 April 2025 17:03

Kubernetes at Mercado Libre

At Mercado Libre, managing over 30,000 microservices and supporting 16,000 developers requires a robust and scalable solution. To address these challenges, we adopted Kubernetes (K8s) as the core engine of our internal platform, Fury. This article explores how Kubernetes streamlined our infrastructure management, accelerated software delivery, and improved cost efficiency, enabling our developers to focus on innovation and product creation.

https://medium.com/mercadolibre-tech/kubernetes-at-mercado-libre-ec331bea1866

Читать полностью…

DevOps&SRE Library

02 April 2025 09:06

ttyd

ttyd is a simple command-line tool for sharing terminal over the web.

https://github.com/tsl0922/ttyd

Читать полностью…

DevOps&SRE Library

01 April 2025 17:09

The Real Failure Rate of EBS

PlanetScale has deployed millions of Amazon Elastic Block Store (EBS) volumes across the world. We create and destroy tens of thousands of them every day as we stand up databases for customers, take backups, and test our systems end-to-end. Through this experience, we have an unique viewpoint into the failure rate and mechanisms of EBS, and have spent a lot of time working on how to mitigate them.

https://planetscale.com/blog/the-real-fail-rate-of-ebs

Читать полностью…