Библиотека статей по теме DevOps и SRE. Реклама: @ostinostin Контент: @mxssl РКН: https://knd.gov.ru/license?id=67704b536aa9672b963777b3®istryType=bloggersPermission
kubectl-switch
kubectl-switch is a command-line tool for managing and switching between multiple Kubernetes configuration files located in the same directory. It simplifies the process of selecting a Kubernetes context from multiple kubeconfig files and updating the active configuration or namespace.
Just dump all your kubeconfigs into a single dir and let kubectl-switch manage them for you!
khronoscope
Khronoscope is a tool inspired by k9s that allows you to inspect the state of your Kubernetes cluster and travel back in time to see its state at any point since you started the application using VCR like controls.
Mastering Compute Efficiency: Dynamic GPU Partitioning Strategies for Kubernetes-Based ML Systems
https://yashmehra2411.medium.com/mastering-gpu-efficiency-dynamic-partitioning-strategies-for-kubernetes-based-ml-systems-75100c94112b
Demistifying Istio Gateways
arivermar/demistifying-istio-gateways-762d37070431" rel="nofollow">https://medium.com/@arivermar/demistifying-istio-gateways-762d37070431
⭐️🚀 Хотите прокачаться в работе с Linux? Пора проверить, готовы ли вы к следующему шагу!
Пройдите короткое тестирование и узнайте, готовы ли вы к повышению квалификации на курсе «Administrator Linux. Professional». Мы обучаем продвинутым навыкам администрирования Linux: от установки и настройки ОС до оптимизации работы и управления безопасностью.
🎁 Успешное прохождение вступительного теста — это ваш пропуск к записям открытых уроков и скидке на большое обучение.
❗️Доступ к записям откроется для тех кто успешно пройдет тест. Уроки находятся на лендинге курса.
👉 Оцените свой уровень знаний прямо сейчас: https://vk.cc/cMo91m
Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2Vtzqv5U6a9
Reducing Pod Startup Time for Java Application on EKS
balu8095/reducing-pod-startup-time-for-java-application-on-eks-a4fc80482039" rel="nofollow">https://medium.com/@balu8095/reducing-pod-startup-time-for-java-application-on-eks-a4fc80482039
We’re leaving Kubernetes
Kubernetes seems like the obvious choice for building out remote, standardized and automated development environments. We thought so too and have spent six years invested in making the most popular cloud development environment platform at internet scale. That’s 1.5 million users, where we regularly see thousands of development environments per day. In that time, we’ve found that Kubernetes is not the right choice for building development environments.
🚀 Разгоняем kube-prometheus-stack: секретный ингредиент в Observability
🔥 9 июня в 20:00 мск — бесплатный вебинар «Разгоняем kube-prometheus-stack».
Мониторинг не должен тормозить, особенно когда что-то идёт не так.
Что разберём:
– как ускорить отклик Grafana при работе с большими объёмами данных,
– что замедляет Prometheus и как с этим бороться,
– как сократить сетевой трафик мониторинга без потерь,
– как не положить observability-инфру при инциденте,
– и какие архитектурные подходы помогают сделать мониторинг отказоустойчивым.
Оптимизируйте kube-prometheus-stack и держите руку на пульсе — даже в условиях пиковых нагрузок.
👉 Регистрируйтесь здесь:
https://vk.cc/cMlnQQ
Занятие приурочено к старту курса "Observability: мониторинг, логирование, трейсинг", на котором вы научитесь строить эффективные системы мониторинга, работать с Prometheus, Grafana, ELK и другими инструментами, визуализировать метрики.
Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2VtzqvLMHEm
What I Really Mean When I Say “Good Communication” in Incident Response
https://uptimelabs.io/good-communication-in-incident-response
Azure Verified Module - Azure Landing Zones
In this article, we take a look at the Azure Verified Module for Azure Landing Zones, and how we can customise deployments.
Terratags: Enforce Tags on your AWS Terraform configuration
https://dev.to/quixoticmonk/terratags-enforce-tags-on-your-aws-terraform-configuration-1ck5
stunner
A Kubernetes media gateway for WebRTC.
Understanding the 1MB Limit of Etcd in Kubernetes: Challenges with Helm Deployments
https://logeshbalu1998.medium.com/understanding-the-1mb-limit-of-etcd-in-kubernetes-challenges-with-helm-deployments-47ef41f37e9c
kro
This project aims to simplify the creation and management of complex custom resources for Kubernetes.
Kube Resource Orchestrator (kro) helps you to define complex multi-resource constructs as reusable components in your applications and systems. It does this by providing a Kubernetes-native, vendor agnostic way to define groupings of Kubernetes resources.
kro's fundamental custom resource is the ResourceGraphDefinition. A ResourceGraphDefinition defines collections of underlying Kubernetes resources. It can define any Kubernetes resources, either native or custom, and can specify the dependencies between them. This lets you define complex custom resources, and include default configurations for their use.
The kro controller will determine the dependencies between resources, establish the correct order of operations to create and configure them, and then dynamically create and manage all of the underlying resources for you.
kro is Kubernetes native and integrates seamlessly with existing tools to preserve familiar processes and interfaces.
How we tested scaling to 10,000 Kubernetes clusters without missing a beat
https://www.spectrocloud.com/blog/how-we-tested-scaling-to-10-000-kubernetes-clusters-without-missing-a-beat
Как мы в облаке MWS строим сети в Kubernetes и раздаём одинаковые IP на разные ВМ
🔗Читайте новые статьи в хабе DevCloud от MWS на Хабр:
➡про Multus CNI и multi-homed поды
➡про DHCP-сервер облака и раздачу IP в VRF
Рассказываем, как развиваем overlay-сеть платформы собственной разработки:
⏺ почему Multus + Cilium — must-have для multi-homed подов
⏺ как устроен DHCP в мире, где 192.168.0.1
могут быть у сотни клиентов
⏺ зачем VPP прокидывает Option 82, и как мы ловили баги
⏩Подпишись на хаб DevCloud от MWS, если интересна внутренняя кухня облаков.
Standardizing App Delivery with Flux and Generic Helm Charts
In this guide we will explore how Flux can be used to standardize the lifecycle management of applications by leveraging the Generic Helm Chart pattern.
The big promise of this pattern is that it should reduce the cognitive load on developers, as they only need to focus on the service-specific configuration, while the Generic Helm Chart shields them from the complexity of the Kubernetes API.
ETCD Production setup with TLS
https://blog.mohsen.co/etcd-production-setup-with-openssl-2b9ecd7e00d5
Istio-Proxy Chaos in the Middle of a Snowy Morning
December 4th, 2024, started as a peaceful, snowy morning. Around 8 AM, I settled into my work-from-home routine, having freshly brewed coffee. My usual workflow:
1. Check the Production dashboard to ensure everything is running smoothly — and it was.
2. Check my email and Slack to see if any team member needs help.
3. Open JIRA, pick up a task and get ready to dive into work.
There were no pressing issues to address. I opened JIRA and picked up a task to migrate one of our Infrastructures as a Code repository from Terragrunt to Terraform. This is a topic for another post to explain why.
Lucked out! The peace and serenity didn’t last long. An alert popped up: One of our production services had gone down. What started as a calm Wednesday morning quickly turned into a troubleshooting adventure.
How It Works — Validating Admission Policy
https://ihcsim.medium.com/how-it-works-validating-admission-policy-0664d23ce230
Service mesh и API-шлюзы: что выбрать и для чего? Ответ в статье 👇
Вы наверняка не раз слышали эти два термина применительно к микросервисам. Их часто путают, ведь обе технологии обеспечивают стабильное и безопасное взаимодействие. Но какую из них выбрать?
В статье вы узнаете:
👉 Чем отличается service mesh от API-шлюза
👉 Что отвечает за горизонтальный трафик, а что за вертикальный
👉 Когда использовать service mesh, а когда API-шлюз
👉 Что будет, если их объединить.
▶ Забирайте статью в PDF в боте и делитесь с коллегами!
Реклама ООО «Слёрм» ИНН 3652901451
Taming the Wild West of Research Computing: How Policies Saved Us a Thousand Headaches
Harnessing the power of policy-driven governance in shared computing environments
As a Seasoned K8s Expert: An In-Depth Analysis of the OpenAI’s Incident and Mitigation Strategies
On December 11, 2024, OpenAI experienced a major outage caused by a failure in the Kubernetes cluster control plane. For outsiders, this may simply seem like an interesting incident, but as an insider, I analyzed this failure from a technical perspective.
Как построить overlay-сеть для публичного облака на десятки тысяч виртуалок?
Смотрите 6-ю серию реалити про разработку облака от MWS — Building the Cloud.
Что будет в эфире:
⏺как мы строили control plane для VPC новой публичной платформы
⏺что происходит "под капотом" облака при создании ВМ
⏺как организовали обработку трафика в data plane
И, конечно, розыгрыш мерча от MWS за лучший вопрос.
⏩Интересуетесь сетевыми технологиями и внутренней кухней облаков? Подключайтесь к эфиру.
➡Зарегистрироваться
Готовы к карьерному рывку? Станьте DevOps Engineer в команде Телекома YADRO🔥
Хотите создавать надёжные и технологичные процессы для разных продуктовых команд компании? Тогда отправляйте резюме в одно из направлений: Infrastructure или CI/CD.
Что предлагаем
🚀 удалёнка или офис в одном из городов (Москва, СПб, Нижний Новгород, Екатеринбург, Минск)
🚀 возможность влиять на продукт и стать частью большого инженерного сообщества
🚀 возможность вертикального и горизонтального роста — проводим performance review раз в год
🚀 ДМС с первого дня работы, а ещё консультации юристов, психологов, экспертов по ЗОЖ и управлению финансами
Кого ждём в команду
DevOps-инженеров с опытом работы от года и желанием развивать новые продукты в нашей команде
Какие задачи вас ждут
⏺ настройка и внедрение систем мониторинга и Observability для продуктов, определение ключевых метрик совместно с командами разработки
⏺ разработка с нуля и доработка существующих CI/CD пайплайнов для продуктов и их компонентов в рамках экосистемы Gitlab CI
⏺ участие в создании отказоустойчивой инфраструктуры и её дальнейшей поддержке для обеспечения высокой скорости и качества сборки продуктов
Больше подробностей — по ссылке.
📆 Отправляйте резюме до 8 июня и присоединяйтесь к команде YADRO!
❔ Как микросервисы общаются между собой в Kubernetes?
Знание сетевого взаимодействия — ключ к эффективному управлению кластерами!
⏺️ На открытом уроке 28 мая в 20:00 МСК вы разберётесь с типами сервисов Kubernetes: ClusterIP, NodePort, ExternalService и LoadBalancer. Мы детально расскажем, как правильно настроить маршрутизацию трафика и обеспечить доступность сервисов как внутри, так и вне кластера.
Вы получите не только теоретические знания, но и практические навыки настройки маршрутизации трафика в реальном времени с живой демонстрацией. Научитесь правильно выбирать и применять сетевые паттерны для ваших проектов.
Регистрация открыта: https://vk.cc/cMd58N
Урок пройдет в преддверии старта курса «Инфраструктурная платформа на основе Kubernetes», участники получат скидку на обучение.
🎁 Промокод на доп.скидку на курс Kuber_06 , срок ограничен.
Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2VtzqvLMHEm
kubewall
A single binary to manage your multiple kubernetes clusters.
kubewall provides a simple and rich real time interface to manage and investigate your clusters.
The Hidden Risk of Running WordPress on Kubernetes: Debugging an Unexpected Downtime Issue
https://medium.com/1000farmacie/the-hidden-risk-of-running-wordpress-on-kubernetes-debugging-an-unexpected-downtime-issue-e810bf4fb577
🎥 Вебинар: Маршрутизатор на базе Linux: настройка и запуск
📝 На вебинаре вы узнаете:
- Как настроить маршрутизацию в Linux и обеспечить доступ в интернет
- Что нужно для раздачи интернета внутри локальной сети
- Как настроить NAT и базовые правила iptables
- Какие возможности открывает использование Linux в роли роутера
💪 В результате:
- Сможете настроить Linux как маршрутизатор для локальной сети
- Научитесь применять iptables/NFT для управления трафиком и безопасности
- Попробуете настроить NAT и проброс портов
- Поймёте принципы маршрутизации и взаимодействия сетевых интерфейсов в Linux
🎁 Все участники вебинара получат скидку на курс "Administrator Linux. Professional".
👉 Для участия зарегистрируйтесь https://vk.cc/cMbqHV
Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2VtzquqxuiU
🚀 Откройте для себя Infrastructure as Code с Terraform
❓Задумывались, как упростить управление инфраструктурой и сделать её более прозрачной и управляемой? Узнайте, как сделать это с помощью Terraform на открытом вебинаре.
Мы расскажем, как концепция Infrastructure as Code помогает автоматизировать и контролировать процессы, избавляя вас от необходимости вручную управлять виртуальными машинами через интерфейс облачных провайдеров. Один раз описав желаемое состояние инфраструктуры, вы сможете подключать любые облачные провайдеры, когда это будет нужно.
Преимущества очевидны: автоматизация, контроль версий и возможность откатиться к предыдущим состояниям. Понимание этих инструментов — шаг к эффективному управлению вашей инфраструктурой.
🎁 Зарегистрируйтесь на вебинар и получите в подарок запись полезного эфира "Ansible: быстрый старт". Это отличная возможность узнать, как использовать Terraform и Ansible для решения ваших задач.
👉 Регистрация открыта: https://vk.cc/cMbq8q
Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2VtzqufWJ12