devopslibrary | Unsorted

Telegram-канал devopslibrary - DevOps&SRE Library

17344

Библиотека статей по теме DevOps и SRE. Реклама: @ostinostin Контент: @mxssl РКН: https://knd.gov.ru/license?id=67704b536aa9672b963777b3®istryType=bloggersPermission

Subscribe to a channel

DevOps&SRE Library

k8sGPT — ваш ИИ-ассистент для Kubernetes — CLI-утилита, которая помогает диагностировать проблемы в Kubernetes.

Полезна и при онбординге, и в проде: показывает ошибки ресурсов, объясняет, почему они возникли, и предлагает возможные шаги.
Особенно помогает тем, кто ещё не выучил все тонкости CrashLoopBackOff и ImagePullBackOff.

Узнайте, как внедрить утилиту в свой workflow →

Читать полностью…

DevOps&SRE Library

In defence of deployment freezes

Many organizations have periods when they restrict deployments to production. You may find yourself working for one, so it's best to be prepared for it, and protect yourself from the downsides.


https://thefridaydeploy.substack.com/p/in-defence-of-deployment-freezes

Читать полностью…

DevOps&SRE Library

Is There A Purpose In Assigning Incident Severity?

https://uptimelabs.io/is-there-a-purpose-in-assigning-incident-severity

Читать полностью…

DevOps&SRE Library

lnk

Git-native dotfiles management that doesn't suck.

Move your dotfiles to ~/.config/lnk, symlink them back, and use Git like normal. Supports both common configurations and host-specific setups.


https://github.com/yarlson/lnk

Читать полностью…

DevOps&SRE Library

f2

F2 is a cross-platform command-line tool for batch renaming files and directories quickly and safely. Written in Go!


https://github.com/ayoisaiah/f2

Читать полностью…

DevOps&SRE Library

Как мы в облаке MWS строим сети в Kubernetes и раздаём одинаковые IP на разные ВМ

🔗Читайте новые статьи в хабе DevCloud от MWS на Хабр:
про Multus CNI и multi-homed поды
про DHCP-сервер облака и раздачу IP в VRF

Рассказываем, как развиваем overlay-сеть платформы собственной разработки:

почему Multus + Cilium — must-have для multi-homed подов
как устроен DHCP в мире, где 192.168.0.1 могут быть у сотни клиентов
зачем VPP прокидывает Option 82, и как мы ловили баги

Подпишись на хаб DevCloud от MWS, если интересна внутренняя кухня облаков.

Читать полностью…

DevOps&SRE Library

Standardizing App Delivery with Flux and Generic Helm Charts

In this guide we will explore how Flux can be used to standardize the lifecycle management of applications by leveraging the Generic Helm Chart pattern.

The big promise of this pattern is that it should reduce the cognitive load on developers, as they only need to focus on the service-specific configuration, while the Generic Helm Chart shields them from the complexity of the Kubernetes API.


stefanprodan/standardizing-app-delivery-with-flux-and-generic-helm-charts-f66941f399e9" rel="nofollow">https://medium.com/@stefanprodan/standardizing-app-delivery-with-flux-and-generic-helm-charts-f66941f399e9

Читать полностью…

DevOps&SRE Library

ETCD Production setup with TLS

https://blog.mohsen.co/etcd-production-setup-with-openssl-2b9ecd7e00d5

Читать полностью…

DevOps&SRE Library

Istio-Proxy Chaos in the Middle of a Snowy Morning

December 4th, 2024, started as a peaceful, snowy morning. Around 8 AM, I settled into my work-from-home routine, having freshly brewed coffee. My usual workflow:

1. Check the Production dashboard to ensure everything is running smoothly — and it was.
2. Check my email and Slack to see if any team member needs help.
3. Open JIRA, pick up a task and get ready to dive into work.

There were no pressing issues to address. I opened JIRA and picked up a task to migrate one of our Infrastructures as a Code repository from Terragrunt to Terraform. This is a topic for another post to explain why.

Lucked out! The peace and serenity didn’t last long. An alert popped up: One of our production services had gone down. What started as a calm Wednesday morning quickly turned into a troubleshooting adventure.


zehendiaries/istio-proxy-chaos-in-the-middle-of-a-snowy-morning-6fe437cf3996" rel="nofollow">https://medium.com/@zehendiaries/istio-proxy-chaos-in-the-middle-of-a-snowy-morning-6fe437cf3996

Читать полностью…

DevOps&SRE Library

How It Works — Validating Admission Policy

https://ihcsim.medium.com/how-it-works-validating-admission-policy-0664d23ce230

Читать полностью…

DevOps&SRE Library

Service mesh и API-шлюзы: что выбрать и для чего? Ответ в статье 👇

Вы наверняка не раз слышали эти два термина применительно к микросервисам. Их часто путают, ведь обе технологии обеспечивают стабильное и безопасное взаимодействие. Но какую из них выбрать?

В статье вы узнаете:

👉 Чем отличается service mesh от API-шлюза
👉 Что отвечает за горизонтальный трафик, а что за вертикальный
👉 Когда использовать service mesh, а когда API-шлюз
👉 Что будет, если их объединить.

Забирайте статью в PDF в боте и делитесь с коллегами!

Реклама ООО «Слёрм» ИНН 3652901451

Читать полностью…

DevOps&SRE Library

Taming the Wild West of Research Computing: How Policies Saved Us a Thousand Headaches

Harnessing the power of policy-driven governance in shared computing environments


https://alessandropomponio.medium.com/taming-the-wild-west-of-research-computing-how-policies-saved-us-a-thousand-headaches-9432558f5740

Читать полностью…

DevOps&SRE Library

As a Seasoned K8s Expert: An In-Depth Analysis of the OpenAI’s Incident and Mitigation Strategies

On December 11, 2024, OpenAI experienced a major outage caused by a failure in the Kubernetes cluster control plane. For outsiders, this may simply seem like an interesting incident, but as an insider, I analyzed this failure from a technical perspective.


https://midbai.com/en/post/how-to-avoid-openai-incident

Читать полностью…

DevOps&SRE Library

Как построить overlay-сеть для публичного облака на десятки тысяч виртуалок?

Смотрите 6-ю серию реалити про разработку облака от MWS — Building the Cloud.

Что будет в эфире:
как мы строили control plane для VPC новой публичной платформы
что происходит "под капотом" облака при создании ВМ
как организовали обработку трафика в data plane

И, конечно, розыгрыш мерча от MWS за лучший вопрос.

Интересуетесь сетевыми технологиями и внутренней кухней облаков? Подключайтесь к эфиру.

Зарегистрироваться

Читать полностью…

DevOps&SRE Library

Готовы к карьерному рывку? Станьте DevOps Engineer в команде Телекома YADRO🔥

Хотите создавать надёжные и технологичные процессы для разных продуктовых команд компании? Тогда отправляйте резюме в одно из направлений: Infrastructure или CI/CD.

Что предлагаем
🚀 удалёнка или офис в одном из городов (Москва, СПб, Нижний Новгород, Екатеринбург, Минск)
🚀 возможность влиять на продукт и стать частью большого инженерного сообщества
🚀 возможность вертикального и горизонтального роста — проводим performance review раз в год
🚀 ДМС с первого дня работы, а ещё консультации юристов, психологов, экспертов по ЗОЖ и управлению финансами

Кого ждём в команду
DevOps-инженеров с опытом работы от года и желанием развивать новые продукты в нашей команде

Какие задачи вас ждут
настройка и внедрение систем мониторинга и Observability для продуктов, определение ключевых метрик совместно с командами разработки
разработка с нуля и доработка существующих CI/CD пайплайнов для продуктов и их компонентов в рамках экосистемы Gitlab CI
участие в создании отказоустойчивой инфраструктуры и её дальнейшей поддержке для обеспечения высокой скорости и качества сборки продуктов

Больше подробностей — по ссылке.

📆 Отправляйте резюме до 8 июня и присоединяйтесь к команде YADRO!

Читать полностью…

DevOps&SRE Library

012: The MTTI Manifesto

Mean Time to Isolate


https://www.oldschoolburke.com/the-mtti-manifesto

Читать полностью…

DevOps&SRE Library

А ты справишься с тестом по Kubernetes?

Пройди тест из 15 вопросов, проверь свой уровень знаний и получи скидку на онлайн-курс «Инфраструктурная платформа на основе Kubernetes» от OTUS!

Если успешно пройдешь тест, сможешь забронировать место в группе по выгодной цене! И еще дарим промокод Kuber_06

🔥 Пройти тест и забрать скидку: https://vk.cc/cMxMsr

🎫 Курс можно приобрести в рассрочку

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2VtzqwcP4EH

Читать полностью…

DevOps&SRE Library

Покажем, как создавать Telegram-ботов на сверхскорости

Зачем нужен бот?
📊 Соберет данные и построит отчеты за пару минут
🤖 Правильно переведет сложный текст для зарубежных коллег
🎬 Подберет фильмы по настроению для качественного отдыха

Какого бы помощника вы ни хотели запустить, это можно легко сделать в облаке без настройки серверов и затрат на инфраструктуру.

Облачный провайдер Cloud․ru расскажет на бесплатном вебинаре 5 июня, как создать бота в облаке и какие компоненты для этого нужны.

Будет демо — в прямом эфире эксперт покажет процесс и ответит на вопросы.

Зарегистрироваться на вебинар🖱

Читать полностью…

DevOps&SRE Library

Месяц бесплатного размещения данных в объектном хранилище Selectel

Переносите и храните данные для работы сервисов и их бэкапы, данные аналитики и датасеты для ML в объектное S3 хранилище Selectel. Провайдер обеспечит:

- Надежность и катастрофоустойчивость. Объектное S3 хранилище от Selectel работает на базе дата-центров в Москве и Петербурге - данные можно хранить в бакетах в разных городах для большей надежности.

- Разные классы хранилищ под ваши задачи. Для размещения редко используемых данных выбирайте «холодное» хранилище и экономьте до 30%.

- Бесплатную миграцию. По акции Миграционные каникулы для вас будут бесплатными входящие запросы и целевое хранилище в течение 30 дней с момента подтверждения заявки.

Переносите данные и тестируйте сервис бесплатно по ссылке: https://slc.tl/5xtbr

Реклама. АО «Селектел», ИНН 7810962785, ERID: 2Vtzqv5mGGD

Читать полностью…

DevOps&SRE Library

kubectl-switch

kubectl-switch is a command-line tool for managing and switching between multiple Kubernetes configuration files located in the same directory. It simplifies the process of selecting a Kubernetes context from multiple kubeconfig files and updating the active configuration or namespace.

Just dump all your kubeconfigs into a single dir and let kubectl-switch manage them for you!


https://github.com/mirceanton/kubectl-switch

Читать полностью…

DevOps&SRE Library

khronoscope

Khronoscope is a tool inspired by k9s that allows you to inspect the state of your Kubernetes cluster and travel back in time to see its state at any point since you started the application using VCR like controls.


https://github.com/hoyle1974/khronoscope

Читать полностью…

DevOps&SRE Library

Mastering Compute Efficiency: Dynamic GPU Partitioning Strategies for Kubernetes-Based ML Systems

https://yashmehra2411.medium.com/mastering-gpu-efficiency-dynamic-partitioning-strategies-for-kubernetes-based-ml-systems-75100c94112b

Читать полностью…

DevOps&SRE Library

Demistifying Istio Gateways

arivermar/demistifying-istio-gateways-762d37070431" rel="nofollow">https://medium.com/@arivermar/demistifying-istio-gateways-762d37070431

Читать полностью…

DevOps&SRE Library

⭐️🚀 Хотите прокачаться в работе с Linux? Пора проверить, готовы ли вы к следующему шагу!

Пройдите короткое тестирование и узнайте, готовы ли вы к повышению квалификации на курсе «Administrator Linux. Professional». Мы обучаем продвинутым навыкам администрирования Linux: от установки и настройки ОС до оптимизации работы и управления безопасностью.

🎁 Успешное прохождение вступительного теста — это ваш пропуск к записям открытых уроков и скидке на большое обучение.

❗️Доступ к записям откроется для тех кто успешно пройдет тест. Уроки находятся на лендинге курса.

👉 Оцените свой уровень знаний прямо сейчас: https://vk.cc/cMo91m

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2Vtzqv5U6a9

Читать полностью…

DevOps&SRE Library

Reducing Pod Startup Time for Java Application on EKS

balu8095/reducing-pod-startup-time-for-java-application-on-eks-a4fc80482039" rel="nofollow">https://medium.com/@balu8095/reducing-pod-startup-time-for-java-application-on-eks-a4fc80482039

Читать полностью…

DevOps&SRE Library

We’re leaving Kubernetes

Kubernetes seems like the obvious choice for building out remote, standardized and automated development environments. We thought so too and have spent six years invested in making the most popular cloud development environment platform at internet scale. That’s 1.5 million users, where we regularly see thousands of development environments per day. In that time, we’ve found that Kubernetes is not the right choice for building development environments.


https://www.gitpod.io/blog/we-are-leaving-kubernetes

Читать полностью…

DevOps&SRE Library

🚀 Разгоняем kube-prometheus-stack: секретный ингредиент в Observability

🔥 9 июня в 20:00 мск — бесплатный вебинар «Разгоняем kube-prometheus-stack».
Мониторинг не должен тормозить, особенно когда что-то идёт не так.

Что разберём:

– как ускорить отклик Grafana при работе с большими объёмами данных,
– что замедляет Prometheus и как с этим бороться,
– как сократить сетевой трафик мониторинга без потерь,
– как не положить observability-инфру при инциденте,
– и какие архитектурные подходы помогают сделать мониторинг отказоустойчивым.

Оптимизируйте kube-prometheus-stack и держите руку на пульсе — даже в условиях пиковых нагрузок.

👉 Регистрируйтесь здесь:
https://vk.cc/cMlnQQ

Занятие приурочено к старту курса "Observability: мониторинг, логирование, трейсинг", на котором вы научитесь строить эффективные системы мониторинга, работать с Prometheus, Grafana, ELK и другими инструментами, визуализировать метрики.

Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2VtzqvLMHEm

Читать полностью…

DevOps&SRE Library

What I Really Mean When I Say “Good Communication” in Incident Response

https://uptimelabs.io/good-communication-in-incident-response

Читать полностью…

DevOps&SRE Library

Azure Verified Module - Azure Landing Zones

In this article, we take a look at the Azure Verified Module for Azure Landing Zones, and how we can customise deployments.


P1: https://mikeguy.co.uk/posts/azure-verified-module-landing-zones-part-1

P2: https://mikeguy.co.uk/posts/azure-verified-module-landing-zones-part-2

Читать полностью…

DevOps&SRE Library

Terratags: Enforce Tags on your AWS Terraform configuration

https://dev.to/quixoticmonk/terratags-enforce-tags-on-your-aws-terraform-configuration-1ck5

Читать полностью…
Subscribe to a channel