Библиотека статей по теме DevOps и SRE. Реклама: @ostinostin Контент: @mxssl РКН: https://knd.gov.ru/license?id=67704b536aa9672b963777b3®istryType=bloggersPermission
mdq
like jq but for Markdown: find specific elements in a md doc
tailpipe
Tailpipe is the lightweight, developer-friendly way to query logs.
Cloud logs, SQL insights. Collects logs from cloud, container and application sources. Query and analyze your data instantly with the power of SQL, right from your terminal.
Fast, local, and efficient. Runs locally, powered by DuckDB's in-memory analytics and Parquet's optimized storage.
An ecosystem of prebuilt intelligence. MITRE ATT&CK-aligned queries, prebuilt detections, benchmarks, and dashboards, all open source and community-driven.
Built to build with. Define detections as code, extend functionality with plugins and write custom SQL queries.
Nping
Nping is a Ping tool developed in Rust. It supports concurrent Ping for multiple addresses, visual chart display, real-time data updates, and other features.
pgwatch
PGWATCH: PostgreSQL metrics monitor/dashboard
🚀Открыта вакансия C++ Software Engineer в YADRO: получите оффер за 3 дня
Если вы давно хотели работать в технологической компании с амбициозными задачами, то скорее подавайте заявку на сайте.
YADRO запускает SPRINT OFFER для инженеров-разработчиков C++, готовых прокачаться в команде Telecom Platform. Здесь вы будете:
✔️ Разрабатывать платформенные решения для мобильных сетей LTE/GSM
✔️ Разрабатывать компоненты телеком-платформы в технологическом стеке С++/Linux
✔️ Участвовать в проектировании и развитии архитектуры телеком-платформы
Как попасть в команду?
1️⃣ Оставить заявку до 9 марта
2️⃣ Пройти скрининг и техническое интервью
3️⃣ Получить оффер всего за 3 дня
📍 Формат работы: офис, гибрид или удалёнка (Москва, СПб, Нижний Новгород, Екатеринбург, Минск).
💡 В команде — инженеры с опытом 10–25 лет, у которых есть чему научиться!
Готовы к карьерному рывку?
Подавайте заявку сейчас — по ссылке.
В прошлый раз было управление спейсами Tarantool со стороны пользователя, в этот раз углубляемся внутрь и разбираемся как устроен движок Vinyl
.
🦧 Поверхностное представление о том, что Vinyl
работает с диском не дает полного понимания механизмов заложенных внутри для обслуживания кластера.
🤯 Оказывается здесь не классическое B-tree
как в реляционных СУБД типа InnoDB
в MySQL или Postgress, а LSM-tree
со всеми вытекающими. В документации по Vinyl
есть исчерпывающее объяснение разницы, но ...
Меня интересовали концептуальные механизмы с точки зрения администратора этой СУБД, поэтому в статье разберем:
🧐 Что такое Vinyl
🗂 Из чего состоит файловая структура спейса на Vinyl
🖼 Визуализируем хранилище Vinyl
(это пирамида)
📥 Посмотрим как данные перемещаются по пирамиде
🛠 Определим как управлять габаритами пирамиды и на что они влияют
🎡 Какие фоновые процессы обслуживают движок Vinyl
💣 Как работа Vinyl
влияет на систему
🪣 Как очистить дерево от старых версий и удаленных кортежей и вообще почему есть в этом необходимость
Детали в статье: https://byurrer.ru/tarantool-vinyl
P. S. если есть непонятки или я что-то упустил - пишите в комментариях ⬇️
⚡️Современные распределённые системы генерируют огромные объёмы данных, а эффективный мониторинг становится залогом стабильной работы. Как построить систему, способную выдерживать большие нагрузки, обрабатывать миллионы метрик в секунду и мгновенно реагировать на аномалии?
🔥11 марта в 20.00 мск приглашаем на открытый урок "Проектирование высоконагруженного мониторинга в распределенных системах", на котором разберем:
- лучшие инструменты для сбора и хранения метрик (Prometheus, VictoriaMetrics, Mimir, Thanos и др.);
- методы оптимизации: федерация, шардинг, агрегация, сэмплирование;
- как минимизировать нагрузку и сократить расходы на хранение данных;
- практические кейсы внедрения в highload-проектах.
👉Регистрация https://vk.cc/cJnsHZ
Занятие приурочено к старту курса "Observability: мониторинг, логирование, трейсинг", на котором вы научитесь строить эффективные системы мониторинга, работать с Prometheus, Grafana, ELK и другими инструментами, визуализировать метрики.
Реклама. ООО «Отус онлайн-образование», ОГРН 1177746618576, erid: 2VtzqxDdebY
Получи доступ к полезной базе знаний для девопса
DevOps-инженер, который умеет управлять кластерами в Kubernetes, всегда ценится больше. Yandex Cloud открыл свободный доступ к своей базе знаний с полезными материалами для инженеров.
Из них вы узнаете, как автоматизировать процессы, развертывать и масштабировать кластеры на примере DevOps-сервиса от Yandex Cloud.
Все материалы останутся у вас навсегда, а изучать их можно в свободном темпе. Теорию подготовили эксперты Yandex Cloud с большим опытом работы в IT-индустрии, а практика состоит из 60 заданий.
Подробнее о базе знаний — по ссылке.
GMonit приглашает на технический вебинар
🗓 Когда: 13 марта, 17:00 (Мск)
🔗 Регистрация по ссылке
О чем поговорим:
1️⃣ Как работают head-based и tail-based сэмплирование — плюсы и подводные камни.
2️⃣ Какие алгоритмы помогают снижать нагрузку на инфраструктуру.
3️⃣ Когда оптимизация данных экономит деньги, а когда — создает проблемы.
В финале — разбор реальных сценариев и демонстрация сэмплирования в GMonit + QA-сессия.
Если ваши системы генерируют тонны логов, метрик и трейсинга — этот вебинар поможет держать их под контролем. 😉
Реклама. ООО "Хайперсофтлаб", ИНН: 9705151703, erid: 2Vtzqw3TDcz
Organizing Terraform Code for Scalability and Maintainability
Managing Infrastructure as Code (IaC) at scale is fundamentally different from handling a handful of resources. While getting started with Terraform/OpenTofu is relatively straightforward, maintaining large-scale infrastructure deployments introduces challenges that can’t be solved by simply writing more code. Code organization becomes a critical factor in whether your infrastructure remains manageable or devolves into a maintenance nightmare.
kubectl-view-secret
Kubernetes CLI plugin to decode Kubernetes secrets
cyphernetes
A Kubernetes Query Language
MetalLB and KinD: Loads Balanced Locally
When You Need LoadBalancer Services On The Go, MetalLB and KinD Are There For You
Using SimKube 1.0: Comparing Kubernetes Cluster Autoscaler and Karpenter
https://blog.appliedcomputing.io/p/using-simkube-10-comparing-kubernetes
From Chaos to Harmony: A Deep Dive into Centralizing Kubernetes Controller Upgrades
https://medium.com/transmit-security-engineering/from-chaos-to-harmony-a-deep-dive-into-centralizing-controller-upgrades-dd57deb1cbec
Алгоритмы, кодогенерация и куда идёт Go: строим платформу для разработчиков
В новом выпуске подкаста «Расскажите про MWS» обсуждаем как работает команда, которая создает базовую инфраструктуру для разработчиков облака. Дмитрий Новиков — TechLead команды Development Platform в MWS рассказывает:
— Зачем команда пишет собственный кодогенератор
— Нужны ли задачи про алгоритмы на собеседованиях
— В каком направлении развивается Go и есть ли повод для беспокойства
Смотрите и слушайте на всех популярных площадках:
🎬 YouTube
🎬 VK Видео
🎧 Яндекс Музыка
🎧 Apple Podcasts
🎧 Mave Digital
kvm
JetKVM is a high-performance, open-source KVM over IP (Keyboard, Video, Mouse) solution designed for efficient remote management of computers, servers, and workstations. Whether you're dealing with boot failures, installing a new operating system, adjusting BIOS settings, or simply taking control of a machine from afar, JetKVM provides the tools to get it done effectively.
Postgres in the time of monster hardware
I don't know if you followed the release of the last generation of CPUs. AMD's latest Genoa CPU (AMD EPYC™ 9965) can run 768 threads. It has 192 cores per socket and 2 threads per core, with 2 sockets. Imagine adding 10 TB of RAM to such a beast! Of course, everyone will think of how useful it will be for virtualization. As a database person, I'd rather ask myself what Postgres could do with so many resources. I love simplicity in architecture. But I often meet customers with huge resource needs. With average hosts nowadays, the best answer for them is sometimes multi-parallel processing (MPP).
So, with this new hardware, can we stop using horizontal scalability? To understand the impact of running PostgreSQL on it, we must examine a few technical limits. The analysis will begin with NUMA (Non-Uniform Memory Access) architecture. Next, we will address I/O bandwidth limits. They are a big factor, no matter the CPU or memory. Next, we will look at how PostgreSQL behaves with many connections. This topic has historical limits that bring up key questions. Finally, we will test parallel queries. We will examine their scalability and effectiveness on systems with many CPU threads.
feluda
🔎 Feluda is a Rust-based command-line tool that analyzes the dependencies of a project, notes down their licenses, and flags any permissions that restrict personal or commercial usage.
Product management is broken. Engineers can fix it
How we've redefined the PM and engineer relationship
httptap
View the HTTP and HTTPS requests made by any linux program by running httptap -- <command>.
terraform-module-releaser
Simplify the management of Terraform modules in your monorepo with this GitHub Action, designed to automate module-specific versioning and releases. By streamlining the Terraform module release process, this action allows you to manage multiple modules in a single repository while still maintaining independence and flexibility. Additionally, it generates a beautifully crafted wiki for each module, complete with readme information, usage examples, Terraform-docs details, and a full changelog.
Can I TF
As time passes, OpenTofu and Terraform become more distant from each other. CanI.TF helps us to understand their differences quickly.
AWS PrivateLink Cross-Region Connectivity
AWS PrivateLink provides a secure method for sharing and accessing services across VPCs and accounts. It ensures that all traffic remains within the AWS network, avoiding exposure to the public internet. Before December 2024, both service providers and consumers were required to be in the same AWS Region. With the launch of native cross-region connectivity for AWS PrivateLink, you can now share and access VPC endpoint services across different Regions.
Kubernetes Garbage Collector
https://zvlb.github.io/blog/kubernetes-garbage-collector
Устал от легаси в инфраструктуре? Попробуй разные стеки!
Ищем middle DevOps-инженера, готового расширять свой стек. В KTS мы работаем с разнообразными технологиями, в облачной и on-premise-инфраструктуре, над проектами разной степени технической зрелости.
Пример нашей задачи: спроектировать план бесшовного переезда из on-premise-инфраструктуры в Yandex Cloud и провести его без даунтайма.
Готов решать такие задачи? Пиши нашему эйчару и присылай своё резюме!
Реклама. ООО "Студия КТС", ИНН: 7733257480, erid: 2Vtzqubaqw4
awesome-cloud-native
A curated list for awesome cloud native tools, software and tutorials.
Service Probes
https://medium.com/draftkings-engineering/service-probes-905a19104085
A major update on the ingress controller: Migrating to the new nginx-ingress controller
https://medium.com/adidoescode/major-update-on-the-ingress-controller-84cbf448e89c
subtrace
Subtrace is Wireshark for your Docker containers. It lets developers see all incoming and outgoing requests in their backend server so that they can resolve production issues faster.