<aside> 📌 Платформа Observability помогает нашим пользователям легко и быстро получить однозначный ответ о состоянии своих систем в любой момент времени.

</aside>

С приходом микросервисов, архитектура даже простых систем стала гораздо более распределенной. Чтобы понимать, что происходит в конкретный момент времени с сервисом, нужны подходящие инструменты, такие как:

И список на них не заканчивается, это первые 3 кирпичика, которые образуют фундамент платформы Observability.

Немного цифр

<aside> 🔥 Мониторинг

</aside>

<aside> 🔥 Трейсы

<aside> 🔥 Логи

Что входит в платформу

📊 Monitoring


Monitoring— сервис для мониторинга инфраструктуры и приложений. Он обрабатывает 1.2 миллиарда точек на запись и 500 миллионов точек — на чтение ежесекундно, рассчитывает 10 миллионов алертов. Такие объёмы требуют решения сложных задач по масштабированию и отказоустойчивости.

Мониторинг активно развивается — им пользуется практически все команды Яндекса и внешние пользователи сервисов. Также, в скором времени Мониторинг станет drop-in replacement Prometheus, что позволит пользователям не думать о запуске собственных средств мониторинга. Само собой, что в такой системе нужно решать не только задачи простых чтения и записи данных, но и более сложные вещи, вроде работы с большим количеством уникальных таймсерий или хитрого service-discovery в пределах Облака.