std.club: INSTEAD клуб

Reply to: xWpxsslldKXrjpYlLQ4Z
From: Difrex (dynamic,1) 28.08.19 10:46 UTC
To: Andrew Lobanov
Subject: Re: А то, что так тихо...
Так, я вернулся с лекции Столмена, теперь могу ответить сразу и тебе и Виктору :).
По поводу того, чем мониторить. Самый легкий вариант -- это Prometheus+Alertmanager.
Самый простой сетап для получения системных метрик: поднимаешь node exporter(он собирает все с линукса), прометеем собираешь метрики с него, по определенным условиям(например, free_memory_mb{host="f.q.d.n"} < 200) отправляется событие в алертменедржер, а у него из коробки есть почта, вебхуки и.т.д. При желание к этому наипростейше прикручивается Grafana, в которой делаешь дашборды с графиками; там тоже есть алертинг, кстати.

Свои метрики предоставлять тоже очень просто, т.к. формат простой и свободный можно писать на чем угодно.
Сама экспортируемая метрика выглядит так:
====
# HELP idec_messages example metric
# TYPE idec_messages gauge
idec_messages{echo="ii.test.14"} 0.0
====

Ну, т.к. это все написано на Go, то к ресурсам не требовательно.

Ссылки:
* Prometheus https://github.com/prometheus/prometheus
* Alertmanager https://github.com/prometheus/alertmanager
* Node exporter https://github.com/prometheus/node_exporter
* Доки https://prometheus.io/docs/introduction/first_step s/

Будут вопросы -- обращайтесь :)
[1771 / 1780]