Re,
Comment on gère les alertes?
Maintenant que tout est métrique, on a dev un scheduler distribué (
Metronome sur github ) et on utilise https://functions.ovh/ pour
générer et process l'alerting. L'alerting est un projet à part, as
code, est générique et utilise des backends (Metrics, Logs, MySQL,
custom...). On va le mettre un peu sous pression en interne puis on
le
fera tester sur labs.ovh.com :)
...
créer un système d'alerting custom, cela conforte mon intuition sur
le
fait qu'il n'existe pas encore de solution/projet.
1) Totalement d'accord, ce mail était très clair et super intéressant.
Au passage cela m'a permis aussi de découvrir qu'OVH s'est mis au
Serverless avec Functions (qui n'existe pas encore sur labs). Le
serverless étant pour moi vraiment l'avenir pour beaucoup de startups
qui font des APIs... je serais hébergeur aujourd'hui, j'investirais à
fond là-dessus (avant que tout le monde parte chez AWS).
2) Ma conclusion sur le système d'alerting n'est pas la même... ce que
je retiens c'est que Metronome est un event scheduler (distribué) qui
permet donc de déclencher le lancement des alertes (genre un sms.sh), le
tout basé sur des métriques. Donc tu l'as ton système d'alerting relié à
tes métriques. A priori la partie qu'il faudra dev custom c'est celle du
calendrier d'astreinte... mais ça c'est un problème qui existe dans
nombre de solutions existantes. Le travail ensuite c'est de définir les
bons seuils sur les bonnes métriques, comme on faisait sur un
nagios-like.
Non ?
A+,
--
Philippe Bourcier
web : http://sysctl.org/
blog : https://www.linkedin.com/today/author/philippebourcier
_______________________________________________
Liste de diffusion du FRsAG
http://www.frsag.org/