Prometheus (logiciel)
Prometheus est un logiciel libre de surveillance informatique et générateur d'alertes. Il enregistre des métriques en temps réel dans une base de données de séries temporelles (avec une capacité d'acquisition élevée) en se basant sur le contenu de point d'entrée exposé à l'aide du protocole HTTP. Ces métriques peuvent ensuite être interrogées à l'aide d'un langage de requête simple (PromQL) et peuvent également servir à générer des alertes. Le projet est écrit en Go et est disponible sous licence Apache 2. Le code source est disponible sur GitHub[2], et est un projet maintenu par la Cloud Native Computing Foundation à côté d'autres projets comme Kubernetes et Envoy[3].
Pour les articles homonymes, voir Prometheus.
Première version | |
---|---|
Dernière version | 2.27.1 ()[1] |
Dépôt | github.com/prometheus/prometheus |
Assurance qualité | Intégration continue |
Écrit en | Go |
Système d'exploitation | Linux, NetBSD, OpenBSD, FreeBSD, Microsoft Windows, Darwin et DragonFly BSD |
Environnement | X86_64, IA-32 (en), architecture MIPS, PowerPC et architecture ARM |
Type |
Application de supervision (d) Time series database (en) Linux Foundation Project (d) |
Licence | Licence Apache version 2.0 |
Documentation | prometheus.io/docs/introduction/overview |
Site web | prometheus.io |
Prometheus a été développé chez SoundCloud à partir de 2012[4], lorsque la société s'est rendu compte que ses solutions de surveillance (StatsD et Graphite) n'étaient pas adaptées à leurs besoins. Prometheus a donc été conçu pour répondre à ces problèmes : disposer d'une base de données multidimensionnelle, un outil simple à faire fonctionner, un mécanisme de collecte simple et évolutif et un langage de requête puissant, le tout dans un seul outil[5]. Le code source du projet a été dès le départ livré sous une licence libre. Cette caractéristique a aidé à une adoption rapide notamment par Boxever et Docker. Bien qu'il n'ait pas été explicitement annoncé[6].[pas clair] Prometheus s'est inspiré de l'outil de surveillance Borgmon utilisé par Google[7],[8].
Depuis 2013, Prometheus est utilisé pour la surveillance de la production chez SoundCloud[5].
En , Prometheus a été le second projet incubé au sein de la Cloud Native Computing Foundation après Kubernetes. Le blog annonçant cette nouvelle indiquait que l'outil était utilisé dans de nombreuses entreprises, notamment Digital Ocean, Ericsson, CoreOS, Weaveworks, Red Hat et Google[9].
La version 1 de Prometheus est sortie en [10]. La version 2 est sortie en [11].
En , la Cloud Native Computing Foundation annonçait que Prometheus était utilisable en production[3].
Architecture
Une installation typique de Prometheus est composée de plusieurs briques : [réf. nécessaire]
- Plusieurs agents (exporteurs) qui s'exécutent généralement sur les machines à surveiller et vont exposer les métriques de suivi.
- Prometheus pour la centralisation et le stockage des métriques.
- Alertmanager[12] qui déclenche l'émission d'alertes en fonction de règles.
- Grafana pour la restitution des métriques sous la forme de tableaux de bord.
- PromQL est le langage de requête utilisé pour créer des tableaux de bord et la création d'alertes.
Format de stockage des données
Les données Prometheus sont stockées sous la forme de métriques. Chaque métrique dispose d'un nom ainsi que d'un ensemble d'étiquettes prenant la forme de paire clé = valeur. Chaque métrique peut être sélectionnée en fonction de ces étiquettes. Ces étiquettes incluent des informations sur l'origine de la métrique (agent, adresse du serveur) ainsi que d'un ensemble d'informations spécifiques à l'application (code HTTP, méthode de requête), le point de terminaison, etc. La possibilité de spécifier une liste arbitraire d'étiquettes et d'interroger en fonction de celles-ci en temps réel explique pourquoi le modèle de données de Prometheus est appelé multidimensionnel[13],[5],[6].
Prometheus stocke les données localement sur disque. Cette technique permet d'optimiser le stockage rapide et la restitution[5]. Prometheus permet également de stocker des métriques sur des serveurs distants (notamment pour de l'archivage longue durée)[14].
Collecte de données
Prometheus collecte des données sous forme de séries temporelles. Les séries temporelles sont récupérées de manière active : le serveur Prometheus interroge une liste de sources de données (les exporteurs) à une fréquence d'interrogation spécifique. Ces points de collecte servent de sources de données à Prometheus. Le serveur dispose également de mécanismes de découverte automatique des ressources à surveiller[15].
PromQL
Prometheus dispose de son propre langage de requête PromQL (Prometheus Query Language). Ce langage permet aux utilisateurs de sélectionner et d'agréger les métriques stockées en base de données. Il est particulièrement adapté aux fonctionnements avec une base de données de séries temporelles en fournissant de nombreuses fonctionnalités spécifiques à la manipulation du temps (décalage de temps, calcul de moyenne, maximum etc.). Prometheus supporte quatre types de métriques :
- Jauge (température absolue, quantité d'espace disque consommé)
- Compteur (nombre de requêtes depuis le lancement d'un programme)
- Histogramme (échantillonnage d'un nombre de requêtes dans plusieurs containers afin de calculer des quantiles)
- Sommaire (relativement similaire à la notion d'histogramme avec des notions supplémentaires)
Alertes et surveillance
La configuration des alertes se configure depuis Prometheus à l'aide de conditions se basant sur une expression au format PromQL ainsi qu'une durée de temps permettant de caractériser le temps nécessaire pour déclencher une alerte. Lorsque les alertes se déclenchent, elles sont transmises au service d'alerte (Alertmanager). Ce dernier se charge de réaliser un certain nombre d'opérations d'agrégation, désactivation et temporisation de ces alertes avant de les transmettre par différents moyens (messagerie électronique, notification Slack ou SMS)[16].
Tableaux de bord
Prometheus n'est pas conçu pour faire de la restitution d'informations sous la forme de tableau de bord bien qu'il dispose d'une solution pour le faire. Une bonne pratique est de faire appel à un outil comme Grafana même si cette solution a comme inconvénient de rendre l'installation du système de surveillance plus complexe[17].
L'interopérabilité
Prometheus utilise une surveillance dite en boîte blanche. Les applications sont encouragées à exposer leurs métriques internes (à l'aide d'un exporteur) afin que Prometheus puisse les collecter à intervalle régulier[18]. Dans le cas où l'application (ou composant) ne pourrait pas le faire directement (base de données, surveillance serveurs), de nombreux exporteurs ou agents prêt à l'emploi existent pour remplir ce rôle[19]. Certains exporteurs permettent également de gérer la communication avec certains outils de surveillance (Graphite, StatsD, SNMP, JMX et CollectD) afin de simplifier la transition vers Prometheus le temps de la migration.
Prometheus se concentre sur la disponibilité de la plateforme et les opérations de base[20]. Les métriques sont généralement stockées pendant quelques semaines. Pour un stockage sur une longue durée, il est conseillé de se tourner vers des solutions de stockage plus adaptées[14].
Normalisation de OpenMetrics
Le format d'exposition des métriques des exporteurs Prometheus a fait l'objet d'une standardisation sous le nom d'OpenMetrics afin de pouvoir être réutilisé ailleurs[21]. Certains produits ont adopté ce format comme par exemple la suite TICK d'InfluxData[22], InfluxDB, Google Cloud Platform[23], et DataDog[24].
Utilisation
Prometheus a été utilisé pour la première fois en interne chez SoundCloud, où il a été développé, pour surveiller leurs systèmes[5]. La Cloud Native Computing Foundation a un certain nombre d'études de cas d'autres sociétés utilisant Prometheus. On retrouve par exemple la société Digital Ocean[25], le festival numérique DreamHack[26] et le service de migration de messagerie et de contact ShuttleCloud[27]. Par ailleurs, Pandora Radio a mentionné l'utilisation de Prometheus pour surveiller son pipeline de données[28].
GitLab fournit un guide d'intégration Prometheus pour exporter les métriques GitLab vers Prometheus[29]. Ce mécanisme est actif par défaut depuis la version 9.0[30]
Références
- « Release 2.27.1 », (consulté le )
- « Prometheus » (consulté le )
- Evans, « Cloud Native Computing Foundation Announces Prometheus Graduation », (consulté le )
- Brian Brazil, Prometheus: Up & Running: Infrastructure and Application Performance Monitoring, O'Reilly Media, (ISBN 978-1-4920-3409-4, lire en ligne), p. 3
- Volz et Rabenstein, « Prometheus: Monitoring at SoundCloud », SoundCloud
- « Monitor Docker Containers with Prometheus », 5π Consulting,
- Niall Murphy, Betsy Beyer, Chris Jones et Jennifer Petoff, Site Reliability Engineering:How Google Runs Production Systems, O'Reilly Media, (ISBN 978-1491929124, lire en ligne) :
« Even though Borgmon remains internal to Google, the idea of treating time-series data as a data source for generating alerts is now accessible to everyone through those open source tools like Prometheus ... »
- Volz, « PromCon 2017: Conference Recap », sur YouTube, : « I joined SoundCloud back in 2012 coming from Google...we didn't yet have any monitoring tools that that works with this kind of dynamic environment. We were kind of missing the way Google did its monitoring for its own internal cluster scheduler and we were very inspired by that and finally decided to build our own open-source solution. »
- « Cloud Native Computing Foundation Accepts Prometheus as Second Hosted Project », Cloud Native Computing Foundation, (consulté le )
- « Prometheus 1.0 Is Here », Cloud Native Computing Foundation, (consulté le )
- « New Features in Prometheus 2.0.0 », Robust Perception, (consulté le )
- (en) « Prometheus/alertmanager », sur GitHub (consulté le ).
- « Data model », Prometheus (consulté le )
- « Integrations - Prometheus », prometheus.io
- « Prometheus: Collects metrics, provides alerting and graphs web UI », (consulté le )
- Dubey, « AlertManager Integration with Prometheus », (consulté le )
- Ryckbosch, « Prometheus monitoring: Pros and cons », (consulté le )
- Prometheus, « Instrumentation - Prometheus », prometheus.io
- « Exporters », prometheus.io
- Prometheus, « Prometheus - Monitoring system & time series database », prometheus.io
- « OpenMetrics », GitHub,
- « Telegraf from InfluxData »,
- « Announcing Stackdriver Kubernetes Monitoring »
- « DataDogHQ »
- Evans, « Prometheus User Profile: How DigitalOcean Uses Prometheus », Cloud Native Computing Foundation, (consulté le )
- Evans, « Prometheus User Profile: Monitoring the World's Largest Digital Festival – DreamHack », Cloud Native Computing Foundation, (consulté le )
- Evans, « Prometheus User Profile: ShuttleCloud Explains Why Prometheus Is Good for Your Small Startup », Cloud Native Computing Foundation, (consulté le )
- Haidrey, « Apache Airflow at Pandora », Engineering at Pandora, (consulté le )
- « GitLab Prometheus metrics » (consulté le )
- « GitLab 9.0 released with Subgroups and Deploy Boards », GitLab,
Lectures complémentaires
- McKendrick Russ, Monitoring Docker : monitor your Docker containers and their apps using various native and third-party tools with the help of this exclusive guide!, Birmingham, UK, (ISBN 9781785885501, OCLC 933610431)
- HECK JOSEPH., KUBERNETES FOR DEVELOPERS use kubernetes to develop, test, and deploy your applications with the help of containers;use kubernetes to develop, [S.l.], PACKT PUBLISHING, (ISBN 978-1788830607, OCLC 1031909876)
- Burns, Brendan 1976-, Designing distributed systems : patterns and paradigms for scalable, reliable services, Sebastopol, CA, First, (ISBN 9781491983614, OCLC 1023861580)
- Helmich Martin., Cloud Native programming with Golang Develop microservice-based high performance web apps for the cloud with Go, Birmingham, Packt Publishing, (ISBN 9781787127968, OCLC 1020029257)
- Shrivastwa Alok, Hybrid cloud for architects : build robust hybrid cloud solutions using AWS and OpenStack, Birmingham, UK, (ISBN 9781788627986, OCLC 1028641698)
- Chanwit Kaewkasi, Native Docker Clustering with Swarm, (ISBN 978-1786469755)
- Portail des logiciels libres