Tutoriel ELK Stack : Qu'est-ce que Kibana, Logstash & Elasticsearch ?

Qu'est-ce que la pile ELK ?

Le ELK Stack est une collection de trois produits open source : Elasticsearch, Logstash, et Kibana. La pile ELK fournit une journalisation centralisรฉe afin d'identifier les problรจmes avec les serveurs ou les applications. Il vous permet de rechercher tous les journaux en un seul endroit. Il permet รฉgalement de dรฉtecter les problรจmes sur plusieurs serveurs en connectant les journaux pendant une pรฉriode spรฉcifique.

  • E signifie ElasticSearch : utilisรฉ pour stocker les journaux
  • L signifie LogStash : utilisรฉ ร  la fois pour l'expรฉdition ainsi que pour le traitement et le stockage des journaux
  • K signifie Kibana : est-ce un outil de visualisation (une interface Web) hรฉbergรฉe via Nginx ou Apache

ElasticSearch, LogStash et Kibana sont tous dรฉveloppรฉs, gรฉrรฉs et maintenus par la sociรฉtรฉ Elastic.

ELK Stack est conรงu pour permettre aux utilisateurs d'extraire des donnรฉes de n'importe quelle source, dans n'importe quel format, et de rechercher, analyser et visualiser ces donnรฉes en temps rรฉel.

ELK Stack Architecture

Maintenant, dans ce didacticiel sur la pile ELK, nous allons dรฉcouvrir l'architecture ELK :

Voici l'architecture simple de la pile ELK

ELK Stack Architecture
ELK Stack Architecture
  • Journaux Les journaux du serveur qui doivent รชtre analysรฉs sont identifiรฉs
  • Logstash: Collectez les donnรฉes des journaux et des รฉvรฉnements. Il analyse et transforme mรชme les donnรฉes
  • Recherche รฉlastique : Les donnรฉes transformรฉes de Logstash is Stocker, rechercher et indexรฉ.
  • Kibana : Kibana utilise Elasticsearch DB pour explorer, visualiser et partager

Cependant, un composant supplรฉmentaire est nรฉcessaire ou une collecte de donnรฉes appelรฉe Beats. Cela a conduit Elastic ร  renommer ELK en Elastic Stack.

ELK Stack Architecture avec Beats

Lorsque vous traitez de trรจs grandes quantitรฉs de donnรฉes, vous aurez peut-รชtre besoin de Kafka, RabbitMQ pour la mise en mรฉmoire tampon et la rรฉsilience. Pour des raisons de sรฉcuritรฉ, nginx peut รชtre utilisรฉ.

ELK Stack Architecture

Maintenant, dans ce didacticiel sur la pile Elastic, Examinons en profondeur tous ces produits open source :

Qu'est-ce qu'Elasticsearch ?

Elasticsearch est un Base de donnรฉes NoSQL. Il est basรฉ sur le moteur de recherche Lucene et est construit avec les API RESTful. Il offre un dรฉploiement simple, une fiabilitรฉ maximale et une gestion facile. Il propose รฉgalement des requรชtes avancรฉes pour effectuer une analyse dรฉtaillรฉe et stocke toutes les donnรฉes de maniรจre centralisรฉe. Ceci est utile pour effectuer une recherche rapide des documents.

Elasticsearch vous permet รฉgalement de stocker, rechercher et analyser de gros volumes de donnรฉes. Il est principalement utilisรฉ comme moteur sous-jacent pour alimenter les applications qui rรฉpondent aux exigences de recherche. Il a รฉtรฉ adoptรฉ dans les plateformes de moteurs de recherche pour les applications Web et mobiles modernes. Outre une recherche rapide, l'outil propose รฉgalement des analyses complexes et de nombreuses fonctionnalitรฉs avancรฉes.

Fonctionnalitรฉs de la recherche รฉlastique

  • Le serveur de recherche open source est รฉcrit en utilisant Java
  • Utilisรฉ pour indexer tout type de donnรฉes hรฉtรฉrogรจnes
  • Possรจde une interface Web API REST avec sortie JSON
  • Recherche en texte intรฉgral
  • Recherche en temps quasi rรฉel (NRT)
  • Magasin de documents JSON fragmentรฉ et rรฉpliquรฉ, consultable
  • Magasin de documents distribuรฉs sans schรฉma, basรฉ sur REST et JSON
  • Prise en charge multilingue et gรฉolocalisรฉe

Avantages d'Elasticsearch

  • Stockez des donnรฉes sans schรฉma et crรฉez รฉgalement un schรฉma pour vos donnรฉes
  • Manipulez vos donnรฉes enregistrement par enregistrement ร  l'aide des API multi-documents
  • Effectuez le filtrage et l'interrogation de vos donnรฉes pour obtenir des informations
  • Basรฉ sur Apache Lucene et fournit une API RESTful
  • Fournit une รฉvolutivitรฉ horizontale, une fiabilitรฉ et une capacitรฉ multi-tenant pour une utilisation en temps rรฉel de l'indexation afin d'accรฉlรฉrer la recherche.
  • Vous aide ร  รฉvoluer verticalement et horizontalement

Termes importants utilisรฉs dans Elastic Search

Maintenant, dans ce didacticiel ELK, dรฉcouvrons les termes clรฉs utilisรฉs dans ElasticSearch :

Long Utilisation
Cluster Un cluster est un ensemble de nล“uds qui contiennent ensemble des donnรฉes et fournissent des capacitรฉs d'indexation et de recherche conjointes.
Nล“ud Un nล“ud est une instance elasticsearch. Il est crรฉรฉ au dรฉmarrage d'une instance elasticsearch.
Sommaire Un index est un ensemble de documents prรฉsentant des caractรฉristiques similaires. par exemple, donnรฉes client, catalogue de produits. Il est trรจs utile lors des opรฉrations dโ€™indexation, de recherche, de mise ร  jour et de suppression. Il vous permet de dรฉfinir autant d'index dans un seul cluster.
Documents C'est l'unitรฉ d'information de base qui peut รชtre indexรฉe. Il est exprimรฉ en paire JSON (clรฉ : valeur). '{"utilisateur": "nullcon"}'. Chaque document est associรฉ ร  un type et ร  un identifiant unique.
Tesson Chaque index peut รชtre divisรฉ en plusieurs fragments pour pouvoir distribuer les donnรฉes. Le fragment est la partie atomique d'un index, qui peut รชtre distribuรฉe sur le cluster si vous souhaitez ajouter plus de nล“uds.

Qu'est-ce que le Logstash?

Logstash est l'outil de pipeline de collecte de donnรฉes. Il collecte les donnรฉes entrรฉes et les alimente dans Elasticsearch. Il rassemble tous les types de donnรฉes provenant de diffรฉrentes sources et les rend disponibles pour une utilisation ultรฉrieure.

Logstash peut unifier les donnรฉes provenant de sources disparates et normaliser les donnรฉes dans les destinations souhaitรฉes. Il vous permet de nettoyer et de dรฉmocratiser toutes vos donnรฉes ร  des fins d'analyse et de visualisation des cas d'utilisation.

Il se compose de trois รฉlรฉments :

  • Entrรฉe : transmission des journaux pour les traiter dans un format comprรฉhensible par la machine
  • Filtres: C'est un ensemble de conditions pour effectuer une action ou un รฉvรฉnement particulier
  • Sortie : Dรฉcideur pour l'รฉvรฉnement ou le journal traitรฉ

Caractรฉristiques Logstash

Maintenant, dans ce didacticiel LogStash, dรฉcouvrons les fonctionnalitรฉs de LogStash :

  • Les รฉvรฉnements sont transmis ร  chaque phase ร  l'aide de files d'attente internes
  • Permet diffรฉrentes entrรฉes pour vos journaux
  • Filtrage/analyse de vos journaux

Avantage de Logstash

  • Les offres centralisent le traitement des donnรฉes
  • Il analyse une grande variรฉtรฉ de donnรฉes et d'รฉvรฉnements structurรฉs/non structurรฉs
  • ELK LogStash propose des plugins pour se connecter ร  diffรฉrents types de sources d'entrรฉe et de plates-formes

Quโ€™est-ce que Kibana ?

Kibana est une visualisation de donnรฉes qui complรจte la stack ELK. Cet outil est utilisรฉ pour visualiser les documents Elasticsearch et aide les dรฉveloppeurs ร  en avoir un aperรงu rapide. Le tableau de bord Kibana propose divers diagrammes interactifs, donnรฉes gรฉospatiales et graphiques pour visualiser des requรชtes complexes.

Il peut รชtre utilisรฉ pour rechercher, afficher et interagir avec les donnรฉes stockรฉes dans les rรฉpertoires Elasticsearch. Kibana vous aide ร  effectuer des tรขches avancรฉes l'analyse des donnรฉes et visualisez vos donnรฉes dans une variรฉtรฉ de tableaux, de graphiques et de cartes.

Dans Kibana, il existe diffรฉrentes mรฉthodes pour effectuer des recherches sur vos donnรฉes.

Voici les types de recherche les plus courants :

Type de recherche Utilisation
Recherches de texte libre Il est utilisรฉ pour rechercher une chaรฎne spรฉcifique
Recherches au niveau du champ Il est utilisรฉ pour rechercher une chaรฎne dans un champ spรฉcifique
Dรฉclarations logiques Il est utilisรฉ pour combiner les recherches dans une instruction logique.
Recherches de proximitรฉ Il est utilisรฉ pour rechercher des termes ร  proximitรฉ de caractรจres spรฉcifiques.

Maintenant, dans ce didacticiel Kibana, dรฉcouvrons les fonctionnalitรฉs importantes de Kibana :

Caractรฉristiques du Kinbana :

  • Puissant tableau de bord frontal capable de visualiser les informations indexรฉes du cluster รฉlastique
  • Permet la recherche en temps rรฉel d'informations indexรฉes
  • Vous pouvez rechercher, afficher et interagir avec les donnรฉes stockรฉes dans Elasticsearch
  • Exรฉcutez des requรชtes sur les donnรฉes et visualisez les rรฉsultats dans des graphiques, des tableaux et des cartes
  • Tableau de bord configurable pour dรฉcouper et dรฉcouper les journaux logstash dans elasticsearch
  • Capable de fournir des donnรฉes historiques sous forme de graphiques, de diagrammes, etc.
  • Des tableaux de bord en temps rรฉel facilement configurables
  • Kibana ElasticSearch permet la recherche en temps rรฉel d'informations indexรฉes

Avantages et inconvรฉnients du Kinbana

  • Visualisation facile
  • Entiรจrement intรฉgrรฉ ร  Elasticsearch
  • Outil de visualisation
  • Offre des capacitรฉs d'analyse, de crรฉation de graphiques, de rรฉsumรฉ et de dรฉbogage en temps rรฉel
  • Fournit une interface instinctive et conviviale
  • Permet le partage d'instantanรฉs des journaux recherchรฉs
  • Permet de sauvegarder le tableau de bord et de gรฉrer plusieurs tableaux de bord

Pourquoi l'analyse des journaux ?

Dans les infrastructures dโ€™environnement basรฉes sur le cloud, les performances et lโ€™isolation sont trรจs importantes. Les performances des machines virtuelles dans le cloud peuvent varier en fonction des charges spรฉcifiques, des environnements et du nombre d'utilisateurs actifs dans le systรจme. Par consรฉquent, la fiabilitรฉ et la dรฉfaillance des nล“uds peuvent devenir un problรจme important.

Plateforme de gestion des journaux peut surveiller tous les problรจmes ci-dessus ainsi que traiter les journaux du systรจme d'exploitation, NGINX, le journal du serveur IIS pour l'analyse du trafic Web, les journaux d'application et les journaux sur AWS (Amazon services Web).

La gestion des journaux aide les ingรฉnieurs DevOps et les administrateurs systรจme ร  prendre de meilleures dรฉcisions commerciales. Par consรฉquent, l'analyse des journaux via Elastic Stack ou des outils similaires est importante.

ELK contre Splunk

Wapiti Splunk
Elk est un outil open source Splunk est un outil commercial.
La pile Elk n'offre pas Solaris Portabilitรฉ grรขce ร  Kibana. Offres Splunk Solaris Portabilitรฉ.
La vitesse de traitement est strictement limitรฉe. Offre des processus prรฉcis et rapides.
ELK est une pile technologique crรฉรฉe avec la combinaison Elastic Search-Logstash-Kibana. Splunk est un outil propriรฉtaire. Il fournit des solutions sur site et dans le cloud.
Dans la recherche ELK, l'analyse et la visualisation ne seront possibles qu'une fois la pile ELK configurรฉe. Splunk est un package complet de gestion de donnรฉes ร  votre disposition.
L'outil ELK ne prend pas en charge l'intรฉgration avec d'autres outils. Splunk est un outil utile pour configurer des intรฉgrations avec d'autres outils.

ร‰tudes de cas

Netflix

Netflix s'appuie fortement sur la pile ELK. L'entreprise utilise la pile ELK pour surveiller et analyser le journal de sรฉcuritรฉ des opรฉrations du service client. Il leur permet d'indexer, de stocker et de rechercher des documents provenant de plus de quinze clusters comprenant prรจs de 800 nล“uds.

LinkedIn

Le cรฉlรจbre site de marketing sur les rรฉseaux sociaux LinkedIn utilise la pile ELK pour surveiller les performances et la sรฉcuritรฉ. L'รฉquipe informatique a intรฉgrรฉ ELK ร  Kafka pour prendre en charge sa charge en temps rรฉel. Leur opรฉration ELK comprend plus de 100 clusters rรฉpartis dans six centres de donnรฉes diffรฉrents.

Tripwire

Tripwire est un systรจme mondial de gestion des รฉvรฉnements d'informations de sรฉcuritรฉ. La sociรฉtรฉ utilise ELK pour prendre en charge l'analyse des journaux de paquets d'informations.

Moyenne

Medium est une cรฉlรจbre plateforme de publication de blogs. Ils utilisent la pile ELK pour dรฉboguer leurs problรจmes de production. L'entreprise utilise รฉgalement ELK pour dรฉtecter DynamoDB des fondues. De plus, grรขce ร  cette pile, l'entreprise peut prendre en charge 25 millions de lecteurs uniques ainsi que des milliers de publications publiรฉes chaque semaine.

Avantages et inconvรฉnients de la pile ELK

Avantages

  • ELK fonctionne mieux lorsque les journaux de diverses applications d'une entreprise convergent vers une seule instance ELK
  • Il fournit des informations รฉtonnantes sur cette instance unique et รฉlimine รฉgalement le besoin de se connecter ร  des centaines de sources de donnรฉes de journaux diffรฉrentes.
  • Installation rapide sur site
  • Facile ร  dรฉployer ร‰chelle verticale et horizontale
  • Elastic propose une multitude de clients linguistiques, dont Ruby. Python. PHP, Perl, .NET, Java et JavaScรฉnario et plus
  • Disponibilitรฉ de bibliothรจques pour diffรฉrents langages de programmation et de script

Dรฉsavantages

  • Diffรฉrents composants dans la pile peuvent devenir difficiles ร  gรฉrer lorsque vous passez ร  une configuration complexe
  • Il n'y a rien de tel que les essais et les erreurs. Ainsi, plus vous en faites, plus vous apprenez en cours de route.

Rรฉsumรฉ

  • La journalisation centralisรฉe peut รชtre utile lorsque vous tentez d'identifier des problรจmes avec des serveurs ou des applications
  • La pile de serveur ELK est utile pour rรฉsoudre les problรจmes liรฉs au systรจme de journalisation centralisรฉ
  • La pile ELK est une collection de trois outils open source Elasticsearch, Logstash Kibana
  • Elasticsearch est une base de donnรฉes NoSQL
  • Logstash est l'outil de pipeline de collecte de donnรฉes
  • Kibana est une visualisation de donnรฉes qui complรจte la stack ELK
  • Dans les infrastructures d'environnement basรฉes sur le cloud, les performances et l'isolation sont trรจs importantes
  • Dans la pile ELK, la vitesse de traitement est strictement limitรฉe alors que Splunk offre des processus prรฉcis et rapides
  • Netflix, LinkedIn, Tripware et Medium utilisent tous la pile ELK pour leur entreprise
  • ELK Syslog fonctionne mieux lorsque les journaux de diverses applications d'une entreprise convergent vers une seule instance ELK
  • Diffรฉrents composants dans la pile peuvent devenir difficiles ร  gรฉrer lorsque vous passez ร  une configuration complexe

Rรฉfรฉrez-vous ร  notre Questions et rรฉponses d'entretien avec ElasticSearch pour les candidats les plus rรฉcents et les plus expรฉrimentรฉs.

Rรฉsumez cet article avec :