Elasticsearch

Elasticsearch

Durée : 2 jours

Pré-requis : Expérience en architecture technique et logicielle, notamment en déploiement technique (Kubernetes, Docker,solutions Cloud)

Tarif : 500€ par stagiaire et par jour (min. 3 stagiaires)

JOUR 1

Elasticsearch : introduction

  • Présentation de Elasticsearch et de la stack ELK
  • Historique, cas d'usages pour utilisation
  • Présentation sommaire fonctionnelle : installation, indexation, recherche et aggrégations
  • Stack technique fondamentale et évolutions futures

Fondamentaux : modules et indexes

  • Notions d'index et d'Index Module : usage et architecture fondamentale * Notion de shard / nodes, Index Shard Allocation
  • Principaux modules : Analysis, Mapper, Megre, Similarity Module. Exemples d'implémentation
  • Tri des indexations

Fondamentaux : Mapping

  • Processus de mapping : enjeux, statique versus dynamique,
  • Présentation des types de données principaux et modélisation d'un type de données
  • Gestion des metadatas
  • Mapping de paramètres : principes et applications

Elasticsearch appliqué à l'analyse de texte

  • Principes : Analyzer, indexation, Stemming & Token graphs
  • Analyzers prêts à l'emploi : présentation et exemples (Standard / Pattern / Fingerprint Analyzers)
  • Tokenizer : transformation du texte. Exemple de modélisations. Présentation du n-gram.
  • Filtres de tokens : exemples et applications
  • Filtres de caractères : exemples et application.

Elasticsearch & flux data

  • DataStream : modélisation et exemple simple. Définition et mise à jour d'un dataStream
  • Ingest Nodes : définition et utilisation
  • Définition d'une pipeline de traitement de la donnée
  • Pipelines : accès à la donnée, exécution conditionnelle
  • Enrichissement data : concepts, applications en stack ELK
  • Exemples de processeurs disponibles

JOUR 2

Elasticsearch appliqué à la recherche de données

  • Notions générales de queries et de recherche dans Elastic Search. Options de recherche et filtrage de résultats
  • Recherche à exécution longue et recherche proche temps réel : stratégies et implémentation
  • Recherche multi-clusters ou multi-datastreams

Query DSL : présentation du langage

  • Intérêt du QDSL, cas d'usage
  • Recherches par texte ou par fragment
  • Recherche géo-spatiale
  • Particularités d'appel

Demi journée de tests :

  • Mise en place d'une architecture ELK sur un cas de test
  • Définition de la modélisation globale
  • Exemples appliqués à la fouille textuelle
  • Exemples appliqués à la recherche de données

JOUR 1

Elasticsearch : introduction

  • Présentation de Elasticsearch et de la stack ELK
  • Historique, cas d'usages pour utilisation
  • Présentation sommaire fonctionnelle : installation, indexation, recherche et aggrégations
  • Stack technique fondamentale et évolutions futures

Fondamentaux : modules et indexes

  • Notions d'index et d'Index Module : usage et architecture fondamentale * Notion de shard / nodes, Index Shard Allocation
  • Principaux modules : Analysis, Mapper, Megre, Similarity Module. Exemples d'implémentation
  • Tri des indexations

Fondamentaux : Mapping

  • Processus de mapping : enjeux, statique versus dynamique,
  • Présentation des types de données principaux et modélisation d'un type de données
  • Gestion des metadatas
  • Mapping de paramètres : principes et applications

Elasticsearch appliqué à l'analyse de texte

  • Principes : Analyzer, indexation, Stemming & Token graphs
  • Analyzers prêts à l'emploi : présentation et exemples (Standard / Pattern / Fingerprint Analyzers)
  • Tokenizer : transformation du texte. Exemple de modélisations. Présentation du n-gram.
  • Filtres de tokens : exemples et applications
  • Filtres de caractères : exemples et application.

Elasticsearch & flux data

  • DataStream : modélisation et exemple simple. Définition et mise à jour d'un dataStream
  • Ingest Nodes : définition et utilisation
  • Définition d'une pipeline de traitement de la donnée
  • Pipelines : accès à la donnée, exécution conditionnelle
  • Enrichissement data : concepts, applications en stack ELK
  • Exemples de processeurs disponibles

JOUR 2

Elasticsearch appliqué à la recherche de données

  • Notions générales de queries et de recherche dans Elastic Search. Options de recherche et filtrage de résultats
  • Recherche à exécution longue et recherche proche temps réel : stratégies et implémentation
  • Recherche multi-clusters ou multi-datastreams

Query DSL : présentation du langage

  • Intérêt du QDSL, cas d'usage
  • Recherches par texte ou par fragment
  • Recherche géo-spatiale
  • Particularités d'appel

Demi journée de tests :

  • Mise en place d'une architecture ELK sur un cas de test
  • Définition de la modélisation globale
  • Exemples appliqués à la fouille textuelle
  • Exemples appliqués à la recherche de données