
Formation Pentaho Data Intégration 4.2
2 journées de formation pour :
- Comprendre les concepts et les cas d'utilisation d'un ETL
- Comprendre l'architecture et le mode de fonctionnement de Kettle
- Appréhender la modélisation de traitements de données avec Kettle
- Déployer vos traitements dans un environnement de production
Le programme de la formation :
Journée 1 :
- ETL: les concepts et les cas d'utilisations
- Présentation de l'architecture et des fonctionnalités de PDI
- Installation et prise en main de Spoon, le client de conception graphique
- Les variables d'environnement pour la contextualisation d'exécution
- Transformations de base: Extraction/Insertion en base de données, Extraction/Alimentation fichier, Lookups, Calculs...
- Filtrage de données & routage de flux
- La gestion des erreurs et des rejets d'intégration
- Les bonnes pratiques de développement avec PDI
Journée 2 :
- Transformations avancées (exemples avec les étapes Javascript, Agrégation Valeurs, Jointure Base...)
- Mise en place de jobs
- Réalisation de traitements itératifs (boucles)
- Utilisation des paramètres et des arguments
- Normalisation/Dénormalisation de données
- Déploiement et planification de jobs en production
- PDI comme outil d'analyse décisionnel ("Agile BI")
- Différences entre la version CE (libre) et EE (payante)
- Traitement de données complexe (regénération de lignes)
Les exercices pratiques :
Nos formations s'appuient sur de nombreux exercices pratiques pour une prise en main parfaite. La formation PDI ne déroge pas à cette règle !
Liste des TPs (*) :
- TP-01 : Installation de PDI & prise en main de Spoon
- TP-02 : Connexion aux bases de données et explorateur de base (DB Explorer)
- TP-03 : Extraction de données depuis un SGBD / Alimentation d'un fichier XLS
- TP-04 : Extraction de données dans 3 cibles et le parallélisme dans PDI
- TP-05 : Méthodes de chargement d'une table de SGBD (insert, update, upsert)
- TP-06 : Traitement d'un fichier commandes (calculs & lookups) pour insertion en base
- TP-07 : Gestion des rejets avec l'étape "Filtrage lignes"
- TP-08 : Gestion des rejets avec l'étape "Validation de données"
- TP-09 : Redirection des données d'un flux ("Branchement conditionnel") et tableaux de correspondance
- TP-10 : Utilisation d'arguments dans une requête SQL
- TP-11 : Intégration de fichiers CSV (statistiques unédic de l'emploi pour une région)
- TP-12 : Structure itérative (boucle)
- TP-13 : Agrégation de données & utilisation de l'étape "Javascript"
- TP-14 : Création d'un job avec notification par mail.
- TP-15 : Dénormalisation de données pour génération d'un tableau croisé Excel
- TP-16 : Déclenchement planifié du job via un script "Kitchen"
- TP-17 : Utilisation du plugin "Agile-BI" dans PDI
- TP-18 : Exemple de traitement complexe (regénération de lignes avec les méthodes putRow, createRowCopy...)
(*) Liste susceptible d'être modifiée en fonction de critères pédagogiques
"Easy" pour Facile : le cours est adapté aux resp. informatiques, chefs de projets, développeurs qui souhaitent appréhender de façon concrète l'outil, au travers d'exemples simples et concrets
"Quick" pour Rapide : une seule journée est nécessaire pour être autonome sur l'outil et maîtriser l'ensemble des concepts et fonctionnalités principales
"Start" pour Démarrer: A l'issue de cette journée, vous aurez l'autonomie suffisante pour commencer vos propres intégration au sein de votre SI