IBM InfoSphere DataStage Essentials
DataStage est constitué de plusieurs composants Client et Serveur:
Il s'agit d'une boîte à outils pour concevoir, développer et exécuter des applications
qui remplissent une ou plusieurs tables d'un DataWarehouse ou d'un DataMart.
Code |
Titre |
Durée |
Prix HT |
KM204G |
IBM InfoSphere DataStage Essentials |
4 jours |
Nous consulter |
Objectifs
- Installation guidée
- Console Web permettant la configuration de Datastage
- Designer permettant la création, édition, exécution des travaux avec une interface graphique
- Director permettant le contrôle des travaux d’un projet
- Administrator permettant la gestion des projets Datastage
- Possibilité de travailler en séquentiel ou parallèle
|
Public
chefs de projet souhaitant disposer d’un outil ETL performant et complet
ou d’intégration de données imposants impliquant beaucoup de personnes
|
Pré-requis
- Bonnes connaissances de l'utilisation du système d'exploitation Windows
- Être familier avec les techniques d'accès aux bases de données
|
Post-Formation
|
Méthodes
Alternance rapide de points de cours et d'exercices appliqués. |
Programme
Introduction à DataStage
- Lister et décrire les utilisations de DataStage
- Lister et décrire les clients DataStage
- Décrire le Workflow DataStage
- Décrire les deux types de parallélisme possibles avec les tâches en parallèle dans DataStage
Déploiement
- Identifier les composants de Information Server qui doivent être installés
- Décrire en quoi consiste un déploiement
- Décrire les différentes options de déploiement du domaine
- Décrire le processus d’installation
- Démarrer Information Server
Administration DataStage
- Ouvrir la console Web
- Créer des nouveaux utilisateurs et des groupes
- Assigner des rôles
- Suite et composant aux utilisateurs et aux groupes
- Donner les accès DataStage aux utilisateurs
- Connexion à DataStage en tant qu’administrateur
- Ajouter un utilisateur DataStage dans l’onglet Permission et spécifier le rôle de l’utilisateur
- Spécifier les projets par défaut
- Lister et décrire les variables d’environnement importantes
Travailler avec les métadonnées
- Connexion à DataStage
- Se déplacer dans DataStage Designer
- Importer et exporter les objets DataStage dans un fichier
- Importer une définition de table pour un fichier séquentiel
Créer des tâches parallèles
- Concevoir des tâches parallèles dans DataStage
- Définir le paramètre de la tâche
- Utiliser Row Generator, Peek et Annotation dans une tâche
- Compiler les tâches
- Activer les tâches
- Surveiller les journaux des tâches
- Créer un jeu de paramètres et l’utiliser dans une tâche
Accéder aux données séquentielles
- Comprendre les étapes pour accéder aux différents types de fichiers de données
- Lire et écrire des séquences de fichiers via Sequential File Stage
- Lire et écrire des fichiers d’ensemble de données via les étapes DataStage
- Créer des liens de rejet
- Travailler avec les valeurs NULL dans les fichiers séquentiels
- Lire des fichiers séquentiels multiples via des modèles de fichiers
- Utiliser des lecteurs multiples
Partitionner et collecter
- Décrire l’architecture du processus parallèle
- Décrire le pipeline et la partition du parallélisme
- Lister et décrire le partitionnement et les algorithmes de rassemblage
- Décrire les fichiers de configuration
- Décrire le processus de compilation des tâches parallèles
- Expliquer OSH
Combiner les données
- Combiner les données via les étapes Lookup
- Définir les "range lookups"
- Combiner les données via la fusion
- Combiner les données via la jointure
- Combiner les données via Funnel
Étape de traitement de groupe
- Trier les données
- Combiner l’étape d’agrégation
- Combiner les données et supprimer les doublons
Étape de la transformation
- Utilise l’étape de transformation dans les tâches parallèles
- Définir les contraintes
- Définir les dérivations
- Utiliser les variables
- Créer un jeu de paramètres et utiliser ses paramètres dans les contraintes et les dérivations
Fonctions Repository
- Améliorer la recherche simple
- Améliorer la recherche avancée
- Améliorer l’analyse d’impact
- Comparer les différences entre deux définitions de table
- Comparer les différences entre deux tâches
Travailler avec des données relationnelles
- Importer les définitions de tables pour les tables relationnelles
- Créer les connexions de données
- Utiliser ODBC et le connecteur DB2 dans une tâche
- Utiliser SQL Builder pour définir SQL SELECT et INSERT
- Utiliser les liens d’entrée multiples dans le connecteur pour mettre à jour les tables multiples dans une transaction simple
- Créer des liens de rejets à partir du Connecteur pour capturer les lignes avec les erreurs SQL
Contrôler les tâches
- Utiliser le séquenceur de tâches DataStage pour créer une tâche qui contrôle une séquence de tâches
- Utiliser les liens du séquenceur et les étapes pour contrôler la séquence d’un jeu de tâches
- Utiliser les déclencheurs et les étapes pour contrôler les conditions selon lesquelles les tâches sont activées
- Transmettre des informations dans les paramètres des tâches à partir du master de contrôle des tâches
- Prise en main des erreurs et des exceptions
|
Environnement
Windows |
Mot-clés
IBM InfoSphere DataStage |
Commander
Formafast
Rue du Lac Windermere, Byzance Center, Bloc A - 1053 Les Berges du Lac - Tunisie
Tel: (+216) 31 400 501
Fax: (+216) 32 400 501
Mobile: (+216) 55 666 600
E-mail: contact@formafast.com