IBM InfoSphere DataStage Essentials

Partager par email

×

DataStage est constitué de plusieurs composants Client et Serveur: Il s'agit d'une boîte à outils pour concevoir, développer et exécuter des applications qui remplissent une ou plusieurs tables d'un DataWarehouse ou d'un DataMart.

Code Titre Durée Prix HT
KM204G IBM InfoSphere DataStage Essentials 4 jours Nous consulter

Objectifs

  • Installation guidée
  • Console Web permettant la configuration de Datastage
  • Designer permettant la création, édition, exécution des travaux avec une interface graphique
  • Director permettant le contrôle des travaux d’un projet
  • Administrator permettant la gestion des projets Datastage
  • Possibilité de travailler en séquentiel ou parallèle

Public

chefs de projet souhaitant disposer d’un outil ETL performant et complet ou d’intégration de données imposants impliquant beaucoup de personnes

Pré-requis

  • Bonnes connaissances de l'utilisation du système d'exploitation Windows
  • Être familier avec les techniques d'accès aux bases de données

Post-Formation

Méthodes

Alternance rapide de points de cours et d'exercices appliqués.

Programme

Introduction à DataStage

  • Lister et décrire les utilisations de DataStage
  • Lister et décrire les clients DataStage
  • Décrire le Workflow DataStage
  • Décrire les deux types de parallélisme possibles avec les tâches en parallèle dans DataStage

Déploiement

  • Identifier les composants de Information Server qui doivent être installés
  • Décrire en quoi consiste un déploiement
  • Décrire les différentes options de déploiement du domaine
  • Décrire le processus d’installation
  • Démarrer Information Server

Administration DataStage

  • Ouvrir la console Web
  • Créer des nouveaux utilisateurs et des groupes
  • Assigner des rôles
  • Suite et composant aux utilisateurs et aux groupes
  • Donner les accès DataStage aux utilisateurs
  • Connexion à DataStage en tant qu’administrateur
  • Ajouter un utilisateur DataStage dans l’onglet Permission et spécifier le rôle de l’utilisateur
  • Spécifier les projets par défaut
  • Lister et décrire les variables d’environnement importantes

Travailler avec les métadonnées

  • Connexion à DataStage
  • Se déplacer dans DataStage Designer
  • Importer et exporter les objets DataStage dans un fichier
  • Importer une définition de table pour un fichier séquentiel

Créer des tâches parallèles

  • Concevoir des tâches parallèles dans DataStage
  • Définir le paramètre de la tâche
  • Utiliser Row Generator, Peek et Annotation dans une tâche
  • Compiler les tâches
  • Activer les tâches
  • Surveiller les journaux des tâches
  • Créer un jeu de paramètres et l’utiliser dans une tâche

Accéder aux données séquentielles

  • Comprendre les étapes pour accéder aux différents types de fichiers de données
  • Lire et écrire des séquences de fichiers via Sequential File Stage
  • Lire et écrire des fichiers d’ensemble de données via les étapes DataStage
  • Créer des liens de rejet
  • Travailler avec les valeurs NULL dans les fichiers séquentiels
  • Lire des fichiers séquentiels multiples via des modèles de fichiers
  • Utiliser des lecteurs multiples

Partitionner et collecter

  • Décrire l’architecture du processus parallèle
  • Décrire le pipeline et la partition du parallélisme
  • Lister et décrire le partitionnement et les algorithmes de rassemblage
  • Décrire les fichiers de configuration
  • Décrire le processus de compilation des tâches parallèles
  • Expliquer OSH

Combiner les données

  • Combiner les données via les étapes Lookup
  • Définir les "range lookups"
  • Combiner les données via la fusion
  • Combiner les données via la jointure
  • Combiner les données via Funnel

Étape de traitement de groupe

  • Trier les données
  • Combiner l’étape d’agrégation
  • Combiner les données et supprimer les doublons

Étape de la transformation

  • Utilise l’étape de transformation dans les tâches parallèles
  • Définir les contraintes
  • Définir les dérivations
  • Utiliser les variables
  • Créer un jeu de paramètres et utiliser ses paramètres dans les contraintes et les dérivations

Fonctions Repository

  • Améliorer la recherche simple
  • Améliorer la recherche avancée
  • Améliorer l’analyse d’impact
  • Comparer les différences entre deux définitions de table
  • Comparer les différences entre deux tâches

Travailler avec des données relationnelles

  • Importer les définitions de tables pour les tables relationnelles
  • Créer les connexions de données
  • Utiliser ODBC et le connecteur DB2 dans une tâche
  • Utiliser SQL Builder pour définir SQL SELECT et INSERT
  • Utiliser les liens d’entrée multiples dans le connecteur pour mettre à jour les tables multiples dans une transaction simple
  • Créer des liens de rejets à partir du Connecteur pour capturer les lignes avec les erreurs SQL

Contrôler les tâches

  • Utiliser le séquenceur de tâches DataStage pour créer une tâche qui contrôle une séquence de tâches
  • Utiliser les liens du séquenceur et les étapes pour contrôler la séquence d’un jeu de tâches
  • Utiliser les déclencheurs et les étapes pour contrôler les conditions selon lesquelles les tâches sont activées
  • Transmettre des informations dans les paramètres des tâches à partir du master de contrôle des tâches
  • Prise en main des erreurs et des exceptions

Environnement

Windows

Mot-clés

IBM InfoSphere DataStage

Commander