vendredi 14 janvier 2011

Initiation Talend - 2° Partie : Tables et requêtes

La 2° étape consiste à importer dans le référentiel Talend la descriptions des tables (tout ou partie) de la base de données.
Faites clic-droit sur la connexion que vous venez de créer puis Récupérer le schéma
Le premier écran permet de filtrer les objets de la base de données que vous voulez importer, en fonction de leur type (tables, vues, synonymes) ou de leur nom (avec le caractère générique « % »).
Le second écran affiche les objets correspondant aux filtres et permet de les sélectionner.
Le dernier écran permet de consulter la description de chaque objet et éventuellement de le mettre à jour si sa structure a changé.

Les structures des tables ou vues de la base de données sont stockées dans le référentiel Talend sous la forme de schémas. Ces schémas seront utilisés par la suite par les composants. Ils sont disponibles dans le référentiel en développant l'arborescence DB Connections / "Votre base de données" / Schémas des tables.

Un schéma est en fait constitué d'une liste de colonnes avec leur type, qui permet à Talend de gérer ces données en mémoire et d'effectuer la correspondance des types de données entre composants.
De la même manière que les tables ont été importées dans le référentiel de Talend, il est possible d'y stocker des requêtes plus ou moins complexes qui seront utilisées par les composants.

Pour créer un schéma lié à une requête dans le référentiel, faites clic-droit sur votre connexion base de données puis Editer les requêtes.

Cette action démarre l'outil SQL Builder, un petit éditeur de requêtes SQL.

Cet outil est constitué de 4 parties :
  • en haut à gauche : la structure de la base de données : elle présente la liste des tables et de leurs colonnes
  • en haut à droite : un petit éditeur permettant de construire graphiquement la requête ou de taper le code SQL
  • en bas à gauche : le résultat de la requête
  • en bas à droite : la description des colonnes de la table sélectionnée dans la 1° partie, ainsi qu'une prévisualisation des données de cette table

Vous pouvez éditer le code SQL de la requête en cliquant sur l'onglet Editer, dans la partie en haut à droite.

Une fois votre requête terminée, cliquez sur l'icône de la disquette sur la barre d'icônes de l'éditeur graphique puis saisissez le nom de votre requête. Elle apparaît alors dans la liste des requêtes de votre connexion BD.
Le schéma de cette requête pourra être utilisé dans un composant Talend.


L'article suivant sera consacré au référencement des sources de données de type Fichier dans le référentiel de Talend.
A l'issue de ce 3° article, nous pourrons démarrer la construction du job proprement dit.