vendredi 21 janvier 2011

Initiation Talend - 3° Partie : Référentiel : Fichiers

Dans les articles précédents, nous avons vu comment :
Il est quelquefois utile d'aller chercher des données dans des fichiers, principalement des fichiers excel, qui restent encore beaucoup utilisés dans nos entreprises.
Dans l'arborescence Métadonnées, faites clic-droit sur l'entrée Fichier Excel puis Créer un fichier Excel.

Dans le premier écran, saisissez le nom que vous voulez attribuer au schéma

Dans le 2° écran, cliquez sur le bouton Parcourir... pour définir l'emplacement du fichier
Talend étudie le contenu du fichier et affiche les feuilles présentes et les données présentes dans chaque feuille.
Vous devez alors choisir la feuille qui vous intéresse et passer à l'étape suivante

Dans le 3° écran, si votre tableau excel contient des en-têtes de colonnes, cochez la case Utiliser la première ligne comme libellés de colonnes puis cliquez sur le bouton Rafraîchir l'aperçu.
Si votre tableau ne contient pas d'en-têtes de colonnes, vous pourrez définir le nom des colonnes à l'étape suivante.

Sur le dernier écran, vous pouvez modifier le schéma : noms des colonnes, types de données, …
Par exemple, modifiez le type de la colonne code_postal de Integer en String
N'oubliez pas de modifier le nom du schéma à cette étape : il se nomme « metadata » par défaut


Il est également possible de décrire un schéma sans faire référence à un fichier modèle mais en spécifiant tout simplement ses colonnes.
Créons par exemple un schéma de fichier texte, au format CSV, qui sera utilisé plus tard comme fichier cible d'une extraction de données :
  • Faites clic-droit sur Fichier délimité puis Créer un fichier délimité
  • Donnez un nom à ce nouveau type de fichier puis cliquez sur Suivant
  • Cliquez à nouveau sur Suivant sans choisir de fichier
  • Laissez les options par défaut et cliquez encore une fois sur Suivant
  • Le dernier écran permet de créer manuellement les colonnes du schéma
    Cliquez sur l'icône « + » puis saisissez le nom, le type, la longueur, …

Voilà, tout est prêt pour créer notre job avec efficacité.

Dans le prochain article, nous allons enfin démarrer la création du job et constater la puissance du composant tMap.