samedi, septembre 24, 2005

Choix d'outil ETL




Choix d’outil ETL ( Suites ETL)


Avant de commencer à réaliser des preuves de concepts il est conseillé de faire des choix préliminaires.

Choix préliminaires :Une fois que vous avez décidé d’acheter une suite ETL, une question se pose rapidement, parmi cette panoplie d'outils, lequel choisir ?. Actuellement il existe plusieurs fournisseurs de suite ETL

Dans le domaine professionnel avant d’acheter un outil surtout quand celui-ci est dispendieux on procède à des preuves de concept. Cependant il est quasiment impossible de faire des preuves de concept de toutes les suites ETL disponibles sur le marché. On procède alors à un choix préliminaire de telle façon à garder deux ou trois suite ETL à tester . ce choix préliminaire est en général basé sur les critères suivants ;

La catégorie de l’outil :
Actuellement il existe trois catégories d’outils ETL :
  1. Engine-based : les transaformations sont executées sur un serveur ETL, disposant en général d’un referentiel. Ce genre de d’outil dispose d’un moteur de transformation ;
  2. Database-embedded : les transformations sont intégrées dans la BD ;
  3. Code-generators : les transformations sont conçues et un code est généré. Ce code est déployabe indépendemment de la base de données.
Sachant que le type de l’outil a un impact direct sur l’architecture technique ( Matérielle et logicielle) et les ressources humaines necessaire à la réalisation du projet, il est donc bon d’être conscient de ces trois types d’outil ETL, et décider quelle type répond le plus aux besoins.
Le coût (ou encore le ROI)
Le coût ne concerne pas seulement la suite en soit ( Le logiciel), mais cela prend aussi en compte les coûts des ressources humaines et matérielles. Les suites les plus complètes disposent d’un moteur qui roule sur des serveurs assez puissant ( coût du serveur) , et dont le referentiel (pour le code et pour le métadata) est stocké dans une base de données et de préférence une bonne base de données ( coût de la base de données, Oracle, DB2, SqlServer), et en plus si l’on veux le connecter avec d’autres couches applicatifs disons non-standards, il faudra aussi payer pour le connecteur. Par ailleurs les ressources humaines présentent des charges assez importantes, j’explique cela en détail un peu plus loin dans l’étude. Il faut aussi que l’outil permet un bon ROI au niveau de la productivité, la qualité des données (Une bonne décision) et la disponibilité de l’information (Une décision à temps).
La nature et l’envergure du projet ETL.
Par ailleurs si le projet est d’une bonne envergure, étalé sur plusieurs mois et en plusieurs étapes, une solution ETL s’impose. Cependant si le projet ETL est complexe, il faudra envisager d’acheter une suite ETL assez complète comme Informatica, Data Stage ou Data Integrator ou encore DecisionStream... Par contre si le projet est du type « Straight-forward » une solution comme OWB ou Sunopsis peut suffire.
La culture analytique de l’entreprise
De plus en plus il existe une sorte de fidélité et de solide partenariat entre les entreprises et les fournisseurs de solutions BI et ETL. Par exemple il y’a des entreprises qui disposent de Business Objects comme solution BI, il est donc logique d’acheter Data integrator comme outil ETL. La même chose pour Cognos, Oracle...

Ce que disent les expertsUn autre moyen à utiliser lorsque l’on désire effectuer le choix d’un outil ETL est de se renseigner et de disposer du maximum d’informations concernant :
- La situation financière du fournisseur;
- sa stratégie : on voudra pas acheter le produit d’un fournisseur qui risque de faire faillite dans 6 mois;
- sa stratégie à l’égard de la suite ETL de l’entreprise : on ne vaudra pas acheter une suite ETL si le fournisseur risque de délaisser ce produit parcequ’il ne fait plus partie de sa stratégie d’affaire;
- Le nombre de ces clients;
- Le nombre de ces employés;
- Le support dans votre pays;
- En plus les critères d’ordre technique (Extracteurs, transformateurs et chargeurs).

Dans le but d’avoir toutes ces informations, nous conseillons de faire des recherches sur Internet, dans les revues spécialisées...Concernant l’internet le groupe Gartner est incontournable dans le milieu.

Gartner :Gartner produit ce qu’on appelle les quadrants magiques des ETL (au moins deux fois par année). Le premier de l’année 2005 est comme suit :

A vous de décider !

JDNET :
JDNET en Aout 2002 avait produit une petite étude des différentes solutions ETL. Je n’irais pas jusqu’à dire que l’étude est comparative. Par contre cette étude à le mérite de mettre en évidence le positionnement de chacune des solutions ETL. Voici le lien :
http://solutions.journaldunet.com/0208/020827_bi_panorama1.shtml
L’expertise
C’est l’aspect qu’il ne faut surtout pas négliger, certains outils disposent déjà d’une grande maturité ( mais en général coûte plus chèr) , il est donc plus facile de trouver des ressources qui peuvent développer voire même gérer un projet ETL. Par contre certains outils, même s’ils présentent un bon potentiel et un bon ratio qualité/prix, il est difficile de trouver des ressources expertes !
Les preuves de concepts
Aprés avoir effectué les choix préliminaires, il faut absolument passer des preuves de concepts à chacune des suites choisies.

Pour faire des bonnes preuves de concepts nous pouvons utiliser les deux outils suivants :

Le guide comparatif :
Un bon outil à utiliser lors des preuves de concepts est le guide suivant. L’avantage de cet outil est d’être écrit en français et qu’il prend en considération et dans le détail différents aspects techniques des systèmes ETL.

http://www.guidescomparatifs.com/guides/iso_album/guide_etl_-_avril2004.pdf

Exemple d’utilisation : J’avais à choisir entre OWB et DecisionStream de cognos. Ayant travaillé avec OWB, je n’avais pas besoin de preuve de concept. Par contre nous avons fait venir un technicien Cognos pour la preuve de concept de Cognos DecisionStream. J’ai alors utilisé le guide comparatif, et on a finalement opté pour DecisionStream. [A vrai dire la culture de l’entreprise favorisait l’achat de décision Stream]

Le guide des acheteurs ETL :
Ce guide, crée par TDWI (The Data Warehouse Institute), est sous forme d’une matrice de comparaison des différents choix ETL selon plusieurs perspectives et sous différents angles. Cette matrice est à remplir lors des preuves de concepts des outils.

L’avantage de cette matrice est de prendre en considération plusieurs critères concernant le fournisseur ETL , à savoir sa situation financière, La stratégie de l’entreprise (On voudra pas acheter le produit d’une société qui risque de faire faillite dans 6 mois), la stratégie ETL de l’entreprise ( On ne vaudra pas acheter une suite ETL si la compagnie risque de délaisser ce produit parcequ’il ne fait plus partie de sa stratégie d’affaire) , le nombre de clients, le nombre d’employés... En plus des critères d’ordre technique (Extracteurs, transformateurs et chargeurs).

Ce guide comparatif est en anglais seulement !
http://www.tdwi.org/files/pub/tdwi/ETL%20Matrix.xls
A vous de jouer !
Copyright © Abdel ELOMARI 2005-2006 . Tous droits réservés.

1 commentaire:

Anonyme a dit...

pourquoi pas:)