jeudi, septembre 22, 2005

Dimensions - Différents types


Les types de dimensions

Dimension dégénérée (Degenerate dimension)
http://kimballgroup.com/html/designtipsPDF/DesignTips2003/KimballDT46AnotherLook.pdf

La dimension dégénérée est une clé de dimension dans la table de fait qui est en général sans attribut. Par exemple No de bon de commande, No d’interruption de service, etc. Dans le cas de numéro de l’interruption de service, les utilisateurs veulent savoir par exemple « combien de fois un client a été interrompu dans une période de temps précise».

Vu qu’il s’agit d’une seule clé de dimension, nous évitons alors de créer une table de dimension, ce qui fait que cette table de dimension a dégénéré dans la table de fait, c’est pour cette raison que cette clé est appelée « dimension dégénérée »

Dimension causale (Causal dimension)

Il s’agit d’une dimension qui provoque des faits. Un bon exemple de ce genre de dimension est la dimension « Promotion » qui en général peut provoquer des ventes. Un autre exemple dans le domaine de la distribution de l’énergie la dimension « Condition climatique » peut provoquer des « interruptions de service ». La dimension « Condition climatique » est donc une dimension causale.

Dimension conforme (Conformed dimension)

On parle de dimension conforme ou partagée lorsque la dimension est utilisée par les faits de plus qu’un data mart. L’exemple le plus courant est la dimension « Produit » qui est utilisée par différents data mart «Finance », « Marketing »…

Junk dimension
La dimension de genre « Junk dimension » est une dimension qui contient toutes sorte de flags, statuts, codes qui ne font partie d’aucune dimension régulière. Dans le domaine de la distribution de l’énergie, une interruption de service peut être de type « Basse tension » ou « Moyenne tension ». Ce genre de code est donc stocké dans une table spéciale appelée « Junk dimension ».

Dimension à évolution lente (Slowly changing dimension)
Une dimension peut subir des changements de description des membres
• Un client peut changer d’adresse, se marier, ...
• Un produit peut changer de noms, de formulations « Tree ’s » en « M&M », « Raider » en « Twix »,« Yaourt à la vanille en Yaourt » en « saveur Vanille »

Nous gérons la situation en choisissant entre 3 solutions
• Écrasement de l’ancienne valeur
• Versionnement
• Valeur d’origine / valeur courante

Dans certain cas la transition n’est pas immédiate : il reste pendant un certain temps des anciens produits en rayon il est alors conseillé de les traiter comme deux membres différents.

Dimension à évolution rapide (Rapid changing dimension)
Une dimension à changement rapide est une dimension qui subit des changements très fréquents des attributs dont on veut préserver l’historique. Par exemple si l’on veut préserver l’historique des changements d’adresse dans la dimension client dans un pays ou 70% de la population déménage une fois par année (le premier juillet par exemple au canada), la dimension client devient dans ce cas une dimension à évolution rapide. L’évolution

Mini dimension
Dans tout entrepôt de données il existe au moins une grande dimension, que ce soit en terme d’enregistrements ou d’attributs. L’exemple le plus fréquent est la dimension « client » qui peut contenir des millions d’enregistrements. Le plus souvent on gère l’évolution lente (Voir même l’évolution rapide) sur ce genre de dimension ce qui augmente encore plus leur taille. Un moyen de réduire la taille de ce genre de dimension est soit de recourir à la technique de « flocon de neige » si la dimension est hiérarchique (Chaque niveau hiérarchique dans une table différente). Un autre moyen plus élégant est de créer une mini dimension, qui contient tous les attributs sur lesquels on gère l’évolution lente. Prenons un exemple pour mieux éclaircir la notion de mini dimension :

La dimension client d'un système de distribution d'énergie contient plusieurs millions d’enregistrements, dont les attributs sont :
ID client « L’identifiant du client, surrogate key ou la clé insignifiante »
Code du client « La clé d’affaire du client, provenant du système source »
Nom du client.
Adresse du client.
Le transformateur associé. « Le transformateur électrique qui alimente le client ».
Code incidence « Le code d’incidence du client : Ma pour Majeur, Mo pour Moyen, Mi pour mineur, Ge pour Grande Entreprise ».


Supposons que pour des besoins d’affaires, les utilisateurs décident de préserver l’historique des changements des attributs suivants, « Le transformateur associé » et « Le code d’incidence ». Nous créons donc une mini dimension qui contient les colonnes suivantes :
ID SCD Client
Le transformateur associé
Code d’incidence
Et dans la dimension client nous ajoutons une nouvelle clé de dimension « ID SCD client » pour faire le lien entre la dimension client et la mini-dimension « SCD Client ».

Il faut bien noter que la dimension client continue de contenir tous les attributs même ceux sur lesquels nous gérons l’évolution lente.

Copyright © Abdel ELOMARI 2005-2006 . Tous droits réservés.

Aucun commentaire: