Chapitre introductif
Importance du rôle de l’informatique décisionnelle en entreprise
Evolution et état de l’art de la modélisation décisionnelle face aux attentes des entreprises
Des infocentres à l’informatique décisionnelle
Concept de SIAD (Système informatisé d’aide à la décision) et EIS (système d’information d’entreprise)
Data warehouse et exigences en termes d’informatique décisionnelle
Architecture et composantes du datawarehouse : datamarts et ODS
Différentes approches selon Bill Imon et Ralph Kimball
Le modèle de données en étoile au sein de l’architecture du datawarehouse
Evolution du datawarehouse au cours de son cycle de vie
Evaluer la qualité de conception d’un datawarehouse
Rôle analytique des métadonnées dans le datawarehouse
Fonction du référentiel de données
Vue d’ensemble de la modélisation en étoile
Principes de modélisation des bases OLTP (dites opérationnelles)
Distinction entre base de données opérationnelle et d’analyse
Représentation d’entités
Notion d’attribut
Notion de cardinalité
Les formes normales
Notion de dénormalisation
Notion de faits (ou mesures)
Notion de dimensions (axe d’analyse)
Variantes du modèle en étoile : modèle en flocon et modèle en constellation
Bonnes pratiques et recommandations
La modélisation en étoile en pratique
Techniques d’acquisition de l’information et d’analyse des besoins (interviews)
Analyse des processus métiers
Détermination des axes d’analyse
Modéliser des hiérarchies
Définition des mesures
Croisement de dimensions et intérêt dans l’analyse
Analyser la granularité d’un modèle
Définir des règles d’agrégation
Panorama des outils de modélisation
Optimiser son modèle en étoile
Prendre en compte l’évolution des référentiels et des nomenclatures
Gérer les dimensions à évolution lente
Gérer les dimensions à évolution rapide
Clé naturelle et clé de substitution
Contrôler et maintenir la fiabilité des données
Gestion des inconnues
Notion de dimension dégénérée
Ecriture de requêtes performantes
Gestion de l’espace disque requis et de la taille d’une dimension
Modèle de données et contexte du projet
Prise en compte des acteurs
Intégrer la notion de livrable
Définition des exigences
Priorisation des actions et identification du périmètre d’action
Du recueil de l’information à la modélisation
Déployer son modèle de données
Maintenance du modèle
Gérer les données historiques
Agréger des données directement dans une table
Assurer le suivi des différents faits
Gestion de l’alimentation du modèle
Gérer les contraintes imposées par les systèmes opérationnels source
Centralisation des données avec l’ODS
Notion de data staging area dans le cadre du processus ETL
Alimentation par delta, alimentation complète et compte-rendu de stock
Les étapes de la mise en place de l’alimentation
Bonnes pratiques et recommandations
Gestion des rejets lors de l’alimentation
Gestion de différentes sources d’alimentation
Panorama des solutions ETL
La restitution des données
Panorama des outils de restitution
Créer un modèle optimal pour explorer ses données
Optimisation des index
Améliorer ses performances grâce au partitionnement des tables