Introduction
Historique des entrepôts de données
Quels enjeux au sein des DSI d’aujourd’hui ?
Définition actuelle du data warehouse
Les grands principes
Concepts de bases : data warehouse, infocentre, datamart, datamining
Fonctions des différentes composantes du SID (Système d’informations décisionnel)
Architectures classiques
Architecture technique et architecture fonctionnelle
Composantes de l’architecture d’un data warehouse :
Stratification du data warehouse
Les solutions ETL en amont du data warehouse et les processus de gestion des flux
L’Operational Data Store (ODS)
La Data Staging Area et son apport durant le processus d’ETL
OLAP : moteurs d’analyse relationnel (ROLAP) et multidimensionnel (MOLAP)
L’analyse OLAP : outils coté serveur et coté client
La nécessité d’un référentiel de données
Le rôle du Master Data Management (MDM)
La conception du data warehouse
Les modèles dénormalisés : modèles relationnels et modèles opérationnels
Les modèles normalisés : modèle en flocon et modèle en étoile
L’apport de la normalisation
Gérer les agrégats
Conserver la stabilité du périmètre fonctionnel défini en amont
Bonnes pratiques de modélisation
Garder une vision transversale du projet : l’interview des métiers
Les prérequis au projet décisionnel
Définir le périmètre fonctionnel et la volumétrie du projet
Identification des besoins utilisateurs
Planifier un projet Data Warehouse
Les critères de réussite de la démarche
Les justifications métiers et financières
Les acteurs et leur rôle : promoteur, comité de pilotage, équipe fonctionnelle, équipe technique.
Planification du projet, identification des KPI et tableaux de suivi
Les méthodes de conduites de projet
Techniques de base
Les principales étapes
Méthodologie Kimball : l’approche bottom-up
Méthodologie Inmonn : l’approche top-down
Méthodologie Agile et data warehouse
Approche itérative du projet
Rôle de la maîtrise d’ouvrage (MOA) et de la maîtrise d’œuvre (MOE)
Administrer et maîtriser la solution opérationnelle
L’implémentation
Implémentation de la base de données
Outils de restitution (reporting) et leur mise en oeuvre
Les méthodes de datamining : méthodes prédictives et méthodes descriptives.
Les enjeux de la croissance du volume des données : les solutions Big Data
Les impacts sur la méthodologie d’implémentation
Maintenir et faire évoluer son SID
Méthode d’évolution : évolution fonctionnelle ou réglementaire, nouveau développement
Maintenance du SID : le cycle de maintenance corrective
Conclusion
Rappel des points importants et recommandations
Panorama des solutions de reporting
Panorama des solutions de Data Mining
Panorama des solutions d’ETL
Bibliographie utile sur le sujet