Introduction à la formation Big Data Etat de l’art
Présentation générale et objectifs de cette formation Big Data
Retour sur les concepts de donnée, information et connaissance
Qu’est-ce que le Big Data, l’Analytics, la Data Science ? Définitions, historique et enjeux
Concepts fondamentaux et caractéristiques clés du Big Data
Les dimensions « en V » du Big Data : volume, vélocité, variété (règle des 3V), véracité, valence, valeur…
Différences et apports par rapport aux technologies traditionnelles
Exemples d’application et usages des technologies Big Data
Atelier : Echanges sur les différents contextes des stagiaires.
Enjeux et perspectives Big Data pour les entreprises
L’avènement de la donnée en tant que ressource stratégique
Progrès et innovations de rupture (capacités de stockage, vitesses de traitement)
L’impact et les opportunités induites par le Big Data : nouveaux leviers de performance
BI et Big Data : concepts de Data Lake, Data Warehouse
Création de valeur : comment tirer profit des données ?
Focus sur la qualité des données
Elaborer et implémenter une stratégie Big Data
Les nouveaux métiers de la data (Data Scientist, Data Analyst, Chief Data officer…)
Atelier : Discussions sur les usages potentiels des solutions Big Data selon les secteurs d’activité.
Stockage et traitement du Big Data
Sources de données publiques, privées, la philosophie Open Data
Classifier les données selon leur structure
Vue d’ensemble des modes et architectures de stockage
Présentation de l’écosystème Hadoop : architecture HDFS, HBase, Yarn, Pig et Hive…
Principes de fonctionnement du modèle MapReduce
Des SGBDR aux bases de données NoSQL : MongoDB, Cassandra, Neo4j…
Considérations matérielles, les solutions Big Data dans le Cloud
Exemples de cas pratiques : Etudes de cas/retours d’expérience sur les outils Big Data, présentation des avantages, limites et inconvénients.
Outils et techniques pour l’analyse de données massives
Retour historique : de l’analyse statistique au Deep Learning
Caractéristiques de l’Analytics Big Data, spécificités
Qu’est-ce que le Data Mining ? Relations avec la Business Intelligence
Sélectionner les bons outils suivant la structure de données
Analyse de données avec Pig et Hive, Apache Storm, Apache Spark
ElasticSearch pour la recherche de données
Big Data et intelligence artificielle, une convergence révolutionnaire
Machine Learning : vue d’ensemble des technologies et algorithmes d’apprentissage automatique
Spécificités du Machine Learning pour le Big Data et domaines d’application
Introduction aux réseaux neuronaux (deep learning)
Exemples de cas pratiques : Etudes de cas/retours d’expérience sur les outils Big Data, présentation des avantages, limites et inconvénients.
Visualisation des données
Faire parler les données, principes fondamentaux et objectifs de la dataviz
Limites des outils et méthodes traditionnels (Excel, BusinessObjects, etc)
Spécificités du Big Data
Panorama des solutions de datavisualisation : Tableau, Qlik, Microstrategy, Microsoft Power BI…
Quels types de visualisation pour quels usages ? Graphiques, tableaux de bord, infographies…
La visualisation interactive pour représenter les données complexes
Raconter une histoire avec les données : Data Storytelling
Exemple de cas pratique : Démonstration de la mise en œuvre d’une solution de datavisualisation pour communiquer efficacement sur des analyses de données
Sécurité et Big Data, aspects éthiques et juridiques
Retour sur les données personnelles et impact du Big Data sur la vie privée
Gouvernance et cycle de vie de la donnée dans une architecture Big Data
Obligations légales des organisations : comment concilier Big Data et RGPD ?
Les enjeux juridiques internationaux
Fondamentaux et usages de la cryptographie
Les meilleures pratiques concernant la sécurité (pseudonymisation, anonymisation…)
Exemples de cas pratiques : Etude de cas, considérations pour la mise en conformité d’une organisation.