Booster des Talents IT

Formation Big Data Mise en œuvre

image représentant l'écosystème big data
Les technologies Big Data à portée de main grâce à notre formation de référence !
Notre formation Big Data Mise en œuvre couvre l’ensemble des processus nécessaires pour exploiter les ensembles de données massives. Vous découvrirez les différentes technologies pour collecter, stocker, traiter, analyser et présenter la « data », nouvelle ressource stratégique pour les entreprises. Lors des nombreux ateliers pratiques de la formation, vous apprendrez à mettre en œuvre une plateforme complète pour gérer vos données. Travaillez avec Hadoop, Spark ou encore Talend pour la datavisualisation et soyez en mesure de sélectionner les bons outils Big Data selon vos besoins. Une introduction aux concepts d’apprentissage automatique (Machine Learning, Deep Learning) sera également présentée durant la formation.
Prixà partir de
2900 €HT
RéférenceAF27985
Durée5 jours
Public Administrateurs, Analystes, Chefs de Projet, Consultants, Développeurs
PrérequisConnaissances sur les bases de données, en statistiques et développement (Java et SQL idéalement). Une familiarité avec les concepts BI. Il est également recommandé d’avoir suivi la formation Big Data Etat de l’art ou de posséder des connaissances équivalentes.
TP60%

Plan de Formation Big Data Mise en œuvre

Introduction à la formation Big Data Mise en œuvre

Présentation générale et objectifs de cette formation Big Data
Comprendre les enjeux et perspectives du Big Data
Chiffres clés en France et à l’international
La donnée en tant que matière première : « data is the new oil » ?
Différents types, structures et sources de données
Panorama des solutions et acteurs du marché : l’écosystème Big Data
Les nouveaux métiers de la data

Atelier : Présentation du déroulé de la formation et échanges sur les différents contextes des stagiaires.

Rappels des fondamentaux du Big Data

Big Data, Data Science, Machine Learning, etc : définitions et concepts clés
Caractéristiques des données dites massives (les dimensions en V du Big Data)
Les architectures Big Data orientées stockage, calcul, temps réel…
Enjeux juridiques et éthiques liés à la collecte, au traitement et à l’analyse de données
Cycle de vie de la donnée
Assurer la qualité des données
Créer de la valeur à partir des données : vue d’ensemble d’un processus de Data Science

Atelier : Discussions sur les potentiels usages des technologies de Big Data suivant les secteurs d’activité.

Méthodologie pour l’implémentation d’un projet Big Data

Définir les besoins métiers et objectifs d’un projet
Spécificités d’un projet Big Data : incertitude, budget, délais, gestion organisationnelle…
Sélectionner les bons outils
Poser les bonnes questions
Obtenir les données
Explorer et prétraiter les données
Analyser les données : planifier et construire un modèle viable
Communiquer les résultats
Transformer les résultats en décisions et en actions

Atelier : Présentation du schéma d’architecture d’un projet Big Data et élaboration d’une première feuille de route.

Outils et technologies Big Data : démarrer avec Hadoop

L’écosystème Apache Hadoop et les principales distributions (Hortonworks, Cloudera…)
Clusters Hadoop, HDFS, YARN et MapReduce : comprendre les principes de fonctionnement
Introduction aux composants HBase, Pig et Hive, Spark…
Cas d’utilisation et exemples de mises en œuvre de la plateforme Hadoop.

Atelier : Installation et configuration d’une plateforme complète Big Data. Prise en main des concepts de base de l’architecture Hadoop (NameNode, DataNode, Replications…).

Collecte, stockage et traitement des données

Connaître les différentes sources de données (internes/externes, publiques/privées)
Analyser les caractéristiques d’un jeu de données
Principes ETL (Extract Transform Load) : présentation et prise en main de Talend
Gérer les spécificités des données semi et non-structurées
Rappels des principes du stockage distribué
Intérêt et vue d’ensemble des bases de données NoSQL (Cassandra, Neo4j, MongoDB…)
Prise en main d’HDFS et du modèle MapReduce
Utiliser les fonctionnalités de Pig et Hive pour requêter et traiter les données
ElasticSearch pour l’indexation et la recherche de données

Atelier : Mises en pratiques des concepts, prise en main des différents outils pour importer, stocker et manipuler des ensembles de données.

Analyse des données issues du Big Data

Vue d’ensemble des différentes méthodes et techniques d’analyse
Notions d’analyse statistique et prédictive, l’impact de l’augmentation des volumes de données
Analyser un ensemble de données avec l’environnement Apache Spark
Comprendre les apports de la convergence entre Big Data et intelligence artificielle
Introduction aux principes de Machine Learning
Les différentes familles de modèles : régression, classification, clustering, reinforcement learning, NLP
Technique de feature engineering pour préparer les données
Sélectionner, entraîner et tester un algorithme de Machine Learning
Principes du Deep Learning : apprentissage profond et réseaux neuronaux

Atelier : Présentation de l’environnement Spark. Mise en œuvre d’analyses de données avec des techniques de Machine Learning (langage R ou Python).

Datavisualisation : apprendre à communiquer sur les données

Les enjeux et objectifs d’une bonne communication
Principes fondamentaux de la représentation visuelle
La Datavisualisation tout au long du processus Big Data
Techniques et outils principaux pour la visualisation de données (Tableau, Qlik, etc)
Sélectionner une solution de datavisualisation selon l’objectif recherché
Connaître les bonnes pratiques de Dataviz : utilisation des couleurs, graphiques, tableaux de bord, infographies, notebooks…
Visualisation interactive

Atelier : Utilisation d’une solution de datavisualisation pour réaliser une présentation des résultats d’analyse.

Nos autres formations Fondamentaux

AF27985Formation Big Data Mise en œuvre 27 sessions prévues5 jours2900 €HT
AF27182Formation Chatbot New Formation ! 31 sessions prévues3 jours2190 €HT
AF26712Formation Certification Big Data Foundation New Formation ! 31 sessions prévues3 jours2190 €HT
AF14791Formation Data Management 28 sessions prévues2 jours1450 €HT
AF13544Formation Modélisation du Data Warehouse 35 sessions prévues3 jours1990 €HT
Voir les 7 formations
Vous pouvez également être intéressé par des formations big data, data management, data science, datalake, DataWarehouse, gestion des données ou par les formations de notre filière Fondamentaux
Prixà partir de
2900 €HT
RéférenceAF27985
Durée5 jours
Public Administrateurs, Analystes, Chefs de Projet, Consultants, Développeurs
PrérequisConnaissances sur les bases de données, en statistiques et développement (Java et SQL idéalement). Une familiarité avec les concepts BI. Il est également recommandé d’avoir suivi la formation Big Data Etat de l’art ou de posséder des connaissances équivalentes.
Travaux pratiques60%
Suivez l'une de
nos 27 sessions
le 21/01/2019 à Lille
le 28/01/2019 à Paris
le 11/02/2019 à Grenoble
le 11/02/2019 à Nantes
le 11/02/2019 à Lyon
le 11/03/2019 à Paris
le 11/03/2019 à Toulouse
le 01/04/2019 à Aix-en-Provence
le 08/04/2019 à Lyon
le 08/04/2019 à Grenoble
le 13/05/2019 à Lille
le 20/05/2019 à Paris
le 03/06/2019 à Grenoble
le 03/06/2019 à Lyon
le 24/06/2019 à Nantes
le 01/07/2019 à Paris
le 22/07/2019 à Toulouse
le 02/09/2019 à Aix-en-Provence
le 23/09/2019 à Grenoble
le 23/09/2019 à Lyon
le 07/10/2019 à Paris
le 07/10/2019 à Lille
le 04/11/2019 à Grenoble
le 04/11/2019 à Nantes
le 04/11/2019 à Lyon
le 09/12/2019 à Toulouse
le 31/12/2019 à Paris
Voir toutes les dates