Booster des Talents IT

Formation Apache SparkNew Formation !

Logo Spark
Formez-vous à Apache Spark avec nos sessions intensives de 3 jours !
Cette formation vous permettra d’explorer les applications de Spark, la nouvelle solution Big Data d’Apache. Apprenez à exploiter la polyvalence et les capacités de ce framework pour concevoir des applications efficaces et optimisées de traitements de données pour satisfaire au mieux vos besoins dans de nombreux secteurs d’activités. Créez des applications sophistiquées pour analyser et travailler sur une grande variété de données avec des techniques de traitement par lots, de DataStreaming et de Machine Learning.
  • le 19/09/2017 à Paris
  • le 03/10/2017 à Lyon
  • le 29/11/2017 à Paris
  • + 1 autre session
Prixà partir de
1470 €HT
RéférenceAF24372
Durée3 jours
Public Architectes techniques, Développeurs, DSI
PrérequisBases en langage Java, Scala ou Python, connaissances sur Apache Hadoop
Éditeurs Open Source, Apache
TP50%

Plan de Formation Apache Spark

Introduction à Apache Spark

Quelles solutions apportent Spark au Big Data ?
Principes de base du fonctionnement de Spark
Différences et complémentarités avec Apache Hadoop
Spécification de Spark Shell
Environnement et outils de Spark

Fonctionnement et utilisation des RDD (Resilient Distributed Datasets)

Gérer les opérations de RDD
RDD et MapReduce
Spark SQL

Combiner Spark au Système de Fichiers Distribués Hadoop (HDFS)

Intérêts de l’utilisation du HDFS dans Spark
Intégrer le HDFS dans l’architecture Spark
Utiliser le HDFS

Spark en cluster

Créer la structure en clusters
Hébergement et déploiement
Interface Web de Spark

Partitionnement et programmation parallèle

Localiser les données du HDFS
Partitionner les RDD
Programmer et exécuter les opérations parallèles
Mettre en cache le partitionnement des données
Gérer la persistance des données

Concevoir une application avec Spark

Présentation et configuration des propriétés de Spark
Prototypage d’opérations avec Spark Shell
Compilation et génération d’une application

Traiter les données en temps réel avec Spark Streaming

Fonctionnement et concepts de base
Notions de DStream
Intégration, transformation et opérations de sorties des DStreams
Gestion des performances

Machine Learning et implémentation d’algorithmes

Algorithmes itératifs et résolution de problèmes
Machine Learning Library MLlib
Opérations sur les données graphiques

Optimisation de Spark

Gestion des variables partagées
Données broadcastées
Accumulateurs
Méthodes et outils d’optimisation des performances

Nos autres formations Frameworks Java

AF24507Formation Apache Storm New Formation ! 4 sessions prévues3 jours1650 €HT
AF24372Formation Apache Spark New Formation ! 4 sessions prévues3 jours1470 €HT
AF15369Formation Frameworks Java pour développeurs en Intra/Cours Particulier5 jours2350 €HT
AF14783Formation Apache Hadoop 4 sessions prévues3 jours1470 €HT
AF13578Formation Swing, développement en Java 8 sessions prévues3 jours1450 €HT
Voir les 15 formations
Vous pouvez également être intéressé par des formations Apache, Base de données, big data, développement web ou par les formations de notre filière Frameworks Java
A propos de Apache Spark
Apache Spark est un framework open source de gestion de donnée à grande échelle. Il s'inscrit dans la continuité d'Apache Hadoop en proposant une solution Big Data plus rapide et plus simple. En savoir plus
Prixà partir de
1470 €HT
RéférenceAF24372
Durée3 jours
Public Architectes techniques, Développeurs, DSI
PrérequisBases en langage Java, Scala ou Python, connaissances sur Apache Hadoop
Éditeurs Open Source, Apache
Travaux pratiques50%
Suivez l'une de
nos 4 sessions
le 19/09/2017 à Paris
le 03/10/2017 à Lyon
le 29/11/2017 à Paris
le 13/12/2017 à Lyon