Introduction
Les grands principes et enjeux de l’analyse de données
De l’analyse statistique au Deep Learning : bref retour historique sur le traitement des données
Business Intelligence vs. Data Mining
Fondamentaux de la statistique descriptive
Définition de la statistique descriptive
Analyse d’une population
Méthodes d’échantillonnage
Variables qualitatives et quantitatives
Effectifs et calcul des fréquences
Effectifs cumulés croissants et décroissants
Représentation graphique des variables qualitatives et quantitatives
Exercices
Paramètre de position et de dispersion
Mode, valeur modale, valeur la plus probable
Moyenne d’une population (ou d’un échantillon)
Médiane, partager une série numérique
Étendue, différence entre valeurs extrêmes
Utiliser les quantiles
Écart-type, calculer la dispersion d’un ensemble de données
Calcul de la variance et de la covariance
Exercices
Statistique inférentielle
Mesures d’association
Notions sur la génération de nombres au hasard et de variable aléatoire
Loi de probabilité
Loi des grands nombres et théorème de la limite centrale
Intervalles de confiance
Tests d’hypothèses
Analyse de la variance à un facteur, deux facteurs
Exercices
Démarche et modélisation d’une analyse statistique
Les grands principes de la modélisation
Ouverture sur l’apprentissage supervisé et non-supervisé : vers la Data Science
Régression linéaire simple
Régression linéaire multiple
Analyse discriminante linéaire
Régression logistique
Exercices