Formation Data Mining – Machine Learning
ANALYSER DES VOLUMES MASSIFS DE DONNEES
Apprendre les méthodes pour fouiller des données variées ou pour chercher à prévoir les valeurs d’une variable quantitative ou qualitative. Les méthodes présentées seront mises en œuvre au cours d’ateliers. Les différentes étapes d’une étude de Data Mining – Machine Learning seront détaillées ainsi que les méthodes de validation des résultats obtenus.
Prochaine session
Informations session
Programme
Jour 1
- Introduction générale
- Définitions : data mining et machine learning
- Points communs, différences et effet buzz
- Point logiciel
- Data Mining
- Explorer des données : cas univarié
- Décrire une variable qualitative
- Décrire une variable quantitative
- Automatiser le calcul dans R
- Explorer des données : cas bivarié
- Décrire le lien entre deux variables qualitatives
- Décrire le lien entre deux variables quantitatives
- Décrire le lien entre une variable qualitative et une quantitative
- Graphiques uni et bivariés automatisés
- Explorer des données : cas multivarié
- Introduction
- Analyse en Composantes Principales : approche intuitive
- Analyse Factorielle des Correspondances
- Analyse des Correspondances Multiples
- Explorer des données : cas univarié
Jour 2
Data Mining (suite)
- Classer des observations (clustering)
- Introduction
- Classification k-means
- Partitioning Around Medoids
- Classification Ascendante Hiérarchique
- DBSCAN
- Cartes Auto-Génératrices de Kohonen
- Machine Learning Supervisé
- Introduction, définitions et démarche
- Pré-traiter les données
- Comparer la performance de différents algorithmes/valeurs d’hyperparamètres
Jour 3
Machine Learning Supervisé (suite)
- Problématiques de régression
- Modélisation statistique et régression linéaire simple
- Régression multiple : principe
- Régression multiple : Sélection de variables
- Lasso, Ridge, Elastic Net
- Régression PLS
- Arbres de régression
- Problématiques de classification
- K plus proches voisins
- Analyse factorielle discriminante
- Régression logistique
- Support Vector Machines
- Arbres de classification
- Agrégation de modèles
- Bagging
- Random Forests
- Boosting
Jour 4
- Applications caret
- Introduction à la plateforme caret
- Projet régression
- Projet classification
- Introduction aux Réseaux de Neurones Artificiels et au Deep Learning, application Keras
Tarifs
A partir du 2ème inscrit : -10%
CPF – Voir Appli Mon Compte Formation
IASSC – Centre de certification Leader
Certification Reconnue par l’Etat
Classe virtuelle Blended Learning
Inter-Intra entreprise
Sur mesure