Formation Data Mining – Machine Learning
Dernière mise à jour : 15 janvier 2023
Objectifs
ANALYSER DES VOLUMES MASSIFS DE DONNEES
Apprendre les méthodes pour fouiller des données variées ou pour chercher à prévoir les valeurs d’une variable quantitative ou qualitative. Les méthodes présentées seront mises en œuvre au cours d’ateliers. Les différentes étapes d’une étude de Data Mining – Machine Learning seront détaillées ainsi que les méthodes de validation des résultats obtenus.
Compétences acquises
Méthode pédagogique
- Une pédagogie active, l’apprenant étant au centre du dispositif
- Des mises en situation ludiques et interactives
- Les applications pratiques seront mises en œuvre
- Du concret : toute la formation renvoie à la réalité professionnelle
- De l’action : plus de 2/3 du temps est dédié à la pratique et à l’expérimentation
- Du rythme : l’intérêt et l’attention du stagiaire sont stimulés par des explications en groupe ou individuelles, des échanges, des travaux et exercices personnels ou collectifs…
- De l’individualisation : chacun apprend à son rythme pour renforcer son autonomie
- De l’ancrage: les participants formalisent et synthétisent ce qu’ils apprennent pour une meilleure mémorisation des acquis
- La formation réserve une place importante à l’interaction avec les participants.
- Mise en situation par application concrète des outils sur vos données de travail durant la formation.
Programme
Jour 1
- Introduction générale
- Définitions : data mining et machine learning
- Points communs, différences et effet buzz
- Point logiciel
- Data Mining
- Explorer des données : cas univarié
- Décrire une variable qualitative
- Décrire une variable quantitative
- Automatiser le calcul dans R
- Explorer des données : cas bivarié
- Décrire le lien entre deux variables qualitatives
- Décrire le lien entre deux variables quantitatives
- Décrire le lien entre une variable qualitative et une quantitative
- Graphiques uni et bivariés automatisés
- Explorer des données : cas multivarié
- Introduction
- Analyse en Composantes Principales : approche intuitive
- Analyse Factorielle des Correspondances
- Analyse des Correspondances Multiples
- Explorer des données : cas univarié
Jour 2
Data Mining (suite)
- Classer des observations (clustering)
- Introduction
- Classification k-means
- Partitioning Around Medoids
- Classification Ascendante Hiérarchique
- DBSCAN
- Cartes Auto-Génératrices de Kohonen
- Machine Learning Supervisé
- Introduction, définitions et démarche
- Pré-traiter les données
- Comparer la performance de différents algorithmes/valeurs d’hyperparamètres
Jour 3
Machine Learning Supervisé (suite)
- Problématiques de régression
- Modélisation statistique et régression linéaire simple
- Régression multiple : principe
- Régression multiple : Sélection de variables
- Lasso, Ridge, Elastic Net
- Régression PLS
- Arbres de régression
- Problématiques de classification
- K plus proches voisins
- Analyse factorielle discriminante
- Régression logistique
- Support Vector Machines
- Arbres de classification
- Agrégation de modèles
- Bagging
- Random Forests
- Boosting
Jour 4
- Applications caret
- Introduction à la plateforme caret
- Projet régression
- Projet classification
- Introduction aux Réseaux de Neurones Artificiels et au Deep Learning, application Keras
Public
Dans l’entreprise, ce stage s’adresse aussi bien aux décideurs qu’aux statisticiens ou aux chargés d’études en charge de l’exploitation des données de l’entreprise (applications marketing, gestion de la relation client, scoring, churn, Recherche et Développement, etc.). Ce stage s’adresse également aux chercheurs ou ingénieurs de recherche ou d’étude issus du monde académique et amenés à manipuler des données dans le cadre de leurs recherches (biostatistique, recherche médicale, sciences sociales, économétrie, etc.).
Pré-requis
Il est conseillé d’avoir suivi la formation Pratique de la Statistique I ou d’avoir acquis par la pratique un niveau équivalent. Il est également recommandé d’avoir des notions de base du langage R ou de tout autre langage de programmation.
Suivi & Evaluation
Modalités d’évaluation Standard
- Questionnaire théorique en début de formation
- Questionnaire théorique en fin de formation
- Validation des acquis
- Attestation de formation
Modalités d’évaluation Certification
- Évaluation standard +
- Révision et préparation à l’examen (exercices pratiques...)
- Examen final en fin de formation via un jury permettant d'obtenir la certification du bloc de compétence
- Pour certaines formations, les compétences théoriques sont validées en amont du Jury via un QCM
- Certains examens internationaux impose un examen en ligne pour un durée allant de 2h à 4h
- Les dates d’examens peuvent évoluer en fonction des sessions
- En cas de non-admission ou de non-présentation du candidat, le candidat a la possibilité de se représenter à une session suivante en accord avec l’équipe pédagogique.
Dates
Apprendre les méthodes pour fouiller des données variées ou pour chercher à prévoir les valeurs d’une variable quantitative ou qualitative. Les méthodes présentées seront mises en œuvre au cours d’ateliers. Les différentes étapes d’une étude de Data Mining – Machine Learning seront détaillées ainsi que les méthodes de validation des résultats obtenus. Apprendre les méthodes pour fouiller des données variées ou pour chercher à prévoir les valeurs d’une variable quantitative ou qualitative. Les méthodes présentées seront mises en œuvre au cours d’ateliers. Les différentes étapes d’une étude de Data Mining – Machine Learning seront détaillées ainsi que les méthodes de validation des résultats obtenus. Apprendre les méthodes pour fouiller des données variées ou pour chercher à prévoir les valeurs d’une variable quantitative ou qualitative. Les méthodes présentées seront mises en œuvre au cours d’ateliers. Les différentes étapes d’une étude de Data Mining – Machine Learning seront détaillées ainsi que les méthodes de validation des résultats obtenus.
Analyser des volumes massifs de données
Analyser des volumes massifs de données
Analyser des volumes massifs de données
Accessibilité handicap
DYNACENTRIX s’engage auprès de ses clients et partenaires, sur la garantie de l'égalité des droits et des chances des personnes en situation de handicap pour accéder aux formations proposées et a mis en place un accueil spécifique qui travaille en étroite collaboration avec des organismes partenaires (AGEFIPH IDF, Cap emploi).
DYNACENTRIX accueille et accompagne les personnes en situation de handicap tout le long de leur parcours, en lien direct avec l’entourage professionnel et/ou familial des bénéficiaires, en adaptant sa pédagogie et le rythme de ses enseignements ».
Témoignages
Prochaine session
Analyser des volumes massifs de données
Apprendre les méthodes pour fouiller des données variées ou pour chercher à prévoir les valeurs d’une variable quantitative ou qualitative. Les méthodes présentées seront mises en œuvre au cours d’ateliers. Les différentes étapes d’une étude de Data Mining – Machine Learning seront détaillées ainsi que les méthodes de validation des résultats obtenus.
Analyser des volumes massifs de données
Apprendre les méthodes pour fouiller des données variées ou pour chercher à prévoir les valeurs d’une variable quantitative ou qualitative. Les méthodes présentées seront mises en œuvre au cours d’ateliers. Les différentes étapes d’une étude de Data Mining – Machine Learning seront détaillées ainsi que les méthodes de validation des résultats obtenus.
Analyser des volumes massifs de données
Apprendre les méthodes pour fouiller des données variées ou pour chercher à prévoir les valeurs d’une variable quantitative ou qualitative. Les méthodes présentées seront mises en œuvre au cours d’ateliers. Les différentes étapes d’une étude de Data Mining – Machine Learning seront détaillées ainsi que les méthodes de validation des résultats obtenus.
Durée : 4 jours (soit 28 heures)
Référence : F-dat-00
Lieu : Disponible à distance, en présentiel, en mixte-hybride, en individuel ou en collectif avec des approches pédagogiques adaptées et spécifiques