Data Mining - Machine Learning

Formation Data Mining Machine Learning - Dynacentrix
Apprendre les méthodes pour fouiller des données variées ou pour chercher à prévoir les valeurs d’une variable quantitative ou qualitative. Les méthodes présentées seront mises en œuvre au cours d’ateliers. Les différentes étapes d’une étude de Data Mining - Machine Learning seront détaillées ainsi que les méthodes de validation des résultats obtenus.

DEBUT

18 juin 2019

FIN

21 juin 2019

LOCALISATION

Paris   CARTE

Formation Data Mining – Machine Learning

OBJECTIFS

Apprendre les méthodes pour fouiller des données variées ou pour chercher à prévoir les valeurs d’une variable quantitative ou qualitative. Les méthodes présentées seront mises en œuvre au cours d’ateliers. Les différentes étapes d’une étude de Data Mining – Machine Learning seront détaillées ainsi que les méthodes de validation des résultats obtenus.

INFORMATIONS SESSIONS

Public

Dans l’entreprise, ce stage s’adresse aussi bien aux décideurs qu’aux statisticiens ou aux chargés d’études en charge de l’exploitation des données de l’entreprise (applications marketing, gestion de la relation client, scoring, churn, Recherche et Développement, etc.). Ce stage s’adresse également aux chercheurs ou ingénieurs de recherche ou d’étude issus du monde académique et amenés à manipuler des données dans le cadre de leurs recherches (biostatistique, recherche médicale, sciences sociales, économétrie, etc.).

Pré-requis

Il est conseillé d’avoir suivi la formation Pratique de la Statistique I ou d’avoir acquis par la pratique un niveau équivalent. Il est également recommandé d’avoir des notions de base du langage R ou de tout autre langage de programmation.

Méthode

Alternance d’exposés, de discussions et d’exercices pratiques avec le logiciel R. Des scripts R commentés sont fournis aux participants, afin qu’ils puissent les adapter à leurs propres problématiques et données à l’issue de la formation.

Durée : 4 jours (28 heures)

Référence  : F-dat-00

Inter

Intra grandes villes – Nous consulter

Prochaines sessions :

Lieu
Début
Fin
Paris
10/12/2018
13/12/2018
Paris 26/03/2019 29/03/2019
Paris 18/06/2019 21/06/2019
Paris 24/09/2019 27/09/2019
Paris 10/12/2019 13/12/2019

Frais d’inscription*

1 inscrit
2 inscrits
3 inscrits
2600€ HT
-10%
-15%

*Inter-entreprises : Prix unitaire par stagiaire(s) inscrit(s)

PROGRAMME

Jour 1

  1. Introduction générale
    1. Définitions : data mining et machine learning
    2. Points communs, différences et effet buzz
    3. Point logiciel
  2. Data Mining
    1. Explorer des données : cas univarié
      1. Décrire une variable qualitative
      2. Décrire une variable quantitative
      3. Automatiser le calcul dans R
    2. Explorer des données : cas bivarié
      1. Décrire le lien entre deux variables qualitatives
      2. Décrire le lien entre deux variables quantitatives
      3. Décrire le lien entre une variable qualitative et une quantitative
      4. Graphiques uni et bivariés automatisés
    3. Explorer des données : cas multivarié
      1. Introduction
      2. Analyse en Composantes Principales : approche intuitive
      3. Analyse Factorielle des Correspondances
      4. Analyse des Correspondances Multiples

Jour 2

Data Mining (suite)

  1. Classer des observations (clustering)
    1. Introduction
    2. Classification k-means
    3. Partitioning Around Medoids
    4. Classification Ascendante Hiérarchique
    5. DBSCAN
    6. Cartes Auto-Génératrices de Kohonen
  2. Machine Learning Supervisé
    1. Introduction, définitions et démarche
    2. Pré-traiter les données
    3. Comparer la performance de différents algorithmes/valeurs d’hyperparamètres

Jour 3

Machine Learning Supervisé (suite)

  1. Problématiques de régression
    1. Modélisation statistique et régression linéaire simple
    2. Régression multiple : principe
    3. Régression multiple : Sélection de variables
    4. Lasso, Ridge, Elastic Net
    5. Régression PLS
    6. Arbres de régression
  2. Problématiques de classification
    1. K plus proches voisins
    2. Analyse factorielle discriminante
    3. Régression logistique
    4. Support Vector Machines
    5. Arbres de classification
  3. Agrégation de modèles
    1. Bagging
    2. Random Forests
    3. Boosting

Jour 4

  1. Applications caret
    1. Introduction à la plateforme caret
    2. Projet régression
    3. Projet classification
  2. Introduction aux Réseaux de Neurones Artificiels et au Deep Learning, application Keras

NOUS CONTACTER

Vous souhaitez plus d'informations concernant la formation Data Mining – Machine Learning ?

Contactez-nous au +33 (0) 1 72 92 05 58
ou envoyez vos demandes inter ou intra en précisant les dates de sessions qui vous intéressent.

Print Friendly, PDF & Email

Dynacentrix

Dynacentrix est un leader Européen dans la formation et la certification Lean Six Sigma à Paris (et province en intra). (Black Belt, Green Belt, Yellow Belt) et méthode Agile. Accrédité Master Black Belt par IASSC. Dynacentrix propose aussi des formations en Machine Learning, formations en Data Mining, formations en Langage R, Formations Python…  Dynacentrix couvre tous les aspects pédagogiques et techniques (Services et logiciels) dans les domaines de l’Excellence Opérationnelle, Data Science / AI et Statistiques.

Dynacentrix Paris

Coordonnées

60 Avenue Charles de Gaulle
92200 Neuilly-sur-Seine
Tél : 01 72 92 05 58

Partager cette page sur :

TOP