Data Science ML avec Python
Dernière mise à jour : 15 janvier 2023
Objectifs
NUMPY, SCIPY, MATPLOTLIB, BOKEH, PANDAS, PYSPARK, KERAS, JUPYTER, SCIKIT LEARN…
Formation basée sur la pratique permettant d’être opérationnel sur l’analyse de données avec le langage Python. Être capable d’automatiser le traitement de données avec Python et travailler avec les outils pour la data science de Python (Numpy, Scipy, Matplotlib, Bokeh, Pandas, PySpark, Keras, Jupyter, scikit learn…)
Initiation au Machine Learning, Deep Learning.
Compétences acquises
Méthode pédagogique
- Une pédagogie active, l’apprenant étant au centre du dispositif
- Des mises en situation ludiques et interactives
- Les applications pratiques seront mises en œuvre
- Du concret : toute la formation renvoie à la réalité professionnelle
- De l’action : plus de 2/3 du temps est dédié à la pratique et à l’expérimentation
- Du rythme : l’intérêt et l’attention du stagiaire sont stimulés par des explications en groupe ou individuelles, des échanges, des travaux et exercices personnels ou collectifs…
- De l’individualisation : chacun apprend à son rythme pour renforcer son autonomie
- De l’ancrage: les participants formalisent et synthétisent ce qu’ils apprennent pour une meilleure mémorisation des acquis
- La formation réserve une place importante à l’interaction avec les participants.
- Mise en situation par application concrète des outils sur vos données de travail durant la formation.
Programme
Objectifs
- Maîtriser les bases de python
- Etre capable d’analyser des données avec python
- Etre capable d’automatiser le traitement de données avec python
- Connaître les outils pour la data science de python
Organisation des journées
Formation basée sur la pratique permettant d’être opérationnel et s’adaptant aux profils et besoins des participants. Durant ces journées, nous nous concentrons sur des applications pratiques pour maîtriser le langage python.
Les notions marquées d’une étoile * seront abordés si intérêt des participants et si temps
Jour 1 : Fondamentaux
- Keynote Introduction Datascience et Machine learning
- Tour d’horizon
- Principe
- Applications
- Introduction au langage python
- Installation des outils de développement en Python
- Le langage (la syntaxe, types, les structures (string, listes, dictionnaires…), les opérateurs et les fonctions, manipulation de fichiers)
- Utilisation et création de librairies
- Programmation Orientée objet : classes, objets, héritage
- Calcul scientifique en Python et introduction à la Data visualisation
- Présentation de l’écosystème scientifique et data en python. Forces et faiblesses
- Calcul scientifique avec Numpy et Scipy (manipulation vecteurs, matrices, opérations)
- Introduction à la datavisualization
- Datavisualisation avec Matplotlib (scatter plot, box plot, histogrammes…)
- Datavisualisation interactive avec Bokeh*
Jour 2 : Traitement et Manipulation de donnée + Introduction ML
- Sources et formats de données (csv, excel, xml, API, web scrapping, sql)
- La préparation et le nettoyage des données (jointure, filtre, transformation, traitement des données manquantes avec pandas)
- Traitement et manipulation de Séries temporelles avec Pandas
- Librairies pour les séries temporelles
- Notions de Big data avec PySpark*
- Principes et problématiques du Machine Learning
- Machine learning supervisé
- Machine learning non supervisé
- Etapes d’un projet de ML : problématiques, mise en production
Jour 3: Machine learning en python
- Préparation des données pour le machine learning
- Cas pratique de machine learning avec scikit learn
- La prévision et régression
- Classification
- Machine learning pour les séries temporelles
- Le traitement de données textuelles
- Diagnostique et résolution des problèmes en Machine learning
- Introduction au deep learning avec Keras
Discussions et démonstrations de fonctionnalités avancées sur les problématiques des participants
Public
Toute personne souhaitant approfondir ses connaissances du langage Python.
Pré-requis
Cette formation s’adresse à des personnes ayant des bases en programmation par la maîtrise d’un langage.
Suivi & Evaluation
Modalités d’évaluation Standard
- Questionnaire théorique en début de formation
- Questionnaire théorique en fin de formation
- Validation des acquis
- Attestation de formation
Modalités d’évaluation Certification
- Évaluation standard +
- Révision et préparation à l’examen (exercices pratiques...)
- Examen final en fin de formation via un jury permettant d'obtenir la certification du bloc de compétence
- Pour certaines formations, les compétences théoriques sont validées en amont du Jury via un QCM
- Certains examens internationaux impose un examen en ligne pour un durée allant de 2h à 4h
- Les dates d’examens peuvent évoluer en fonction des sessions
- En cas de non-admission ou de non-présentation du candidat, le candidat a la possibilité de se représenter à une session suivante en accord avec l’équipe pédagogique.
Dates
Formation basée sur la pratique permettant d’être opérationnel sur l’analyse de données avec le langage Python. Être capable d’automatiser le traitement de données avec Python et travailler avec les outils pour la data science de Python (Numpy, Scipy, Matplotlib, Bokeh, Pandas, PySpark, Keras, Jupyter, scikit learn…)
Initiation au Machine Learning, Deep Learning.
Accessibilité handicap
DYNACENTRIX s’engage auprès de ses clients et partenaires, sur la garantie de l'égalité des droits et des chances des personnes en situation de handicap pour accéder aux formations proposées et a mis en place un accueil spécifique qui travaille en étroite collaboration avec des organismes partenaires (AGEFIPH IDF, Cap emploi).
DYNACENTRIX accueille et accompagne les personnes en situation de handicap tout le long de leur parcours, en lien direct avec l’entourage professionnel et/ou familial des bénéficiaires, en adaptant sa pédagogie et le rythme de ses enseignements ».
Témoignages
Prochaine session
Initiation au Machine Learning, Deep Learning.
Formation basée sur la pratique permettant d’être opérationnel sur l’analyse de données avec le langage Python. Être capable d’automatiser le traitement de données avec Python et travailler avec les outils pour la data science de Python (Numpy, Scipy, Matplotlib, Bokeh, Pandas, PySpark, Keras, Jupyter, scikit learn…)
Durée : 3 jours (soit 21 heures)
Référence : F-pyt-02
Lieu : Disponible à distance, en présentiel, en mixte-hybride, en individuel ou en collectif avec des approches pédagogiques adaptées et spécifiques
Prix : 2250 €
Formation disponible aussi
en Intra & sur mesure