Pré-requis

Pratique de Python, statistiques descriptives, familiarité avec la régression linéaire

Objectifs

  • Comprendre les concepts et principes du machine learning
  • Savoir quels sont les algorithmes pour traiter les différents types de problèmes
  • Utiliser les bonnes méthodes pour évaluer la performance & la fiabilité des modèles
  • Optimiser les paramètres de ses modèles

2 jours + 1 jour projet pratique

10 personnes max

Présentiel ou à distance

1. Principes de l’apprentissage machine & grandes familles d’algorithmes

  • Principe général, formalisme et histoire

  • Notion d’apprentissage supervisé et non supervisé, et autres types d’apprentissage

  • Présentation des différentes familles d’algorithmes et de leurs usages pour des cas métier

2. Apprentissage supervisé

  • Méthodes de régression linéaire, logistique et régularisées

  • Support Vector Machines & méthodes à noyaux

  • Arbres de décision et forêts aléatoires

  • Introduction aux réseaux de neurones

3. Agrégation et ensembles de modèles

  • Principes : réduction de la variance et du biais (bagging, boosting)

  • Agrégations d’arbres de décision en forêts aléatoires

  • Autres approches d’ensembles de modèles

4. Apprentissage non supervisé

  • Cas d’usage, mode d’emploi

  • Méthodes de clustering

  • Opérationnalisation des clusters

5. Evaluation et optimisation des performances

  • Sélection de variables (features selection)

  • Méthode d’entrainement et de validation de la performance (validation croisée)

  • Optimisation des hyperparamètres

  • Introduction au AutoML

6. Pratique des pipelines d’apprentissage

  • Mise en pratiques des outils de pipelines de sklearn

  • Comparaison avec les pipelines de Spark MLlib

Autres formations

  • Chef de Projet Data Gouvernance (H/F)

    Publié le 19 Jul. 2022

  • Lead Data Engineer (H/F)

    Publié le 19 Jul. 2022