1. Principes de l’apprentissage machine & grandes familles d’algorithmes
Principe général, formalisme et histoire
Notion d’apprentissage supervisé et non supervisé, et autres types d’apprentissage
Présentation des différentes familles d’algorithmes et de leurs usages pour des cas métier
2. Apprentissage supervisé
Méthodes de régression linéaire, logistique et régularisées
Support Vector Machines & méthodes à noyaux
Arbres de décision et forêts aléatoires
Introduction aux réseaux de neurones
3. Agrégation et ensembles de modèles
Principes : réduction de la variance et du biais (bagging, boosting)
Agrégations d’arbres de décision en forêts aléatoires
Autres approches d’ensembles de modèles
4. Apprentissage non supervisé
Cas d’usage, mode d’emploi
Opérationnalisation des clusters
5. Evaluation et optimisation des performances
Sélection de variables (features selection)
Méthode d’entrainement et de validation de la performance (validation croisée)
Optimisation des hyperparamètres
6. Pratique des pipelines d’apprentissage
Mise en pratiques des outils de pipelines de sklearn
Comparaison avec les pipelines de Spark MLlib