Fondamentaux de l’apprentissage statistique [Tutorial on statistical learning] Chapitre d’ouvrage - Mai 2018

Sylvain Arlot

Sylvain Arlot, « Fondamentaux de l’apprentissage statistique [Tutorial on statistical learning]  », in Myriam Maumy-Bertrand, Gilbert Saporta, Christine Thomas-Agnan (eds.), Apprentissage statistique et donn\’ees massives, 2018. ISBN 9782710811824

Ce texte présente les bases de l’apprentissage statistique supervisé, sous un angle mathématique. On décrit le problème général de prévision, puis les deux exemples fondamentaux que sont la régression et la classification (ou discrimination) binaire. Ensuite, on étudie deux grandes familles de règles d’apprentissage : la minimisation du risque empirique, qui amène naturellement à la question de la convexification du risque de classification, et les règles par moyenne locale qui permettent d’énoncer un résultat de consistance universelle. Enfin, on identifie les limites de l’apprentissage pour mieux en dégager les enjeux. Un rappel des outils probabilistes utiles et une série d’exercices complètent les résultats présentés.

This text is a tutorial on supervised statistical learning, from the mathematical point of view. We describe the general prediction problem and the two key examples of regression and binary classification. Then, we study two kinds of learning rules : empirical risk minimizers, which naturally lead to convex risks in classification, and local averaging rules, for which a universal consistency result can be obtained. Finally, we identify the limits of learning in order to underline its challenges. The text ends with some useful probabilistic tools and some exercises.

Voir la notice complète sur HAL

Actualités