Un Data Challenge pour l’apprentissage du Machine Learning, une innovation pédagogique de Télécom Paris

, , ,

À Telecom Paris, l’enseignement de Machine Learning, ou apprentissage automatique, intègre un concours pendant lequel les élèves résolvent un problème réel d’entreprise.

Le Machine Learning, ou apprentissage automatique, est une sous-catégorie de l’intelligence artificielle. Il consiste à laisser des algorithmes découvrir des motifs récurrents, dans des ensembles de données. Ces données peuvent être des chiffres, des mots, des images ou encore des statistiques. « Le Machine Learning est un domaine si vaste que les cours sont souvent soit trop théoriques, et peu en phase avec des problématiques réelles, soit trop pratiques, ne montrant qu’une fraction des méthodes existantes », déplore Pavlo Mozharovskyi, enseignant-chercheur à Télécom Paris.

Conjointement avec Stéphan Clémençon, enseignant-chercheur en apprentissage statistiques, ils ont alors mis en place une UE (unité d’enseignement) de 90h qui brosse un large pan de cette discipline avec 14 cours théoriques complétés par 14 TP (travaux pratiques), abordant chacun une méthode différente. Mais la partie la plus innovante du cours réside dans le « Data Challenge », un concours pendant lequel les étudiantes et étudiants doivent résoudre un problème basé sur des données réelles d’entreprises.

Ce challenge se déroule sur un mois à partir du milieu du semestre : « L’entreprise soumet à tous les élèves un même jeu de données, assorti d’une question à résoudre », détaille l’enseignant. Parmi les questions des années précédentes, on retrouve par exemple « Vérifier si la personne sur deux photos est la même » (entreprise IDEMIA), ou encore « Reconnaître une anomalie dans le fonctionnement du moteur d’un hélicoptère » (Airbus). Les étudiantes et étudiants doivent alors élaborer un algorithme, qu’ils testent plusieurs fois sur le jeu de données lors du challenge. « Ils voient immédiatement leur score de performance, et peuvent ainsi améliorer progressivement leur code », explique Pavlo Mozharovskyi. Ils doivent également rendre un rapport expliquant leurs choix de développement, les 5 meilleurs travaux étant présentés et analysés lors d’une session finale.

Ce cours remporte généralement l’adhésion des participantes et participants, qui lui attribuent les notes de 4 et 5 (sur une échelle de 5), « L’aspect compétitif pousse les élèves à mettre en pratique les acquis de l’ensemble des cours théoriques et des TP, et à donner le meilleur d’eux-mêmes », se réjouit Pavlo Mozharovskyi.

Fort de l’intervention de plus 7 enseignants et jusqu’à 10 doctorants, le cours de Machine Learning, délivré à Telecom Paris depuis six ans, est continuellement mis à jour, afin de suivre les méthodes et outils de ce large domaine en constante évolution.

 

Ceci est un projet d’innovation pédagogique présenté dans le cadre du Prix de la Pédagogie IMT 2021.

Illustrateur : Lionel Tarchala