L’apprentissage par renforcement vise enseigner à un agent la manière d’optimiser ses actions de manière à maximiser ses gains.

Ce domaine classique a été bouleversé par le Deep Learning récemment (Q function, policy, etc.) et permet desormais de résoudre des tâches jugées jusque-là hors de portée de la machine : optimisation de process, jeu de go/vidéo, robotique…

Moyens techniques

Support de cours projeté pendant la formation et transmis à l’ensemble des stagiaires à l’issue de la formation; cas et exemples pratiques choisis selon les domaines d’intérêt des stagiaires

Suivi de l’exécution

Emargement demandé chaque demie-journée à tous les stagiaires Évaluation : Questionnaire d’évaluation des acquis à l’issue de la formation

Appréciation des résultats

Questionnaire de satisfaction à l’issue de la formation

Objectifs pédagogiques

Cours théoriques mêlés d’exemples et d’études de cas. Les participants sont amenés à comprendre les concepts-clé du reinforcement learning et de ses évolutions récentes.

Technologies abordées

Tensor, autograd, torch.n, Module, torch.optim, tensorboard, torchvision examples, TorchScript, torch.hub, torch.utils.dat

Compétences visées

  • Reinforcement learning : fondamentaux
  • Variations récentes: deep Q-learning
  • Model-free/model-based: études de cas
  • Passage à l’échelle, etat de l’art