formation Deep reinforcement learning

Deep reinforcement Learning

L'apprentissage par renforcement vise enseigner à un agent la manière d'optimiser ses actions de manière à maximiser ses gains. Ce domaine classique a été bouleversé par le Deep Learning récemment (Q function, policy, etc.) et permet desormais de résoudre des tâches jugées jusque-là hors de portée de la machine : optimisation de process, jeu de go/vidéo, robotique...
  • Durée : 2 jours
  • Public: Ingénieurs, data-scientists
  • Pré-requis : Bases de programmation python, mathématiques bac+3
  • Technicite ★★☆☆☆
  • Modalités : Formation intra, a distance ou dans vos locaux (minimum 3 stagiaires)
  • Annulation : sans frais jusqu’à 3 semaines avant. Au-delà, 25% de la somme est due.
  • Modalités de paiement : Paiement à 30 jours.

Résumé

L’apprentissage par renforcement vise enseigner à un agent la manière d’optimiser ses actions de manière à maximiser ses gains.

Ce domaine classique a été bouleversé par le Deep Learning récemment (Q function, policy, etc.) et permet desormais de résoudre des tâches jugées jusque-là hors de portée de la machine : optimisation de process, jeu de go/vidéo, robotique…

Moyens techniques : Support de cours projete pendant la formation et transmis à l’ensemble des stagiaires à l’issue de la formation; cas et exemples pratiques choisis selon les domaines d’intérêt des stagiaires
Suivi de l’exécution : Emargement demandé chaque demie-journée à tous les stagiaires
Évaluation : Questionnaire d’évaluation des acquis à l’issue de la formation
Appréciation des résultats : Questionnaire de satisfaction à l’issue de la formation

Objectifs pédagogiques

Cours théoriques mêlés d’exemples et d’études de cas. Les participants sont amenés à comprendre les concepts-clé du reinforcement learning et de ses évolutions récentes.

Technologies abordées

Tensor, autograd, torch.n, Module, torch.optim, tensorboard, torchvision examples, TorchScript, torch.hub, torch.utils.dat

Compétences visées

  • Reinforcement learning : fondamentaux
  • Variations récentes: deep Q-learning
  • Model-free/model-based: études de cas
  • Passage à l’échelle, etat de l’art