L’apprentissage par renforcement vise enseigner à un agent la manière d’optimiser ses actions de manière à maximiser ses gains.
Ce domaine classique a été bouleversé par le Deep Learning récemment (Q function, policy, etc.) et permet desormais de résoudre des tâches jugées jusque-là hors de portée de la machine : optimisation de process, jeu de go/vidéo, robotique…
Cours théoriques mêlés d’exemples et d’études de cas. Les participants sont amenés à comprendre les concepts-clé du reinforcement learning et de ses évolutions récentes.
Tensor, autograd, torch.n, Module, torch.optim, tensorboard, torchvision examples, TorchScript, torch.hub, torch.utils.dat