Deep learning et traitement du son

Formation Deep learning et traitement du son

Avec le succès d'assistants vocaux du type Alexa/Siri/Google, le deep learning a fait rentrer le traitement du son et de la parole dans le quotidien du grand public. Les sujets abordés sont la reconnaissance de la parole, le débruitage, la classification, le tagging audio et la séparation de l'audio (parole & musique)..
  • Durée : 2 jours
  • Public: Ingénieurs, data-scientists
  • Pré-requis : Bases de programmation python
  • Technicite ★★☆☆☆
  • Modalités : Formation intra, à distance ou dans vos locaux (minimum 4 stagiaires)
  • Annulation : sans frais jusqu’à 3 semaines avant. Au-delà, 25% de la somme est due.
  • Modalités de paiement : Paiement à 30 jours.

Résumé

Avec le succès d’assistants vocaux du type Alexa/Siri/Google, le deep learning a fait rentrer le traitement du son et de la parole dans le quotidien du grand public.
Les sujets abordés sont la reconnaissance de la parole, le débruitage, la classification, le tagging audio et la séparation de l’audio (parole & musique)..

Moyens techniques : Support de cours projeté pendant la formation et transmis à l’ensemble des stagiaires à l’issue de la formation; cas et exemples pratiques choisis selon les domaines d’intérêt des stagiaires
Suivi de l’exécution : Emargement demandé chaque demie-journée à tous les stagiaires
Évaluation : Questionnaire d’évaluation des acquis à l’issue de la formation
Appréciation des résultats : Questionnaire de satisfaction à l’issue de la formation

Objectifs pédagogiques

Cours théoriques mêlés d’exemples et d’études de cas. Cette formation vise à présenter les principaux problèmes rencontrés

Technologies abordées

LSTM, U-Net, CNN, Fourier, Wiener filter, ngram, language model, acoustic model, state-space model, Kaldi, PyTorch, deep clustering, TASnet, tacotron, wavenet

Compétences visées

  • Bases en traitement du signal audio
  • Reconnaissance de la parole: concepts classiques, état de l’art
  • Débruitage, séparation, filtrage
  • Classification, tagging
  • Synthese vocale et musicale