Public : Ingénieurs, data-scientists
Durée : 2 jours
Tarif : 600€ par élève et par jour (min. 3 élèves)
● Bases en traitement du signal audio ● Reconnaissance de la parole concepts classiques, état de l’art ● Débruitage, séparation, filtrage Classification, tagging ● Synthèse vocale et musicale
LSTM, U-Net, CNN, Fourier, Wiener filter, ngram, language model, acoustic model, state-space model, Kaldi, PyTorch, deep clustering, TASnet, tacotron, wavenet
Parole, entertainment, sécurité, centre d’appels, aéronautique, automobile, téléphonie, ...