Apprentissage en Contexte

Informations

ResponsableStéphane Canu
Enseignant(s)Stéphane Canu, Alain Rakotomamonjy
LangueFrançais ou Anglais
Crédits4.5
Volume horaireCM : 18h TD : 18h
OptionIngénierie des données
Site webhttps://moodle.insa-rouen.fr/course/view.php?id=848

Objectifs

  • Découvrir un panorama des méthodes récentes d'apprentissage statistique.
  • Maitriser l'apprentissage de dictionnaires pour la réprésentation des signaux et images (débruitage).
  • Connaitre la factorisation de matrices (exemple des systèmes de recommandation).

Capacités enseignées

  • Référentiel INSA :
    • Concevoir un système d'ingénierie des données [3P]
    • Diagnostiquer des erreurs dans des données [3P]
  • Référentiel CNISF :
    • J10P [2P]
    • J40K [1P]
1 - notion, 2 - théorisation, 3 - application, I - intégralement, P - partiellement

Programme

  • Introduction
    • Démélange de sources audio
  • Apprentissage, Régularisation et optimisation
    • Regularisation L2 vs L1
    • Exemple pénalité L1
    • Sous-gradient et dualité de Fenchel
  • Dualité lagrangienne
  • Régression parcimonieuse
    • Ridge regression
    • Lasso
  • Méthode proximale pour l'optimisation
  • Apprentissage de dictionnaires ou factorisation de matrices
    • Méthodes alternées (MOD)
    • Contraintes sur la décomposition (Alternate ISTA)
  • Domaines d'application vus en cours
    • Restauration d'images
    • Systèmes de recommandation (factorisation de matrices)
    • Débruitage de signaux (approximation parcimonieuse)

Pré-requis

Data Mining, Statistiques, Traitement du Signal

Bibliographie

  • "Convex optimization" S. Boyd and L. Vandenberghe
  • "Proximal algorithms" N. Parikh and S. Boyd dans Foundations and Trends in Optimization, 1(3):123-231, 2013

Méthode d'évaluation

  • Examen final : 50%
  • Projet : 50%