Méthodes de fouilles de données et d'apprentissage

Informations

ResponsableRomain Hérault
Enseignant(s)Romain Hérault, Stéphane Canu
LangueFrançais ou anglais
Crédits4.5
Volume horaireCM : 18h TD : 18h
OptionIngénierie des données
Site webhttps://moodle.insa-rouen.fr/course/view.php?id=200

Objectifs

  • Familiariser les étudiants aux problèmes liés à l'analyse de grandes masses de données.
  • Connaitre les approches non linéaires issues de la théorie statistique de l'apprentissage.
  • Savoir mettre en oeuvre ces approches à l'aide d'un logiciel comme matlab ou scilab.

Capacités enseignées

  • Référentiel INSA :
    • Concevoir un système d'ingénierie des données [3P]
    • Déterminer des classes de problèmes [3P]
  • Référentiel CNISF :
    • J40K [1P]
    • J10C [2I]
1 - notion, 2 - théorisation, 3 - application, I - intégralement, P - partiellement

Programme

  • Méthodes non linéaires pour la fouille de données
  • Approches probabilistes
  • Machines à noyaux
  • Réseaux de neurones
  • Arbres de décision et foret
  • Mélange de classifieurs

Pré-requis

  • Fouille de données

Bibliographie

  • Trevor Hastie, Robert Tibshirani and Jerome Friedman, The Elements of Statistical Learning:. Data Mining, Inference, and Prediction, springer, 2001
  • John Shawe-Taylor and Nello Cristianini Kernel Methods for Pattern Analysis, Cambridge University Press, 2004
  • Bernhard Schölkopf and Alex Smola. Learning with Kernels. MIT Press, Cambridge, MA, 2002.

Méthode d'évaluation

  • Contrôle continu : 40%
  • Examen : 60%