headerFribourgLong

Introduction au machine learning avec R

DERNIERE EDITION : Mardi 6 novembre 2018, 9h – 17h

Cette formation est conçue pour toute personne désireuse de comprendre les fondements du “machine Learning”. Elle est donnée en anglais par Prof. Martin Huber.

Ce cours propose une introduction au « machine learning » avec le logiciel R. Le « Machine learning » a pour objectif de prédire le comportement d’une variable d’intérêt, comme les ventes ou le chiffre d’affaires, à partir de l’identification d’interactions de facteurs potentiellement pertinents (« predictors ») comme le prix, la qualité, la météo, la publicité, etc… Fondamentalement, les méthodes statistiques employées permettent un apprentissage à partir de données antérieures pour prédire la variable d’intérêt dans le futur. Le cours présente en premier lieu la base intuitive et l’utilité du « machine learning » pour la prédiction et la prise de décision. Ensuite, nous introduisons différentes approches statistiques telles que l’arborescence (tree-based methods). Celles-ci seront illustrées et pratiquées avec le logiciel « R » et son interface « R-Studio » sur des données réelles.

Objectifs

  • comprendre l’idée et les objectifs du « machine learning »
  • évaluer les avantages et désavantages de méthodes statistiques alternatives
  • être capable d’utiliser les méthodes de “machine learning”, abordées à l’aide du logiciel « R » et son interface « R-Studio », et appliquées à des données réelles

Contenu

  • Introduction au concept et au but du « machine learning »
  • Régression linéaire et non- linéaire (OLS, logit regression)
  • Sélection et retrait des variables (lasso et ridge regression)
  • Approches d’arborescence (trees, bagging, random forests)
  • Validation de modèles (cross-validation)
  • Evaluation de performance (out-of-sample testing)
  • Application de toutes les méthodes en utilisant l’apprentissage
  • Logiciel “R” et son interface “R Studio”

Support de cours

Diapositives de cours et code R des illustrations de méthodes

Référence: “An Introduction to Statistical Learning with Applications in R” by Gareth James, Daniela Witten, Trevor Hastie, and Robert Tibshirani (Springer, New York, 2013).  Le texte est disponible en pdf à l’adresse http://www-bcf.usc.edu/~gareth/ISL/.

Further information:

Les notions de base du logiciel R sont supposées connues. A cette fin, vous pouvez suivre la formation proposée par FRISAM le mardi 30 octobre 2018.

Les participant∙e∙s se muniront d’un ordinateur portable pour utiliser le logiciel (nous contacter si ce n’est pas possible)

Le nombre maximal de participant∙e∙s est 18.

Le coût de la journée de formation est 500 CHF / 400 CHF pour les membres de Swiss Engineering-section Fribourg

Mathématiques à votre service