headerFribourgLong

Introduction au machine learning avec R

Fribourg Pérolles, vendredi 21 mai  2021, 9:00-17:00

(si légalement possible en mode présentiel, en cas de confinement en mode à distance)

Cette formation est conçue pour toute personne désireuse de comprendre les fondements du “machine Learning”. Elle est donnée en anglais par Prof. Martin Huber.

Ce cours propose une introduction au « machine learning » avec le logiciel R. Le « Machine learning » a pour objectif de prédire le comportement d’une variable d’intérêt, comme les ventes ou le chiffre d’affaires, à partir de l’identification d’interactions de facteurs potentiellement pertinents (« predictors ») comme le prix, la qualité, la météo, la publicité, etc… Fondamentalement, les méthodes statistiques employées permettent un apprentissage à partir de données antérieures pour prédire la variable d’intérêt dans le futur. Le cours présente en premier lieu la base intuitive et l’utilité du « machine learning » pour la prédiction et la prise de décision. Ensuite, nous introduisons différentes approches statistiques telles que l’arborescence (tree-based methods). Celles-ci seront illustrées et pratiquées avec le logiciel « R » et son interface « R-Studio » sur des données réelles.

Objectifs

  • comprendre l’idée et les objectifs du « machine learning »
  • évaluer les avantages et désavantages de méthodes statistiques alternatives
  • être capable d’utiliser les méthodes de “machine learning”, abordées à l’aide du logiciel « R » et son interface « R-Studio », et appliquées à des données réelles (voir aussi notre cours d’introduction à R)

Contenu

  • Introduction au concept et au but du « machine learning »
  • Régression linéaire et non- linéaire (OLS, logit regression)
  • Sélection et retrait des variables (lasso et ridge regression)
  • Approches d’arborescence (trees, bagging, random forests)
  • Validation de modèles (cross-validation)
  • Evaluation de performance (out-of-sample testing)
  • Application de toutes les méthodes en utilisant l’apprentissage
  • Logiciel “R” et son interface “R Studio”

Support de cours

Diapositives de cours et code R des illustrations de méthodes

Référence: “An Introduction to Statistical Learning with Applications in R” by Gareth James, Daniela Witten, Trevor Hastie, and Robert Tibshirani (Springer, New York, 2013).  Le texte est disponible en pdf à l’adresse http://www-bcf.usc.edu/~gareth/ISL/.

Further information:

Les notions de base du logiciel R sont supposées connues. A cette fin, vous pouvez suivre le cours d’introduction à R proposé par FRISAM le vendredi 12 février 2021.

Les participant∙e∙s se muniront d’un ordinateur portable pour utiliser le logiciel (nous contacter si ce n’est pas possible)

Le nombre maximal de participant∙e∙s est 18.

Le coût de la journée de formation est 500 CHF / 400 CHF pour les membres de Swiss Engineering-section Fribourg

 
 

Verification

Mathématiques à votre service