Comprendre l’apprentissage automatique (machine learning) avec KNIME

Vendredi 8 mai 2020, 9h-17h

Cette formation est destinée à toute personne souhaitant comprendre les principes de base de l’apprentissage automatique (machine learning).

Ce cours fournit une introduction à l’analyse des données et à l’apprentissage automatique, y compris les applications du logiciel facile d’utilisation “KNIME”. L’analyse de données vise à analyser des données pour détecter des modèles informatifs et tirer des conclusions sur des processus spécifiques (comportement des clients, production, chiffre d’affaires…). Un sous-domaine est l’apprentissage automatique (supervisé), qui vise à prédire un résultat dans le futur, par exemple les ventes, sur la base de l’analyse des modèles de facteurs potentiellement pertinents (ou “prédicteurs”) comme le prix, la qualité, etc. dans les données passées. Ce cours aborde les outils importants de prédiction (tels que la régression et les arbres de décision), en mettant l’accent sur l’intuition des différentes méthodes plutôt que sur les détails techniques. Ces outils sont appliqués à l’analyse de données commerciales dans “KNIME”, qui est un logiciel libre et gratuit. “KNIME” est basé sur une interface graphique qui représente toutes les étapes de l’analyse par un organigramme intuitif et ne nécessite pas de compétences en programmation. “KNIME” est donc idéal pour ceux qui souhaitent appliquer l’analyse de données et l’apprentissage machine sans avoir à apprendre un langage de programmation.

Objectifs 

– Comprendre l’idée et les objectifs de l’analyse des données et de l’apprentissage automatique

– Comprendre l’intuition, les avantages et les inconvénients des méthodes alternatives

– Appliquer les méthodes aux données du monde réel en utilisant le logiciel “KNIME”

Contenu 

– Introduction au concept et à l’objectif de l’analyse des données et de l’apprentissage automatique

– Régression linéaire et non linéaire (OLS, logit regression)

– Régression pénalisée pour la sélection variable et le rétrécissement (lasso and ridge regression)

– Approches basées sur les arbres (trees, bagging, random forest)

– Mise au point du modèle (cross-validation)

– Évaluation des performances (out-of-sample testing)

– Application de toutes les méthodes aux données commerciales à l’aide du logiciel statistique “KNIME”

Référence

Les diapositives du cours sont basées sur “An Introduction to Statistical Learning with Applications in R” de Gareth James, Daniela Witten, Trevor Hastie et Robert Tibshirani (Springer, New York, 2013). Le manuel est disponible en format pdf à l’adresse http://www-bcf.usc.edu/~gareth/ISL/.

Informations complémentaires

Les participant∙e∙s sont prié∙e∙s d’apporter leur propre ordinateur portable et d’installer KNIME avant le début du cours. Veuillez consulter le guide d’installation suivant : https://www.youtube.com/watch?v=yeHblDxakLk. (Nous contacter si cela n’est pas possible).

Le nombre maximum de participants est de 18.

Le coût de la journée de formation est de 500 CHF / de 400 CHF pour les membres de Swiss Engineering-section Fribourg

Inscription :

 
 

Verification

 

Mathématiques à votre service