tidyverse: une librairie R moderne de gestion de données

Mercredi 16 Octobre 2019, 9h -17h

Souvent, l’analyse de données peut être un défi, non seulement à cause de méthodes statistiques sophistiquées, mais tout d’abord à cause de données non structurées. Le succès d’une bonne analyse pourrait dépendre essentiellement d’un accès approprié à la base de données. Ainsi, disposer d’un système puissant de gestion des données est extrêmement important pour l’analyse. Grâce au package tidyverse, l’analyste de données dispose d’un moyen moderne et intelligent pour résoudre cette question.

Ce cours d’une journée est donné par Rédina Berkachy du groupe ASAM (Applied Statistics And Modelling, Département d’informatique, Université de Fribourg). Il s’adresse à toute personne familiarisée avec le logiciel R et souhaitant apprendre les concepts fondamentaux de l’écosystème tidyverse et traiter des problèmes de données à grande échelle dans un environnement nouveau et moderne.

tidyverse, développé par Hadley Wickham, est un écosystème de packages cohérent et en constante évolution, qui a pour objectif de préparer, d’explorer et de visualiser des données. Il repose sur une “philosophie” particulière pour gérer les bases de données. Ce système très moderne a récemment attiré beaucoup d’attention. En tant que tel, il a été propagé dans de nombreux domaines d’applications.

Les atouts de tidyverse sont ses fonctions cohérentes et productives. Le package offre des couvertures efficaces du flux de travail, une productivité supérieure et des produits reproductibles. Le système est basé sur les connexions entre les différents outils de programmation et de science des données, ceux-ci facilitant le flux de travail de tout statisticien et informaticien. Le package comprend une collection complète de fonctions prenant en charge le flux de travail de bout en bout pour une grande variété d’analyses. Enfin et surtout, il fournit une méthode d’apprentissage didactique qui permet à un utilisateur “non-expérimenté” de préparer facilement une base de données non structurée.

Le cours est basé sur le livre “R for data science” de Hadley Wickham et Garrett Grolemund.

 Objectifs

À la fin du cours, vous serez à l’aise avec les outils tidyverse et aurez acquis principalement les compétences suivantes:

  • connaitre et maîtriser les différentes étapes d’un flux de travail fourni par tidyverse;
  • tester et appliquer les packages et fonctions fondamentales de l’écosystème tidyverse;
  • importer, ranger et explorer une base de données en désordre.

Matériel de cours

Les participant∙e∙s se munissent d’un ordinateur portable pour pouvoir utiliser le logiciel. (nous contacter s’il vous plait si cela n’est pas possible)

Informations complémentaires

La dernière version de R and RStudio est installée avant le cours.

Le nombre maximum de participant∙e∙s est de 18..

Le coût de la journée de formation est de 500 CHF / de 400 CHF pour les membres de Swiss Engineering-section Fribourg

Mathématiques à votre service