PRO1036 - Analyse de données scientifiques en R
September 8, 2025
Développement:
Gestion et collaboration:
À la fin de ce cours, vous pourrez:
répétableoutils de programmation modernescollaborative, avec des outils de programmation modernesQue signifie conduire une analyse de donnée de manière répétable ?
À court-terme:
À long-terme:
Scriptability \(\rightarrow\) R
Documentation et communication \(\rightarrow\) R Markdown
Gestion et collaboration \(\rightarrow\) Git/GitHub

open-sourcecalculs statistiques et de la visualisationpackages
Les packages sont les building blocks de la reproductibilité. Ils contiennent de nombreuses fonctions réutilisables, de la documentation et données de test (Wickham and Bryan, 2023)
Nous allons en utiliser quelques une mais vous verrez que c’est tout une philosophie !
Les fonctions sont souvent des verbes, suivi de parenthèses, contenant des arguments:
Les packages peuvent être installés avec install.package et chargés avec library:

Le Tidyverse est une collection de packages développés pour faire de la data science
Il y a une philophie et une grammaire commune à tous ces packages, que nous allons apprendre.
R Markdown permet d’écrire des documents avec du code intégré (extension en .Rmd).
Va permettre de documenter et de communiquer directement nos analyses de données !

Cheatsheet
Help > Cheatsheet

Markdown Quick Reference
Help > Markdown Quick Reference

Développement:
Gestion et collaboration:

gestion de version

repo Git
Git peut être utilisé depuis le terminal de commande
Github:
Pour le faire chez vous:
unvotes.rmdknit
PRO1036 - 01 | Tim Bollé