Chapter 2 R en quelques mots

2.1 Pourquoi ?

Langage de programmation qui permet de : - manipuler des données : importer, transformer, exporter faire des analyses statistiques plus ou moins complexes : description, exploration, modélisation… - créer des (jolies) figures

2.2 Comment l’avoir ?

Disponible sur RCRAN

2.3 Sur quel OS ?

Tous !

2.4 Historique

  • 1993 : Début du projet R
  • 2000 : sortie de R 1.0.0
  • 2022 : R 4.2.2

2.5 R vs Excel

Source: R-bloggers

2.5.1 Pourquoi plus Excel ?

Un exemple parmi tant d’autres !

Source Alexandre Counis, Les Echos, 5 oct. 2020

2.6 Avantages et inconvénients

2.6.1 Avantages

  • Souplesse d’utilisation pour réaliser des analyses statistiques
  • Libre et gratuit, même s’il existe maintenant des versions payantes de RStudio (shiny et/ou server)
  • Reproductibilité des analyses en écrivant/sauvegardant les commandes R dans des scripts
  • Large communauté d’utilisateurs/aide en ligne
  • Grand nombre de packages spécifiques

2.6.2 Inconvénients

2.7 Geeks and repetitive tasks

2.8 R sait tout faire

Lire un tableau de données

read.table()

Fusionner deux tableaux

merge()

Filtrer des lignes

data[data$x > 10]

Sélectionner des colonnes

data[,c(“x”,”y”)]

Rechercher une chaîne de caractères

grep()

Réaliser une ACP

prcomp()

Calculer une moyenne

mean()

Additionner deux matrices

mat1 + mat2

Exporter un tableau de données

write.table()

Calculer une variance

var()

Régression linéaire

lm()

Tracer une courbe

plot()

Tester une hypothèse

t.test()

Dessiner un histogramme

hist()

Convertir des données

as.matrix()