Aureliennicosia.files.wordpress.com



# Introduction à R et R studio# Chaque ligne est une commande, et pour exécuter une commande il suffit de cliquer sur Run ou Ctrl+Enter2+2# commentaires!## Packages# Pour utiliser les fonctions d'un package en particulier, # il faut d'abord voir s'il est disponible dans votre version de R. # Vous pouvez vous aider de l'onglet "Packages". # Si celui-ci n'est pas disponible, il suffit de le télécharger avec:install.packages("ggplot2", "read_excel")# Une fois que le package est installé, il suffit de le charger library(ggplot2)# Importation de données# Vous pouvez utiliser directement la commande "Import Dataset" dans l'onglet Environment.dat <- read_excel("~/Dropbox/Conference/CBS ulaval/Statistiques Projet Morgane.xlsx", sheet = "STAT")# Manipulation de données## Information disponible dans les données# On peut accéder à une colonne d'une BD avec le symbole $, tel que (remarquer l'auto complétion) : dat$`Frequency (kHz)`dat$`Gap [mm]`#Voici quelques autres commandes utiles: dim(dat)str(dat)colnames(dat)# Si on veut maintenant une ligne (observation) en particulier de la BD,dat[23,] # pour la 23 ieme observationdat$Reactor[12] # 12ieme observation de la colonne Reactor## Inspection de la base de donnée via Rstudio:# Dans l'onglet "Environement", cliquer sur votre BD, une nouvelle fenêtre va s'ouvrir## Manipulation de données avec dplyr# Aujourd'hui dplyr est un package extrêmement populaire et utilisé car # celui-ci permet de faire de la manipulation de données efficacement.# Voici quelque trucs de base à savoir sur ce package# - Toute les fonctions s'appliquent directement sur votre BD# - L'opérateur appelé "pipe" (%>%) permet de multiplier efficacement les opérations sur votre BD# - La fonction filter, permet de filter les observations# - La fonction select, permet de selectionner des colonnes# - la fonction mutate, permet de calculer une nouvelle variable# - la fonction group_by, permet de grouper les observations pour pouvoir effectuer ensuite des calculs par groupe# - la fonction summarise, permet de résumé une BD tel que vous le souhaitez# Quelque exemples:dat %>% filter( Reactor == "Planar DLPA3")dat = dat %>% mutate( `% test moyen` = ( `%C Test1` / `%O Test1` + `%C Test2` / `%O Test2` + `%C Test3` / `%O Test3`)/3) dat %>% summarise(m_freq = mean(`Frequency (kHz)`), p = mean(Reactor == "Planar DLPA3") )dat %>% group_by(Substrate) %>% summarise(m_freq = mean(`Frequency (kHz)`))# Graphiquelibrary(ggplot2)ggplot(dat, aes(x = `Position analyzed on the coating (cm)`, y = `Energy [W.cm-2] - grandeur calculée`, color = Reactor)) + geom_point()+ ggtitle("Mon titre", "Mon sous titre")# Statistique de basesummary(dat) # sommaire des donnéessummary(dat$`Frequency (kHz)`)mean(dat$`%C Test2`) # moyennesd(dat$`%C Test2`) # ecart-type# t.test# but: comparer deux groupes entres eux# H0: il n'y a pas de différence entre les deux groupes# H1: il y a une différencet.test(`% test moyen` ~Reactor, data = dat)# Anova# but: comparer plus que 2 groupes entre eux# H0: il n'y a pas de différence entre les groupes# H1: au moins 2 groupes sont différentsdat$`Frequency (kHz)` <- as.factor(dat$`Frequency (kHz)`)ggplot(data = dat, aes( x = `Frequency (kHz)` , y = `Energy [W.cm-2] - grandeur calculée`, color = `Frequency (kHz)`)) + geom_boxplot()fit = lm(`Energy [W.cm-2] - grandeur calculée` ~`Frequency (kHz)`, data = dat)anova(fit) # table d'anova# Regression simplefit = lm(`%C Test1` ~ `%O Test1`, data = dat)summary(fit)ggplot(data = dat, aes( x = `%C Test1`, y = `%O Test1`)) + geom_point()+ geom_smooth(method = "lm")# Regression multiplefit = lm(`%C Test1` ~ `%O Test1` + `Energy [W.cm-2] - grandeur calculée`+ `%O Test3`, data = dat)summary(fit) ................
................

In order to avoid copyright disputes, this page is only a partial summary.

Google Online Preview   Download