Aurélien Nicosia



# Introduction à R et R studio# Chaque ligne est une commande, et pour exécuter une commande il suffit de cliquer sur Run ou Ctrl+Enter2+2# commentaires!## Packages# Pour utiliser les fonctions d'un package en particulier, # il faut d'abord voir s'il est disponible dans votre version de R. # Vous pouvez vous aider de l'onglet "Packages". # Si celui-ci n'est pas disponible, il suffit de le télécharger avec:install.packages("ggplot2", "read_excel")# Une fois que le package est installé, il suffit de le charger library(ggplot2)# Importation de données# Vous pouvez utiliser directement la commande "Import Dataset" dans l'onglet Environment.dat <- read_excel("~/Dropbox/Conference/CBS ulaval/Statistiques Projet Morgane.xlsx", sheet = "STAT")# Manipulation de données## Information disponible dans les données# On peut accéder à une colonne d'une BD avec le symbole $, tel que (remarquer l'auto complétion) : dat$`Frequency (kHz)`dat$`Gap [mm]`#Voici quelques autres commandes utiles: dim(dat)str(dat)colnames(dat)# Si on veut maintenant une ligne (observation) en particulier de la BD,dat[23,] # pour la 23 ieme observationdat$Reactor[12] # 12ieme observation de la colonne Reactor## Inspection de la base de donnée via Rstudio:# Dans l'onglet "Environement", cliquer sur votre BD, une nouvelle fenêtre va s'ouvrir## Manipulation de données avec dplyr# Aujourd'hui dplyr est un package extrêmement populaire et utilisé car # celui-ci permet de faire de la manipulation de données efficacement.# Voici quelque trucs de base à savoir sur ce package# - Toute les fonctions s'appliquent directement sur votre BD# - L'opérateur appelé "pipe" (%>%) permet de multiplier efficacement les opérations sur votre BD# - La fonction filter, permet de filter les observations# - La fonction select, permet de selectionner des colonnes# - la fonction mutate, permet de calculer une nouvelle variable# - la fonction group_by, permet de grouper les observations pour pouvoir effectuer ensuite des calculs par groupe# - la fonction summarise, permet de résumé une BD tel que vous le souhaitez# Quelque exemples:dat %>% filter( Reactor == "Planar DLPA3")dat = dat %>% mutate( `% test moyen` = ( `%C Test1` / `%O Test1` + `%C Test2` / `%O Test2` + `%C Test3` / `%O Test3`)/3) dat %>% summarise(m_freq = mean(`Frequency (kHz)`), p = mean(Reactor == "Planar DLPA3") )dat %>% group_by(Substrate) %>% summarise(m_freq = mean(`Frequency (kHz)`))# Graphiquelibrary(ggplot2)ggplot(dat, aes(x = `Position analyzed on the coating (cm)`, y = `Energy [W.cm-2] - grandeur calculée`, color = Reactor)) + geom_point()+ ggtitle("Mon titre", "Mon sous titre")# Statistique de basesummary(dat) # sommaire des donnéessummary(dat$`Frequency (kHz)`)mean(dat$`%C Test2`) # moyennesd(dat$`%C Test2`) # ecart-type# t.test# but: comparer deux groupes entres eux# H0: il n'y a pas de différence entre les deux groupes# H1: il y a une différencet.test(`% test moyen` ~Reactor, data = dat)# Anova# but: comparer plus que 2 groupes entre eux# H0: il n'y a pas de différence entre les groupes# H1: au moins 2 groupes sont différentsdat$`Frequency (kHz)` <- as.factor(dat$`Frequency (kHz)`)ggplot(data = dat, aes( x = `Frequency (kHz)` , y = `Energy [W.cm-2] - grandeur calculée`, color = `Frequency (kHz)`)) + geom_boxplot()fit = lm(`Energy [W.cm-2] - grandeur calculée` ~`Frequency (kHz)`, data = dat)anova(fit) # table d'anova# Regression simplefit = lm(`%C Test1` ~ `%O Test1`, data = dat)summary(fit)ggplot(data = dat, aes( x = `%C Test1`, y = `%O Test1`)) + geom_point()+ geom_smooth(method = "lm")# Regression multiplefit = lm(`%C Test1` ~ `%O Test1` + `Energy [W.cm-2] - grandeur calculée`+ `%O Test3`, data = dat)summary(fit) ................
................

In order to avoid copyright disputes, this page is only a partial summary.

Google Online Preview   Download

To fulfill the demand for quickly locating and searching documents.

It is intelligent file search solution for home and business.

Literature Lottery

Related download
Related searches