Introdução ao uso do programa R

Instituto Nacional de Pesquisas da Amaz?nia Programa de P?s Gradua??o em Ecologia

Introdu??o ao uso do programa R

Victor Lemes Landeiro Instituto Nacional de Pesquisas da Amaz?nia

Coordena??o de Pesquisas em Ecologia vllandeiro@

The R Project for Statistical Computing

Quaisquer cr?ticas ou sugest?es para melhorar a qualidade desta apostila podem ser enviadas para Victor Landeiro, vllandeiro@.

4 de mar?o de 2011

1

Conte?do

Nota sobre o uso desta apostila:................................................................................................................................................. 1 Como Instalar o R ................................................................................................................................................................. 1 Windows .......................................................................................................................................................................... 1 A cara do R: .......................................................................................................................................................................... 1 No??es gerais sobre o R........................................................................................................................................................ 2 O workspace do R (?rea de trabalho). ................................................................................................................................... 2 Pacotes do R ......................................................................................................................................................................... 3 Como usar um pacote do R .............................................................................................................................................. 3 Como citar o R, ou um pacote do R em publica??es........................................................................................................ 3

Uso inicial do R ......................................................................................................................................................................... 4 O R como calculadora........................................................................................................................................................... 4 Fun??es do R ........................................................................................................................................................................ 4 Como acessar a ajuda do R (help)......................................................................................................................................... 4 Usando algumas fun??es ...................................................................................................................................................... 5 Objetos do R (O que s?o?): ................................................................................................................................................... 6 Demonstra??es...................................................................................................................................................................... 6 > demo(image)...................................................................................................................................................................... 6 Como criar objetos................................................................................................................................................................ 6 Objetos vetores com valores num?ricos........................................................................................................................... 6 Objetos vetores com caracteres (letras, vari?veis categ?ricas)......................................................................................... 6 Opera??es com vetores ......................................................................................................................................................... 7 Acessar valores dentro de um objeto [colchetes] ............................................................................................................. 7 Transformar dados ................................................................................................................................................................ 8 Listar e remover objetos salvos............................................................................................................................................. 8 Gerar seq??ncias (usando : ou usando seq)........................................................................................................................... 8 : (dois pontos) .................................................................................................................................................................. 8 seq.................................................................................................................................................................................... 8 Gerar repeti??es (rep) ........................................................................................................................................................... 8 rep .................................................................................................................................................................................... 8 Gerar dados aleat?rios .......................................................................................................................................................... 9 runif (Gerar dados aleat?rios com distribui??o uniforme) ............................................................................................... 9 rnorm (Gerar dados aleat?rios com distribui??o normal)................................................................................................. 9 Fazer amostras aleat?rias ...................................................................................................................................................... 9 A fun??o sample .............................................................................................................................................................. 9

Ordenar e atribuir postos (ranks) aos dados ............................................................................................................................ 10 fun??es: sort, order e rank................................................................................................................................................... 10 sort ................................................................................................................................................................................. 10 order............................................................................................................................................................................... 10 rank ................................................................................................................................................................................ 10 Relembrando o que ? o workspace................................................................................................................................. 11

Exerc?cios com opera??es b?sicas ........................................................................................................................................... 11 Script do R............................................................................................................................................................................... 12

Usar o script do R para digitar os comandos....................................................................................................................... 12 Exerc?cios com o script do R .............................................................................................................................................. 13 Gr?ficos do R........................................................................................................................................................................... 13 PLOTS ................................................................................................................................................................................ 13 Gr?ficos de barras ............................................................................................................................................................... 14 Gr?ficos de pizza ................................................................................................................................................................ 14 Gr?fico de pontos (gr?ficos de dispers?o)........................................................................................................................... 14

Gr?ficos com vari?veis num?ricas ................................................................................................................................. 14 Alterando a apar?ncia do gr?fico ........................................................................................................................................ 14

Adicionando linhas a um gr?fico de pontos ................................................................................................................... 15 Adicionar mais pontos ao gr?fico .................................................................................................................................. 15 Gr?ficos com vari?veis explanat?rias que s?o categ?ricas.................................................................................................. 15 Inserir texto em gr?ficos ..................................................................................................................................................... 16 Dividir a janela dos gr?ficos ............................................................................................................................................... 17 Salvar os gr?ficos................................................................................................................................................................ 17 Resumo sobre gr?ficos........................................................................................................................................................ 18 Exerc?cios com gr?ficos........................................................................................................................................................... 18 Manejo de dados...................................................................................................................................................................... 20 Importar conjunto de dados para o R .................................................................................................................................. 20 Procurar os dados dentro do computador............................................................................................................................ 21 Transformar vetores em matrizes e data frames.................................................................................................................. 21 Acessar partes da tabela de dados (matrizes ou dataframes) ............................................................................................... 21 Opera??es usando dataframes ............................................................................................................................................. 22 Ordenar a tabela ............................................................................................................................................................. 22 Calcular a m?dia de uma linha ou de uma coluna .......................................................................................................... 22 Somar linhas e somar colunas ........................................................................................................................................ 23

2

Medias das linhas e colunas ........................................................................................................................................... 23 Exemplo com dados reais ................................................................................................................................................... 23 As fun??es aggregate e by .................................................................................................................................................. 26 Transpor uma tabela de dados............................................................................................................................................. 26 Comandos de l?gica ................................................................................................................................................................ 26 Op??es para manipular conjunto de dados.......................................................................................................................... 26

which ............................................................................................................................................................................. 27 ifelse .............................................................................................................................................................................. 27 Exerc?cios com dataframes e comandos de l?gica:.................................................................................................................. 27 Criar Fun??es (programa??o) .................................................................................................................................................. 28 Sintaxe para escrever fun??es ............................................................................................................................................. 28 Criando uma fun??o (function) ........................................................................................................................................... 29 Comando function.......................................................................................................................................................... 29 O comando for ............................................................................................................................................................... 30 Exerc?cios de criar fun??es:..................................................................................................................................................... 34 Diferen?a entre criar uma fun??o e escrever um c?digo .......................................................................................................... 34 Estat?stica ................................................................................................................................................................................ 36 Estat?stica descritiva ........................................................................................................................................................... 36 M?dia aritm?tica ............................................................................................................................................................ 36 Vari?ncia e o Desvio Padr?o.......................................................................................................................................... 36 Quartis e mediana .......................................................................................................................................................... 36 Estat?stica univariada .......................................................................................................................................................... 37 Regress?o Linear Simples .............................................................................................................................................. 37 Regress?o M?ltipla ........................................................................................................................................................ 38 Teste-t e teste-t pareado ................................................................................................................................................. 38 An?lise de Vari?ncia (Anova)............................................................................................................................................. 39 ?rvore de regress?o ............................................................................................................................................................ 39 Testes de Monte Carlo (randomiza??es) ............................................................................................................................. 40 Bootstrap........................................................................................................................................................................ 40 Jackknife ........................................................................................................................................................................ 40 Estat?stica multivariada ....................................................................................................................................................... 40 Transforma??es e padroniza??es de dados .................................................................................................................... 40 ?ndices de associa??o/similaridade/dissimilaridade/dist?ncia ........................................................................................ 40 Ordena??es: ........................................................................................................................................................................ 41 An?lise de componentes principais (PCA)..................................................................................................................... 41 An?lise de Coordenadas Principais (PCoA)................................................................................................................... 42 Escalonamento Multimenssional N?o M?trico (NMDS) ............................................................................................... 43 An?lise de Correspond?ncia Can?nica (CCA) ............................................................................................................... 43 An?lise de Redund?ncia (RDA)..................................................................................................................................... 44 Classifica??es (An?lises de Cluster) ................................................................................................................................... 44 ?rvore de regress?o multivariada .................................................................................................................................. 44 Cluster hier?rquico......................................................................................................................................................... 45 Cluster aglomerativo (UPGMA e outros) ...................................................................................................................... 46 Ward's Minimum Variance Clustering .......................................................................................................................... 46 Correla??o cofen?tica .................................................................................................................................................... 46

1

Nota sobre o uso desta apostila:

O objetivo desta apostila ? fazer uma breve introdu??o ao uso do programa R (R Development Core Team 2008). Seu intuito n?o ? ensinar estat?stica. O formato como esta apostila foi escrita foi planejado para que a apostila seja usada durante disciplinas b?sicas de introdu??o ao R (principalmente para pessoas que nunca usaram o R) acompanhados de um professor e monitores. Porem isso n?o impede que voc? utilize a apostila sozinho em seus estudos.

O ideal para aprender a usar o R ? "us?-lo!". Ent?o, a melhor forma de se familiarizar com os comandos do R ? ler um texto introdut?rio (como esta apostila) e ao mesmo tempo ir digitando os comandos no R e observando os resultados, gr?ficos, etc. Apenas ler esta apostila talvez n?o o ajude a fazer progressos no seu aprendizado do R, acompanhe-a fazendo os c?lculos no R. Ler os manuais dispon?veis na p?gina do R como o "An introduction to R" que vem com o R e o "Simple R" de John Verzani [], pode ser de grande ajuda no come?o. Outro manual bem curto (49 p?ginas) e f?cil de entender ? o The R Guide de W. J. Owen dispon?vel em . Na p?gina do R tamb?m existem v?rios manuais em portugu?s, caso n?o goste de ler em ingl?s. Aprender a usar o R pode ser dif?cil e trabalhoso, mas lembre-se, o investimento ser? para voc?!

John Chambers (2008, pp. v) escreveu no pref?cio de seu livro: "Ser? que ? proveitoso gastar tempo para desenvolver e estender habilidades em programa??o? Sim, porque o investimento pode "contribuir" com sua habilidade em formular quest?es e na confian?a que voc? ter? nas respostas". Para os bi?logos/ec?logos, veja tamb?m no site do ec?logo Nicholas J. Gotelli alguns conselhos para ser um bom pesquisador e para querer aprender a usar o R: .

Nesta apostila as notas e explica??es est?o em letra arial, os comandos do R est?o em letra Courier New. Os resultados dos comandos n?o aparecem na apostila, voc?s devem conferir o resultado no R. Portanto, use os comandos em Courier New para ir acompanhando a apostila no R.

No R o sinal # (quadrado, jogo-da-velha) ? usado para inserir coment?rios, ? o mesmo que dizer: "a partir do # existem apenas coment?rios". O R n?o l? o que vem ap?s o #. No decorrer desta apostila existem v?rios coment?rios ap?s um sinal #, explicando o que foi feito.

Ao longo da apostila voc? precisar? de alguns arquivos de dados que podem ser baixados no site . Os arquivos est?o em formato .txt (p. ex. macac.txt)

Como Instalar o R

O R ? um software livre para computa??o estat?stica e constru??o de gr?ficos que pode ser baixado e distribu?do gratuitamente de acordo com a licen?a GNU. O R est? dispon?vel para as plataformas UNIX, Windows e MacOS.

Windows

? Para baixar o R para o Windows entre no site do R r- ? Clique em CRAN (Comprehensive R Archive Network) ? Escolha o espelho de sua prefer?ncia (CRAN mirrors) ? Clique em Windows 95 or later ? Clique em base e salve o arquivo do R para Windows. Depois ? s? executar o arquivo.

A cara do R:

O R possui uma janela com algumas poucas op??es para voc? se divertir clicando (veja figura abaixo). As an?lises feitas no R s?o digitadas diretamente na linha de comandos (i.e. voc? tem controle total sobre o que ser? feito). Na "linha de comandos" voc? ir? digitar os comandos e fun??es que deseja usar.

2

O sinal > (sinal de maior) indica o prompt e quer dizer que o R est? pronto para receber comandos. Em alguns casos um sinal de + aparecer? no lugar do prompt, isso indica que ficou faltando algo na linha de comandos anterior (isso acontece quando houve um erro, ou quando a finaliza??o do comando s? ocorrer? nas pr?ximas linhas). Se tiver errado pressione Esc para retornar ao prompt normal > e sumir com o sinal de +. Note que na apostila, no come?o de cada linha com os comandos do R h? um sinal do prompt, >, e em alguns casos um sinal de +, n?o digite estes sinais.

Os comandos que voc? digita aparecem em vermelho e o output do R aparece em azul. Ap?s digitar os comandos tecle Enter para que eles sejam executados!

No??es gerais sobre o R

Para usar o R ? necess?rio conhecer e digitar comandos. Alguns usu?rios acostumados com outros programas notar?o de in?cio a falta de "menus" (op??es para clicar). Na medida em que utilizam o programa, os usu?rios (ou boa parte deles) tendem a preferir o mecanismo de comandos, pois ? mais flex?vel e com mais recursos. Algumas pessoas desenvolveram m?dulos de "clique-clique" para o R, como o R-commander. Porem, eu acredito que ao usar um m?dulo de "clique-clique" perdemos a chance de aprender uma das maiores potencialidades e virtudes do R, que ? a programa??o. Clicando voc? n?o aprende a linguagem R! N?s iremos come?ar a apostila apenas usando comandos e fun??es j? prontas no R. Conforme a familiaridade com a linguagem aumenta veremos, na parte final da apostila, como criar e escrever nossas pr?prias fun??es.

O R ? case-sensitive, isto ?, ele diferencia letras mai?sculas de min?sculas, portanto A ? diferente de a. O separador de casas decimais ? ponto ".". A v?rgula ? usada para separar argumentos (informa??es). N?o ? recomendado o uso de acentos em palavras (qualquer nome que for salvar em um computador, n?o s? no R, evite usar acentos. Acentos s?o comandos usados em programa??o e podem causar erros, por exemplo, em documentos do word e excel).

O workspace do R (?rea de trabalho).

A cada vez que voc? abre o R ele inicia uma "?rea de trabalho" (workspace). Neste workspace voc? far? suas an?lises, gr?ficos, etc. Ao final, tudo que foi feito durante uma sess?o de uso do R pode ser mantido salvando o workspace (?rea de trabalho). Sempre que for usar o R em um trabalho, antes de tudo, abra o R e salve um workspace do R na pasta do trabalho em quest?o e abra o R usando o icone que apareceu na pasta. Isso ir? facilitar sua vida, pois n?o ser? necess?rio ficar alterando o diret?rio de trabalho. No caso do uso desta apostila salve um workspace na pasta que usar? para seu estudo (est? pasta ser? o seu diret?rio de trabalho). Ao salvar o workspace ir? aparecer um ?cone do R na pasta, a partir do qual voc? ir? abrir o R.

Para salvar o workspace abra o R v? em "File" e clique em "Save workspace" e salve-o na pasta desejada (diret?rio), n?o ? necess?rio nomear o arquivo (n?o salve mais de um workspace na mesma pasta). Feche o

................
................

In order to avoid copyright disputes, this page is only a partial summary.

Google Online Preview   Download