Skip to content

Latest commit

 

History

History
329 lines (229 loc) · 8.89 KB

apres_course.md

File metadata and controls

329 lines (229 loc) · 8.89 KB

Análise de dados ambientais com R (ADAR)

width: 1440 height: 900 transition: none font-family: 'Helvetica' css: my_style.css author: Jonatan Tatsch, UFSM date: Santa Maria, 18, março de 2019 #date: Santa Maria, 7, de março de 2016

</style>

Introdução

Análise de dados meteorológicos

Processo pelo qual adquire-se conhecimento, compreensão e percepção dos fenômenos meteorológicos a partir de observações (dados) qualitativas e quantitativas.

</style>

Ciência de dados

</style>

Etapas para abordagem de um problema

  1. Questão científica/problema

2. **Obtenção de dados:** coleta/medida do(as) estado/condições da atmosfera - Instrumentos e sensores
3. **Processamento de dados:** *download* ---> limpeza ---> formatação --->
transformação ---> controle de qualidade - ferramenta/software - conhecimento em programação 4. **Análise de dados** - ferramenta/software - conhecimento em programação 5. **Solução para o problema** - Proposta de um modelo - estatístico, empírico, ou fisicamente baseado - conhecimento em programação
6. **Apresentação/divulgação/publicação**

Programação computacional

</style>
</style>

======================= </style>

  • R é o termo usado para se referir a linguagem de programação e ao software que interpreta os scripts escritos usando esta linguagem.

  • Comunidade fantástica

    • Contribuidores (R-core Team)

    • milhares de pessoas usam o R diariamente e ajudam outras pessoas

  • Software Livre (GPL), Código aberto e multiplataforma


* Ambiente para Análise de dados interativa

Por que o R?


  • R não é uma GUI (Interface gráfica do usuário) e isso é bom

  • há uma natural resistência e dificuldade ao uso de códigos e scripts

  • scripts favorecem a automatização e reprodutibilidade

  • força você a ter um conhecimneto mais aprofundado do que está fazendo


* [Reprodutibilidade](https://pt.wikipedia.org/wiki/Reprodutibilidade)
- qualquer pessoa (inclusive você mesmo no futuro) pode obter os mesmos resultados do mesmo conjunto de dados
- R é integrado com [outras ferramentas](https://cran.r-project.org/web/views/ReproducibleResearch.html) de que permitem atualizar seus resultados, figuras e análises automaticamente

Por que o R?


- Acesso ao estado da arte da ciência de dados (*Big Data*, *Data Mining*, *Machine Leraning*)
  • Interface com Fortran, C, C++, Python




- R trabalha com dados de todas formas e tamanhos

Pacotes da comunidade do R

Evolução do nº de pacotes disponíveis no CRAN </style>

Por que um meteorologista usaria o R?


A meteorologia é 4D:
meteorologia <- function(x, y, z, t){
  ...muita coisa para caber em um slide...
}

Logo, requer ferramentas específicas para:
* manipulação de dados espacias
* análise de séries temporais
* importação e ferramentas de [SIG](https://pt.wikipedia.org/wiki/Sistema_de_informa%C3%A7%C3%A3o_geogr%C3%A1fica)
* leitura de dados em formatos específicos ([netcdf](https://en.wikipedia.org/wiki/NetCDF), [binários](https://en.wikipedia.org/wiki/Binary_file), [grib2](https://en.wikipedia.org/wiki/GRIB), ...)

R não é perfeito!


* Muitos códigos em R são escritos para resolver um problema; * foco nos resultados e não no processo * usuários não são programadores * códigos deselegantes, lentos e difíceis de entender
* Como o nosso idioma, há muitas exceções para serem lembradas
* R não é muito rápido e códigos mal escritos serão lentos
* São apenas ~20 anos de evolução
* Há muito o que melhorar

RStudio

RStudio é um ambiente de desenvolvimento integrado livre e de código aberto.

RStudio IDE


  • Multiplataforma (Windos, Linux e Mac)

- ênfase da sintaxe do R, auto-preenchimento de código, identação inteligente
- execução do R diretamente do editor
- manejo de diretórios e projetos
- histórico de gráficos, zoom, atalhos para exportar imagens
- Integrado com [knitr](https://en.wikipedia.org/wiki/Knitr)
- Integrado com [GitHub](https://github.com/) para controle de versões

Bibliografia

Básica

INTRODUÇÃO À PROGRAMAÇÃO EM R *. Victor Landeiro. INPA. 2011.

INTRODUÇÃO AO AMBIENTE ESTATÍSTICO R. Paulo Justiniano Ribeiro Junior. UFPR. 2011.

R FOR DATA SCIENCE*. Garret Grolemund, Hadley Wickham. Chambers (O’Reilly). 2016.

EFFICIENT R PROGRAMMING*. Colin Gillespie and Robin Lovelace. (O’Reilly). 2016.

R IN A NUTSHELL, A Desktop Quick Reference. 2nd Edition. (O’Reilly). 2012.

* eBook gratuito


Complementar

RECURSOS COMPUTACIONAIS UTILIZANDO R* . Daniel Ferreira Furtado. UFLA. 2013.

HANDS-ON PROGRAMMING WITH R. Garret Grolemund (O'Reilly). 2014.

ADVANCED R.* Hadley Wickham. (O’Reilly). 2015.

DISLAYING TIME SERIES, SPATIAL AND SPACE-TIME DATA WITH R. Oscar Lamigueiro. (CRS PRESS). 2014.

Ementa do curso e sistema de avaliação






Disponível no moodle

https://ead06.proj.ufsm.br/course/view.php?id=31111

Para saber mais sobre o R


[**Documentação oficial**](http://cran.r-project.org/manuals.html) - [Manuais do R traduzidos](https://cran.r-project.org/other-docs.html)

Lista de Livros relacionados ao R



Fóruns:






Obrigado!







Material do curso disponível no GitHub









Próximo: Instalando o R e Rstudio