FLS 6397 - Introdução à Programação e Ferramentas Computacionais para as Ciências Sociais

Aula 9 - RMarkdown, e Integração R e Databases

Objetivos Gerais

Antes de avançarmos para novos tópicos relativos ao uso da linguagem, vamos aprender sobre algumas ferramentas e funcionalidades diretamente relacionadas ao uso de R.

O primeiro deles será a integração de R com Sistemas de Gerenciamente de Bancos de Dados que operam em SQL (Structured Query Language), facilitada pelo pacote dplyr. A combinação R + SQL é uma solução particularmente boa para a manutenção de grandes bases de dados (“out of memory data”) e para o armazenamento de dados utilizados por equipes de trabalho e pesquisa.

A seguir, aprenderemos um pouco sobre Markdown, uma linguagem para a produção de documentos de texto, e de sua versão para R, RMarkdown. É possível, com esta linguagem, combinar texto, código e outputs em um único documento que pode ser exportado como uma página html, um documento pdf ou um arquivo em formato .docx.

Finalmente, veremos como organizar nossa produção em projetos com controle de versão dos documentos utilizando git, que é um software de gerenciamento de versão, github, que é um repositório online que opera com git, e a integração de ambos com Rstudio.

Importante: esta será uma aula com mais momentos de exposição. Fique atenta(o) aos horários.

Roteiro para a aula

LEIA COM CUIDADO E ATÉ O FINAL O ROTEIRO DE HOJE ANTES DE COMEÇAR.

1- Comece o Tutorial 15 assim que chegar em sala de aula, sobre a integração entre R e SQL.

2- Havendo sobra de tempo em sala de aula, leia, caso não tenha lido, o capítulo 8 do livro R for Data Science, aqui, sobre RProjects.

4- Se tiver terminado o Tutorial 15, vá para o Tutorial 16, sobre RMarkdown.

5- Se houver tempo em sala, leia os capítulos 26 a 30 so livro R for Data Science. Esta é a seção do livro sobre Comunicação Científica e a maioria deles trata de RMarkdown.

Roteiro pós-aula

Finalizar a leitura dos capítulos 1 (Introduction) a 18 (Pipes, no início da parte III) e 26 a 30 (parte V) do livro do livro R for Data Science, aqui.