Primeiro Semestre, 2021
DCP - FFLCH - USP
Sexta-feiras, 14h - 18h
Jonathan Phillips
Como passamos de um banco de dados bruto para um relatório ou artigo publicado com estatísticas precisas, tabelas claras e gráficos convincentes? Existem diversas ferramentas poderosas para facilitar o processo de análise de dados, a pesquisa e a publicação, mas elas podem parecer intimidadoras e complexas. Este curso oferece aos estudantes de pós-graduação em ciências sociais uma iniciação accessível ao uso de software para a coleta, limpeza, análise, comparação e visualização de dados.
O foco do curso é o desenvolvimento da habilidade de programação para solução de problemas diversos relacionados ao manejo de dados com fins de pesquisa. Note-se que não é um curso de metodologia de pesquisa ou estatística. No final do curso alunos serão capazes de desenvolver um script que baixar os dados, organizá-los, calcular medidas relevantes, construir tabelas, gráficos e mapas, e gerar um relatório final para uso na sua dissertação/tese, tudo em uma forma verificável, reproduzível, transparente e documentada.
Adotamos o uso da linguagem de R no curso por ser uma língua aberta, com muito suporte disponível online e uma ferramenta bastante usada nas ciências sociais. Note que o treinamento em R permite uma transição muito mais fácil para outras linguagens de programação no futuro, e os princípios de programação e tratamento de dados são bastante transferíveis.
As aulas serão compostas por breves apresentações dos tópicos e por longos laboratórios, com tutoriais para auto-aprendizado e acompanhamento dos instrutores e assistentes. Espera-se que a turma pratique exaustivamente, dentro e fora de sala de aula, as técnicas aprendidas.
Ao longo do curso as participantes deverão solucionar desafios correspondentes aos tópicos, usando bancos de dados comuns nas ciências sociais. Exemplos de desafios: (1) organizar automaticamente dados eleitorais a partir do repositório de dados do TSE; (2) elaborar um mapa com dados municipais a partir do DATASUS. Os desafios exigirão dedicação extra-classe e são parte fundamental do curso.
No final do curso as estudantes deverão elaborar um projeto individual relacionado a sua própria pesquisa/interesses.
Entre aulas, tutoriais, leituras e desafios, espera-se que cada aluna ou aluno dedique de 8h a 12h por semana à disciplina.
A avaliação é composta pela entrega dos desafios (exercícios), do projeto final individual e da participação. A atribuição de nota para os desafios e projetos entregues priorizará o esforço e engenhosidade apresentados (leia-se “código com erros, mas bem elaborado”) em detrimento da finalização do desafio (leia-se “código funcionando plenamente”) como forma de encorajar estudantes iniciantes.
Não é necessário nenhum conhecimento prévio de programação, pacotes estatísticos ou manejo de conjuntos de dados. O curso é recomendado tanto para alunas e alunos que já têm alguma noção quanto para estudantes que morrem de medo de computadores. O objetivo é criar um ambiente confortável para o aprendizado de técnicas de programação, independentemente da habilidade das inscritas, e seguindo todos os passos desde a preparação do ambiente de computação até a apresentação de resultados.
É recomendado que as participantes já tenham concluído ou estejam cursando algum curso de métodos de pesquisa (de qualquer abordagem) ou de análise de dados, seja do programa ou da IPSA-USP Summer School. É um curso adequado para estudantes em qualquer etapa do mestrado ou doutorado, desde que tenham disponibilidade para realizar as atividades extra-classe.
Antes de começar o curso, por favor segue os passos seguintes. Precisamos instalar duas ferramentas. Primeiro, a linguagem de programação: ‘R’. E segundo, um programa/editor/interface que nos ajuda digitar e organizar a nossa análise: ‘RStudio’.
Para Baixar ‘R’ para Windows: segue o link https://cran.r-project.org/bin/windows/base/, clique no primeiro link, e executar. Para outros sistemas, veja https://cran.r-project.org/bin/
Baixar ‘RStudio’ aqui no link apropriado para o seu sistema e executar: https://rstudio.com/products/rstudio/download/#download
Observe que você nunca precisa abrir ‘R’ diretamente. Tudo pode ser feito em RStudio.