FLS 6397 - Introdução à Programação e Ferramentas Computacionais para as Ciências Sociais

Aula 7 - Strings e Mineração de Textos no R

Objetivos Gerais

Aprender sobre as diferentes formas de manipular strings e textos no R.

Roteiro para a aula

Nesta aula veremos 3 pacotes diferentes para trabalhar com texto como dado: stringr, que é bastante útil para ‘limpeza’ de textos; tm, que foi durante vários anos o pacote principal para mineração de texto e análise de corpus em R; e tidytext, pacote do tidyverse para mineração de texto, bastante recente.

stringr - Tutorial 11

tm - Tutorial 12

tidytext - Tutorial 13

Se houver tempo em sala de aula e você quiser se aprofundar no assunto, leia alguns dos capítulos do livro sobre “tidy” text mining, Text Mining with R, também disponível em formato bookdown: