Apresentação do problema

Agora que sabemos coletar de uma página da busca atributos e os conteúdos de uma “tag”, precisamos repetir o procedimento para todas as páginas de resultado. Fizemos algo semelhante no Tutorial 1, mas ainda usávamos a função html_table. O objetivo é repetir o que fizemos lá, mas com as novas funções que vimos ao longo do Tutorial 21. Para tanto, vamos usar o “for loop” do Tutorial 20 para ir de uma página a outra.

O primeiro passo é, mais uma vez, ter o nosso link da pesquisa que queremos coletar armazenado em um objeto. Retiraremos do url o valor do parâmetro “sr” ao final, pois é este que indica quais resultados da página aparecerão.

url_base <- 'http://search.folha.uol.com.br/search?q=merenda&site=todos&results_count=3769&search_time=0.033&url=http%3A%2F%2Fsearch.folha.uol.com.br%2Fsearch%3Fq%3Dmerenda%26site%3Dtodos&sr='

Função Paste

Como é possível reparar, o número da página fica ao final do link, por isso podemos utilizar a função chamada paste0 ou “colar sem separação” em vez da função str_replace. Note que, diferentemente desta, a função paste0 aceita um número ao concatenar seus elementos.

Na linguagem R, escreveremos:

i <- 1

url_folha <- paste0(url_base, i)

A “url_base” é o endereço da página de busca e o “i” é o contador numérico que utilizaremos em um loop a seguir.