Поиск Google в R - PullRequest
       3

Поиск Google в R

1 голос
/ 29 мая 2019

Этот вопрос не столько о том, как поиск Google в R (обсуждался много раз), сколько о том, почему он не всегда работает.

Я нашел этот код в другом опубликованном вопросе здесь Что я помню, работает отлично.Он будет производить все ссылки в поиске.

Но теперь это не работает.По какой-то причине узел больше не существует, когда я помещаю данные в R. Но когда я на самом деле проверяю HTML-код в Chrome, он появляется, когда я просматриваю код.Он показывает узел h3 в инспекторе отображения, но не при его загрузке.

library(rvest)
ht <- read_html('https://www.google.co.in/search?q=guitar+repair+workshop')
links <- ht %>% html_nodes(xpath='//h3/a') %>% html_attr('href')
gsub('/url\\?q=','',sapply(strsplit(links[as.vector(grep('url',links))],split='&'),'[',1))

Я получаю следующее возвращение:

 character(0)

Отображение ссылок на странице Google зависит отваше местоположение / предпочтения.Так может быть, это то, что вызывает проблему?

1 Ответ

1 голос
/ 29 мая 2019

Похоже, что формат переключился совсем недавно, может быть, сегодня, и что // h3 больше не используется.Это производит то, что предназначено с одним окончательным посторонним результатом

    library(rvest)
    ht <- read_html('https://www.google.co.in/search?q=guitar+repair+workshop')
    links <- ht %>% html_nodes(xpath='//a') %>% html_attr('href')
    gsub('/url\\?q=','',sapply(strsplit(links[as.vector(grep('url',links))],split='&'),'[',1))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...