Соскоблите книги Google с помощью RCurl и rvest - PullRequest
0 голосов
/ 09 апреля 2020

Я считаю, что с помощью RCurl достаточно легко очистить Google книги Ngrams. Для URL "https://books.google.com/ngrams/graph?content=foo&year_start=1800&year_end=2008&corpus=15&smoothing=3&share=&direct_url=t1%3B%2Cfoo%3B%2Cc0" я просто использую регулярное выражение для извлечения данных после "var data = [{" timeseries ":". Но при попытке поцарапать узел мне некуда. Я вижу узел "td.line-content", поэтому приведенный ниже код должен работать, но он не

html_node(read_html("https://books.google.com/ngrams/graph?content=foo&year_start=1800&year_end=2008&corpus=15&smoothing=3&share=&direct_url=t1%3B%2Cfoo%3B%2Cc0"),"td.line-content")

Чего мне не хватает?

...