Question

Я пытался очистить веб-страницу и, таким образом, использовал команду read_html. Но я не смог отсканировать стол, который хочу. Я думаю, что эта страница с Javascript. Я не знаю, как справиться с этим. Вот что я сделал

  url=paste0("http://www.oddsportal.com/baseball/usa/mlb-2006/results/#/page/2/")
site=read_html(url)%>%html_nodes('.tournamentTable')

или site=read_html(url) t<-html_nodes(site,"table")%>%html_table(fill=TRUE)

но я получил {xml_nodeset (0)}. Что не так с моим кодом? или этот веб-сайт должен использовать другую команду ??

И я тоже попробовал read_html(url)%>%html_nodes("table"). Но таблицы из этой команды были другими боковыми таблицами на веб-странице. Он не мог поцарапать основной стол.

Спасибо за вашу помощь ..

Debabrata · Answer 1 · 13 сентября 2018

Мы используем функцию html_nodes () для выбора узлов.

Сначала мы читаем веб-страницу следующим образом:

webpage <- read_html("http://www.test.com/One.htm")
tbls <- html_nodes(webpage, "table")

См. Следующую ссылку для справки: http://bradleyboehmke.github.io/2015/12/scraping-html-tables.html

Отметьте ответ как ответ, если он удовлетворяет вашим требованиям.

R: Соскоб Javascript веб-заработной платы

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

R: Соскоб Javascript веб-заработной платы

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов