Зачистка вложенного стола от TMX.com в R - PullRequest
0 голосов
/ 05 июня 2019

Я пытаюсь почистить основную таблицу (цепочку опций) с этого сайта. https://web.tmxmoney.com/options.php?qm_symbol=SLF&qm_page=19300 При просмотре кода html / css кажется, что таблица находится внутри таблицы. Когда я использую html_nodes ("таблица"), мне возвращается только таблица заголовков. Когда я пытаюсь глубже погрузиться с xpath, мне возвращается список, в котором ничего нет. Я также попытался использовать гаджет селектора, но все еще получаю список длины 0. Я пробовал много разных путей xpath, но предоставлю только мой самый последний

library(dplyr)
library(rvest)
library(httr)
url = "https://web.tmxmoney.com/options.php?qm_symbol=SLF&qm_page=19300"
chain = read_html(url)%>%html_nodes(xpath = '//div[@class="qm-container"]/table/tbody/tr/td/table') %>% html_table(fill = T)

{xml_nodeset (0)}

Вот таблица, которую я пытаюсь почистить.

1 Ответ

0 голосов
/ 05 июня 2019

Попробуйте использовать ниже xpath.

 //div[@class="qm-container"]/table/tbody/tr/td//table[@class='qm_heading_bar']
...