Я следую этому уроку RSelenium и выскабливание Все работает нормально, пока я не приступлю к тестированию функции navigate_click () . ( set_names отличаются от учебника, так как мой исходный сайт отличается.)
navigate_click <- function() {
webElem <- remDr$findElement(using = "class name",
"google-visualization-table-div-page")
Sys.sleep(0.5)
webElem$clickElement()
remDr$getPageSource()[[1]] %>%
read_xml() %>%
xml_ns_strip() %>%
xml_find_all(xpath = '//td') %>%
xml_text() %>%
set_names(c("PublicationTitle", "County", "Place_of_Publication", "Library")) %>%
as.list() %>% as_tibble()
}
Возвращает ошибку:
Ошибка в read_ xml .raw (charToRaw (enc2utf8 (x)), "UTF-8", ..., as_ html = as_ html,: xmlParseEntityRef: без имени [68]
Вот трассировка ...
> navigate_click()
Error in read_xml.raw(charToRaw(enc2utf8(x)), "UTF-8", ..., as_html = as_html, :
xmlParseEntityRef: no name [68]
11. read_xml.raw(charToRaw(enc2utf8(x)), "UTF-8", ..., as_html = as_html,
options = options)
10. read_xml.character(.)
9. read_xml(.)
8. function_list[[i]](value)
7. freduce(value, `_function_list`)
6. `_fseq`(`_lhs`)
5. eval(quote(`_fseq`(`_lhs`)), env, env)
4. eval(quote(`_fseq`(`_lhs`)), env, env)
3. withVisible(eval(quote(`_fseq`(`_lhs`)), env, env))
2. remDr$getPageSource()[[1]] %>% read_xml() %>% xml_ns_strip() %>%
xml_find_all(xpath = "//td") %>% xml_text() %>% set_names(c("PublicationTitle",
"County", "Place_of_Publication", "Library")) %>% as.list() %>%
as_tibble()
1. navigate_click()