Я пытаюсь очистить сайт IMDB, используя селектор CSS и xpath. Для некоторых фильмов отсутствуют данные, поэтому невозможно создать кадр данных.
Я хотел бы найти решение для заполнения пустых узлов Na. Я подумал использовать переменную содержимого для подсчета пленки (она содержит все остальные переменные), а затем, если есть нужная мне информация (предположим, метаданные), найти способ записать информацию, в противном случае заставить R писать Na.
content <- function(url){
url %>% read_html() %>%
html_nodes(".lister-item-content")%>%
html_text()
})
metascore <- function(url){
url %>% read_html() %>%
html_nodes("span.metascore") %>%
html_text()
})
У вас есть предложения?