Используя пакет rvest, я пытаюсь вычеркнуть имена актеров / актрис со страницы IMDB для фильма JFK (https://www.imdb.com/title/tt0102138/fullcredits?ref_=tt_ql_1).
SelectorGadget говорит, что место, которое я хочу искать имена «td: nth-child (2)» для каждого человека.
Вот код, который я использую.
library(rvest)
library(stringr)
startFilm <- "tt0102138" #JFK
personsNames <- c()
pagePath <- paste("https://www.imdb.com/title/", startFilm, "/?ref_=nv_sr_1?ref_=nv_sr_1", sep = "")
moviePage <- read_html(pagePath)
personNodes <- html_nodes(moviePage, "td:nth-child(2)")
personText <- html_text(personNodes)
for (i in 1:length(personText)){
actor <- (unlist(str_split(personText[i], "\n")))[2]
personsNames[i] <- substring(actor, 2, nchar(actor))
}
personsNames
Согласно веб-сайту https://www.imdb.com/title/tt0102138/fullcredits?ref_=tt_ql_1 этот список должен быть довольно длинным.
Тем не менее, когда я запускаю код, я получаю только 15 имен.
[1] "Sally Kirkland" "Anthony Ramirez" "Ray LePere" "Steve Reed" "Jodie Farber" "Columbia Dubose"
[7] "Randy Means" "Kevin Costner" "Jay O. Sanders" "E.J. Morris" "Cheryl Penland" "Jim Gough"
[13] "Perry R. Russo" "Mike Longman" "Edward Asner"
Почему список имен сокращается ?
Как мне настроить свой код, чтобы получить полный список актеров / актрис в фильме?