Я извлек некоторые данные из URL, чтобы проанализировать результаты езды на велосипеде. К сожалению, столбец имени содержит имя и название команды в одном поле. Я хотел бы извлечь их друг из друга. Вот код (последняя часть не работает)
#get url
stradebianchi_2020 <- read_html("https://www.procyclingstats.com/race/strade-bianche/2020/result")
#scrape table
results_2020 <- stradebianchi_2020%>%
html_nodes("td")%>%
html_text()
#transpose scraped data into dataframe
results_stradebianchi_2020 <- as.data.frame(t(matrix(results_2020, 8, byrow = F)))
#rename
names(results_stradebianchi_2020) <- c("rank", "#", "name", "age", "team", "UCI point", "PCS points", "time")
#split rider from team
separate(data = results_stradebianchi_2020, col = name, into = c("left", "right"), sep = " ")
Я думаю, что лучший вариант - получить имя переменной команды и использовать это имя, чтобы удалить его из столбца 'name'.
Все предложения приветствуются!