Я работаю в проекте с большим количеством таблиц, которые хранятся в HTML.В процессе очистки мне приходится иметь дело со следующей проблемой:
Некоторые таблицы, которые я очищаю, выглядят так:
Мне пришлось ввестиПараметр fill = TRUE
в этом коде для тех строк, которые являются объединенными ячейками ("курица" и "курица без костей"), в то время как я импортирую DF:
read_html(link) %>%
html_nodes(node) %>%
html_table(fill = T, header = T, dec = ",")
, но это сгенерировано длямне такие таблицы:
df <- data.frame(year = c("chicken",2000,2001,2002,"chicken without bones",2003,2004,2005, "chicken without bones and feet", 2006, 2007, 2008),
weight = c("chicken",5,6,4,"chicken without bones",2,1,3,"chicken without bones and feet", 1, 1.5, 2)
)
Пытаясь найти способ, чтобы мои таблицы выглядели так:
df2 <- data.frame(year = c(2000,2001,2002, 2003, 2004, 2005,2006,2007, 2008), number = c(5,6,4,2,1,3,1,1.5, 2),
new_variable = c("chicken","chicken","chicken","chicken without bones","chicken without bones",
"chicken without bones","chicken without bones and feet","chicken without bones and feet","chicken without bones and feet" )
)
Я борюсь с R и до сих пор не знаю, как это сделатьэто с моими таблицами 1.028.974.Обс .: Таблицы не имеют шаблон этого происшествия;из-за этого мне нужен код, который идентифицирует узлы заполнения, получает их значения в виде символов и превращает их в новые значения столбца, пока не произойдет следующая заливка.
Спасибо за внимание !!