Я борюсь с преобразованием XML в Dataframe в R
см. XML здесь
До сих пор мне удалось получить все атрибуты xml в кадре данных, но мне нужна информация "Q id" для нескольких "qualifier_id". Вот текущий код:
df_list <- lapply(list.filenames, function(f) {
doc <- read_xml(f)
setNames(data.frame(
xml_attr(xml_find_all(doc, "//Event"), "timestamp"),
xml_attr(xml_find_all(doc, "//Event"), "id"),
xml_attr(xml_find_all(doc, "//Event"), "version"),
xml_attr(xml_find_all(doc, "//Event"), "last_modified"),
xml_attr(xml_find_all(doc, "//Event"), "y"),
xml_attr(xml_find_all(doc, "//Event"), "x"),
xml_attr(xml_find_all(doc, "//Event"), "outcome"),
xml_attr(xml_find_all(doc, "//Event"), "team_id"),
xml_attr(xml_find_all(doc, "//Event"), "sec"),
xml_attr(xml_find_all(doc, "//Event"), "min"),
xml_attr(xml_find_all(doc, "//Event"), "period_id"),
xml_attr(xml_find_all(doc, "//Event"), "type_id"),
xml_attr(xml_find_all(doc, "//Event"), "event_id")
), c("timestamp", "id", "version", "last_modified", "y", "x", "outcome", "team_id", "sec", "min", "period_id", "type_id", "event_id"))
})
Фрейм данных выглядит следующим образом:
Dataframe
В идеале, у меня были бы дополнительные столбцы для нескольких "qualifier_id". Например, столбец с именем «213» со значениями из «значения» и NA, если его там нет.
Заранее спасибо