Я загружаю книгу Excel с данными за несколько лет, разделенными по годам на разные листы. Каждый лист содержит около 70 столбцов и имен столбцов.
К сожалению, некоторые столбцы имеют несколько разные имена для одних и тех же данных.
sheets <- excel_sheets(filename)
SheetList <- lapply(excel_sheets(filename), read_excel, path=filename)
names(SheetList)<- sheets
, который загружает список из 13 элементов (фреймов данных), разделенных годом. Если я посмотрю на 2019 названий имен, я получу
colnames(SheetList[[1]])
[1] "Number"
[2] "Year-Round Vacancy"
[3] "Premier Beds"
[4] "Total Year Round Beds"
.
и т. Д. По сравнению с 2013 г. именами
colnamesnames(SheetList[[6]])
[1] "Number"
[2] "Year-Round Vacancy"
[3] "Premier Rooms"
[4] "Total Year Round Rooms"
... и т. Д.
В этих двух случаях эти столбцы имеют одинаковые данные, помеченные по-разному.
Я понимаю, что мог бы использовать str_replace_all для имен столбцов три и четыре, но было бы любопытно, если есть более элегантный способ выявления расхождений и переименования столбцов (где применимо)