Всякий раз, когда я импортирую данные, я хотел бы проверить, есть ли строка, которая является просто повторяющимся заголовком, или это происходит в некоторых столбцах.Я знаю, как сделать это красиво для NA или пустых значений, но не только для имени столбца.
library(data.table)
dt<-data.table(mtcars)
dt2<-data.table(t(names(dt)))
names(dt2)<-names(dt)
dt<-rbind(dt,dt2)
Я в основном добавил имена в качестве последнего столбца, я хотел бы проверить это,для всей строки и в каждом столбце отдельно, чтобы увидеть, если это проблема, когда я импортирую неизвестные данные.
colSums(dt[,lapply(.SD,is.na)])
colSums(dt[,lapply(.SD,function(x) x=="")])
Здесь работает для NA и пустых ячеек, чтобы показать мне, как часто это проблема.Но я не знаю, как проверить повторный заголовок.
colSums(dt[,lapply(.SD,function(x) x==.SD)])
Последняя строка не работает, потому что она просто сравнивает столбец с самим собой, но было бы неплохо просто разместить здесь имена столбцов .SD (mpg, ...)
Я хотел бы выйти в море, если весь заголовок повторяется или если это просто происходит в одном столбце.