n = read.csv("Student_data (1).csv")
n = n[,-c(29:38)]
length(n)
nrow(n)
#BE
for (i in 1:length(n))
{
for(j in 1:nrow(n))
{
x=c("B.E","Bachelor of Engineering","BACHELOR OF ENGINEERING","B.E.")
if( n[i][[j]] %in% x)
n[i][[j]] = "BE"
}
}
Я пытаюсь очистить фрейм данных, который имеет разные факторы одного и того же вида, но с разными именами и представлениями, как, например, бакалавры в области инженерии и B.E. означает то же самое, что и «BE», поэтому я пытаюсь преобразовать все эти факторы в столбцы квалификаций и специализаций одновременно, используя цикл «for» как BE, аналогично для других, но это дает мне ошибку как
Ошибка в .subset2 (x, i, точный = точный): индекс за пределами In
дополнение: предупреждающее сообщение: в случае если (n [i] [[j]]% в% x) n [i] [[j]] = "BE":
условие имеет длину> 1, и будет использоваться только первый элемент
Может ли кто-нибудь помочь мне с этим
Также лучший и эффективный способ, чем это всегда приветствуется!
Я также связал свой файл .csv в здесь