У меня есть набор переменных id, который содержит буквы и цифры.Я хочу создать уникальный числовой идентификатор для этих переменных, поскольку программа, с которой я работаю, принимает только числовые данные.
В каждом классе несколько учеников (учеников), но в каждом классе есть уникальный идентификатор.
Целью является замена каждого уникального алфавитно-цифрового идентификатора класса уникальной числовой версией.Мой набор данных содержит около 18000 уникальных идентификаторов классов и более 185000 студентов.
Можно ли это сделать с помощью R?
Например:
df <- data.frame(StuID=c("112", "113", "114", "115", "116", "117"), CLASSID=c("123B542 ", "123B542", "458Z84 ", "458Z84 ", "760E53", "760E53"))
Требуемый вывод
df <-(stuID= c("112", "113", "114", "115", "116", "117"),CLASSID=c("123B542 ", "123B542", "458Z84 ", "458Z84 ", "760E53", "760E53"), NewID= c("12", "12", "13" "13", "14", "14"))
Я не уверен, с чего начать с этим кодом.Я попытался сделать это вручную, но у меня есть набор данных с более чем 18K уникальных ClassID.