сначала у меня есть 2 функции, которые изначально являются символами.
train_address = train$address
test_address = test$address
, а затем я связываю их вместе.
address = c(train_address, test_address)
, а затем я меняю его с символа на целое, потомуПозже я их подставлю, и я хочу обработать его быстрее.код показан ниже.
Моя цель - перенести все данные, которые в поезде, но не тестируются, в 0.
for (a in train_address) {
if (!(train_address[a] %in% test_address)) {
train_address[a] = 0
}
}
train_address = as.factor(train_address)
test_address = as.factor(test_address)
после того, как я обработаю данные таким образом, это должно быть:
номер фактора теста + 1 = номер фактора поезда
(потому что R начинаются с 1, поэтому 0 не используется, пока я не передам некотороеданных в поезде через цикл for выше)
но на самом деле разница между числом факторов поезда и теста составляет 400 +.
Я знаю, что должно быть что-то не таккод, но я не знаю, где ...