Я много работаю с данными, которые используют кодификацию для муниципалитетов, предоставленных Национальным институтом статистики моей страны. Так как эта классификация обычно представляется как неупорядоченные категориальные данные, я обычно конвертирую данные из int в множители, используя var <- as.factor(var)
, и это всегда хорошо работает для меня.
Однако меня беспокоит уровень из этих факторов: я часто работаю с наборами данных, в которых не представлены все эти коды (кстати, всего 5570), и нередко я выполняю соединения между этими наборами данных, что приводит к следующему сообщению: Warning message: Column CO_MUN joining factors with different levels, coercing to character vector
.
Есть способ манипулировать вызовом as.factor()
, чтобы сохранить уровни факторов от исходной базы?
Спасибо!