При объявлении переменной как фактора R не распознает все уровни.
Например, этот код приведет к конфликту (см. Рисунки).
dataset$search_term_id <- factor(dataset$search_term_id, levels = unique(dataset$search_term_id),nmax = 100000)
В наборе данных только 3000 уровней.Однако код, объявляющий все символы как уровни факторов, приводит к проблемам ... Это приведет к проблемам с дальнейшим анализом, поскольку некоторые модели распознают только один уровень факторов.
[ 2
Я пробовал несколько способов, используя unique()
и т. Д., Однако R
делаетнеправильно отображать количество уровней факторов.
Есть идеи?