Изменение переменной с коэффициента на число c меняет порядок - PullRequest
0 голосов
/ 24 января 2020

Я работаю над проектом анализа текста в R, где я пытаюсь определить слова, которые, как правило, больше используются одной группой по сравнению с другой (на основе байесовской вероятности). Теперь у меня есть список со словами и загрузками слов (факторов). Когда я преобразую загрузки слов из фактора в число c, порядок меняется. Почему это так и как мне это решить?

enter image description here

Затем выполните следующий код:

words$top_words <- as.numeric(words$top_words)

enter image description here

Большое спасибо за вашу помощь!

Ответы [ 2 ]

1 голос
/ 24 января 2020

words$top_words - это коэффициент, следовательно, при преобразовании в число c они заменяются базовыми числами. Чтобы безопасно преобразовать коэффициенты в числа, мы можем сделать

words$top_words <- as.numeric(as.character(words$top_words)) 
0 голосов
/ 24 января 2020

Также можно использовать levels, что будет быстрее

words$top_words <- as.numeric(levels(words$top_words)[words$top_words])
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...