Как исправить «замена имеет x строк, данные имеют y строк» ​​в контексте квантования - PullRequest
0 голосов
/ 13 апреля 2019

Я пытаюсь использовать пакет quanteda для анализа данных в R с помощью специальной команды liwcalike(). Тем не менее, когда я запускаю его, ошибка говорит о том, что «замена имеет x строк, данные имеют y строк» ​​

Я использовал другие пакеты в классе quanteda. В прошлых сообщениях предлагалось сокращать данные в общих случаях, но я не уверен в последствиях этого или о том, как сделать это для качественных данных, поскольку я заинтересован в анализе всего набора данных. Кроме того, информация из прошлых сообщений предложила сократить как решение и предложила пути для количественных данных. Я не уверен, как это будет работать здесь.

По рекомендации https://github.com/kbenoit/quanteda.dictionaries, код изменен для моего набора. data_like_dislike - это труп, который я создал по рекомендации https://github.com/quanteda/readtext. data_dictionary_MFD был извлечен из пакета quanteda.dictionaries.

library(readtext)
like = readtext("anes12.csv", text_field = c("candlik_dislwhatdpc", "candlik_likewhatrpc", "candlik_dislwhatrpc", "ptylik_lwhatdp", "ptylik_dwhatdp", "ptylik_lwhatrp", "ptylik_dwhatrp"))
summary(like)

#Create Corpus
require(quanteda)
data_like_dislike = corpus(like)
summary(data_like_dislike, 2)

library(quanteda.dictionaries)

MFD <- liwcalike(data_like_dislike, 
                 dictionary = data_dictionary_MFD)
head(MFD)

Ошибка, которую это производит, является

Error in `[[<-.data.frame`(`*tmp*`, "WPS", value = c(16, 26, 6, 6.33333333333333,  : 
  replacement has 5165 rows, data has 5914

В идеале можно использовать весь набор, но нужно ли здесь сокращать набор?

Спасибо!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...