Создать пользовательский словарь из вектора символов - PullRequest
1 голос
/ 18 марта 2019

Я пытаюсь найти конкретные слова в корпусе с помощью dfm_lookup ().

Я действительно борюсь со словарями, необходимыми для dfm_loopup ().

Я создал символьный вектор с именем «words», который содержит все слова, которые должны попасть в словарь.

словарю нужен список, поэтому я создаю список из символьного вектора, прежде чем использую словарь ().

dict <- dictionary(list(words))

Но тогда я получаю

Error in validate_dictionary(object) : 


 Dictionary elements must be named: digital digital-tv digitalis ...

Что мне нужно изменить в команде списка, чтобы получить правильный вывод для словаря ()?

Есть ли более простая версия для поиска определенных слов в dfm? Потому что с пакетом tm () это было действительно легко.

1 Ответ

0 голосов
/ 18 марта 2019

Я считаю, что вам нужно назвать элементы в списке, чтобы использовать словарь с quanteda. Вот пример:

library(quanteda)

words = c("cat","dog","bird")

word.list = as.list(words)
names(word.list) = words

dictionary(word.list)
Dictionary object with 3 key entries.
- [cat]:
  - cat
- [dog]:
  - dog
- [bird]:
  - bird
...