Python словарь Генсим - PullRequest
       8

Python словарь Генсим

0 голосов
/ 17 марта 2020

Это мой ввод (пример *)

data = ["['human', 'interface', 'computer']",
 "['survey', 'user', 'computer', 'system', 'response', 'time']",
 "['eps', 'user', 'interface', 'system']",
 "['system', 'human', 'system', 'eps']",
 "['user', 'response', 'time']",
 "['trees']"]

И я попытался реализовать

dictionary = corpora.Dictionary (text_data)

Но это ошибка Я получаю,

TypeError: doc2bow ожидает массив входных токенов Unicode, а не одну строку

Пожалуйста, помогите, если вы поймете, почему это не сработает

1 Ответ

1 голос
/ 17 марта 2020

Эта ошибка означает, что каждое «предложение», поданное в doc2bow, должно быть массивом строк («токенов»), тогда как каждое «предложение» предоставляется в виде строки:

# Your input sentences:
data = [
    "['human', 'interface', 'computer']",
    "['survey', 'user', 'computer', 'system', 'response', 'time']",
    "['eps', 'user', 'interface', 'system']",
    "['system', 'human', 'system', 'eps']",
    "['user', 'response', 'time']",
    "['trees']"]

# Expected input sentences:
data = [
    ['human', 'interface', 'computer'],
    ['survey', 'user', 'computer', 'system', 'response', 'time'],
    ['eps', 'user', 'interface', 'system'],
    ['system', 'human', 'system', 'eps'],
    ['user', 'response', 'time'],
    ['trees']]
...