Question

Это мой ввод (пример *)

data = ["['human', 'interface', 'computer']",
 "['survey', 'user', 'computer', 'system', 'response', 'time']",
 "['eps', 'user', 'interface', 'system']",
 "['system', 'human', 'system', 'eps']",
 "['user', 'response', 'time']",
 "['trees']"]

И я попытался реализовать

dictionary = corpora.Dictionary (text_data)

Но это ошибка Я получаю,

TypeError: doc2bow ожидает массив входных токенов Unicode, а не одну строку

Пожалуйста, помогите, если вы поймете, почему это не сработает

pciunkiewicz · Answer 1 · 17 марта 2020

Эта ошибка означает, что каждое «предложение», поданное в doc2bow, должно быть массивом строк («токенов»), тогда как каждое «предложение» предоставляется в виде строки:

# Your input sentences:
data = [
    "['human', 'interface', 'computer']",
    "['survey', 'user', 'computer', 'system', 'response', 'time']",
    "['eps', 'user', 'interface', 'system']",
    "['system', 'human', 'system', 'eps']",
    "['user', 'response', 'time']",
    "['trees']"]

# Expected input sentences:
data = [
    ['human', 'interface', 'computer'],
    ['survey', 'user', 'computer', 'system', 'response', 'time'],
    ['eps', 'user', 'interface', 'system'],
    ['system', 'human', 'system', 'eps'],
    ['user', 'response', 'time'],
    ['trees']]

Python словарь Генсим

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Python словарь Генсим

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы