текстовая классификация ValueError: возможна итерация по необработанным текстовым документам, получен строковый объект - PullRequest
0 голосов
/ 12 октября 2019

Я построил модель классификации слов, чтобы классифицировать одно слово как «термин» или «не термин». И теперь у меня есть вход, который представляет собой список предложений. Мне нужно использовать мою модель, чтобы узнать, сколько слов является «термином» для каждого предложения. Входные данные представляют собой список предложений, после предварительной обработки он выглядит так: enter image description here Итак, я написал код:

predicted = []
for sentence in dataset.text:
    for word in sentence:
        predicted.append(Model.predict(word))

И я ожидал, что результат будет таким, как предсказано = [[не срочные, не срочные], [не срочные], [срочные], [не срочные], ..... ] что-то вроде этого. Таким образом, будет легче посчитать количество терминов для каждого предложения позже. Тем не менее, у меня было «ValueError: итерируемый по необработанным текстовым документам, ожидаемый, полученный строковый объект»Если я просто использую одно слово в качестве ввода, например:

word = ['man']
predicted = Model.predict(word)
print predicted
==>'non-term'

, тогда оно работает нормально. Буду признателен, если кто-нибудь поможет мне это исправить. Спасибо!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...