'строка' имеет неправильный тип (ожидаемая строка, полученная spacy.tokens.doc.Doc) - PullRequest
0 голосов
/ 03 декабря 2018

У меня есть фрейм данных:

train_review = train['review']
train_review

Это выглядит так:

0      With all this stuff going down at the moment w...
1      \The Classic War of the Worlds\" by Timothy Hi...
2      The film starts with a manager (Nicholas Bell)...
3      It must be assumed that those who praised this...
4      Superbly trashy and wondrously unpretentious 8...

Я добавляю токены в строку:

train_review = train['review']
train_token = ''
for i in train['review']:
   train_token +=i

Что я хочуэто токенизировать отзывы с помощью Spacy.Вот что я пробовал, но я получаю следующую ошибку:

Аргумент 'строка' имеет неверный тип (ожидаемый str, получил spacy.tokens.doc.Doc)

Как я могу решить это?Заранее спасибо!

1 Ответ

0 голосов
/ 03 декабря 2018

В вашем цикле for вы берете spacy.tokens из вашего фрейма данных и добавляете их в строку, поэтому вы должны привести его к str.Как это:

train_review = train['review']
train_token = ''
for i in train['review']:
   train_token += str(i)
...