Spacy - конвертировать тип токена в список - PullRequest
0 голосов
/ 02 ноября 2018

У меня есть несколько элементов, которые я получил после выполнения операции в просторах, имеющих тип Ввод -

li = ['India', 'Australia', 'Brazil']
for i in li:
    print(type(i))

Выход:

<class 'spacy.tokens.token.Token'>

<class 'spacy.tokens.token.Token'>

<class 'spacy.tokens.token.Token'>

Я хочу сделать все элементы в списке с типом str для итерации. Ожидаемый результат -

li = ['India', 'Australia', 'Brazil']
for i in li:
    print(type(i))

выход

<class 'str'>

<class 'str'>

<class 'str'>

пожалуйста, предложите какой-нибудь оптимизированный способ ..

1 Ответ

0 голосов
/ 02 ноября 2018

Spacy Token имеет атрибут с именем text. Вот полный пример:

import spacy
nlp = spacy.load('en_core_web_sm')
t = (u"India Australia Brazil")
li = nlp(t)
for i in li:
    print(i.text)

или если вы хотите список токенов в виде списка строк:

list_of_strings  = [i.text for i in li]
...