программа распознавания именованных сущностей в python с использованием nltk - PullRequest
0 голосов
/ 06 февраля 2019
import nltk
from nltk.corpus import state_union
from nltk.tokenize import PunktSentenceTokenizer

train_text = state_union.raw("2005-GWBush.txt")
sample_text = state_union.raw("2006-GWBush.txt")

custom_sent_tokenizer = PunktSentenceTokenizer(train_text)

tokenized = custom_sent_tokenizer.tokenize(sample_text)

def process_content():
    try:
        for i in tokenized[5:]:
            words = nltk.word_tokenize(i)
            tagged = nltk.pos_tag(words)

            namedEnt = nltk.ne_chunk(tagged, binary=True)

            nameEnt.draw()

            except Exceptionas as e:
                print(str(e))

                process_content()

первая синтаксическая ошибка из этого кода, который я получаю, за исключением слова, которое является третьей последней строкой моего кода.если я уберу это, чтобы очистить ошибку m, то снова и снова она выдаст неожиданный случай ... почему это происходит, пожалуйста, быстро сообщите мне решение.

...