import nltk
from nltk.corpus import state_union
from nltk.tokenize import PunktSentenceTokenizer
train_text = state_union.raw("2005-GWBush.txt")
sample_text = state_union.raw("2006-GWBush.txt")
custom_sent_tokenizer = PunktSentenceTokenizer(train_text)
tokenized = custom_sent_tokenizer.tokenize(sample_text)
def process_content():
try:
for i in tokenized[5:]:
words = nltk.word_tokenize(i)
tagged = nltk.pos_tag(words)
namedEnt = nltk.ne_chunk(tagged, binary=True)
nameEnt.draw()
except Exceptionas as e:
print(str(e))
process_content()
первая синтаксическая ошибка из этого кода, который я получаю, за исключением слова, которое является третьей последней строкой моего кода.если я уберу это, чтобы очистить ошибку m, то снова и снова она выдаст неожиданный случай ... почему это происходит, пожалуйста, быстро сообщите мне решение.