У меня есть код ниже:
import nltk
exampleArray = ['The dog barking']
def processLanguage():
for item in exampleArray:
tokenized = nltk.word_tokenize(item)
tagged = nltk.pos_tag(tokenized)
print(tagged)
processLanguage()
Вывод кода выше - это токенизированные слова с соответствующими им частями речи. Пример:
[('The', 'DT'), ('dog', 'NN'), ('barking', 'NN'), ('.', '.')]
DT = determiner
NN = noun
Предполагается, что текст будет
The dog is barking
и должен иметь POS-последовательность
DT -> NN -> VBZ -> VBG
VBZ = verb, present tense, 3rd person singular
VBG = verb, present participle or gerund
Как мне найти программу в предложении позиция пропущенного слова?