Я пытался сделать простое сравнение между тегом bigram и тегом HMM. И я приближаюсь к тому же результату. Я прочитал документацию по тегу bigram, и это похоже на описание тега HMM. Вот мой код:
import nltk
from nltk.corpus import brown
brown_tagged_sents = brown.tagged_sents(categories='news')
brown_sents = brown.sents(categories='news')
bigram_tagger = nltk.BigramTagger(brown_tagged_sents)
hmm_trainer = nltk.HiddenMarkovModelTrainer()
hmm_tagger = hmm_trainer.train_supervised(brown_tagged_sents)
print bigram_tagger.tag(brown_sents[2007])
print hmm_tagger.tag(brown_sents[2007])
Будет очень любезно, если кто-нибудь сможет объяснить мне, как работает биграмм-тэджер и почему он дает тот же результат, что и тэггер HMM. Заранее благодарю за ответы