Представьте, что у меня есть текстовый корпус, и я посчитал частоты Unigram и Bigram.Теперь я хочу предсказать p(read|Alice)
.Итак: #(Alice, read)/#(Alice)
.# обозначает частоту.
Нет #(Alice, read)
равно нулю, поэтому я использую Good Turing Smoothing для вычисления c
для невидимого события.
Теперь, когда у меня есть c, можноЯ просто делаю c/#(Alice)
или мне также нужно настроить частоту #(alice)
??
Спасибо