Я хотел бы найти какой-то тип пакета или модуля (предпочтительно Python или Perl, но другие это сделают), который автоматически генерирует n-граммные вероятности из входного текста и может также автоматически применять один или несколько алгоритмов сглаживания.
То есть я ищу что-то вроде класса NLTK NgramModel
.Я не могу использовать это в своих целях, потому что есть некоторые ошибки с функциями сглаживания, которые заставляют его задыхаться, когда вы спрашиваете вероятность слова, которое он не видел раньше.
Я прочитал форумы разработчиков для NLTK, и на данный момент, похоже, нет никакого прогресса в этом.
Есть ли альтернативы?