После некоторого исследования я узнал, что было невозможно легко использовать cc.mallet.fst.SimpleTagger для пакетной оценки.Вместо этого я обнаружил, что cc.mallet.examples.TrainCRF - это удобный код (который использует SimpleTagger).Код принимает входные и тестовые наборы данных (в формате тегов последовательности Маллета, экземпляры, разделенные одной строкой) в качестве входных аргументов, и все.
Я использовал установку mallet-2.0.8 , доступную на странице Mallet.
Остерегайтесь НЕ настраивать модели в зависимости от производительности тестового набора.Вам следует избегать этого и, возможно, не проверять производительность на тестовом наборе, пока вы не настроите модель на тренировочном наборе в достаточной степени.