Пометка последовательности в пакете с приглашением Mallet cmd - PullRequest
0 голосов
/ 04 октября 2018

Я протестировал SimpleTagger для маркировки последовательностей в интерфейсе командной строки Маллета.Теперь я хотел бы пройтись по многим файлам и запускать тесты партиями.Возможно ли это сделать в командной строке?Я хочу получить некоторую подсказку о производительности алгоритма для выполняемой задачи, прежде чем углубиться в использование JAVA API.

Я видел, что Задачи классификации можно запускать в пакетном режиме изкомандная строка

  • возможно ли использовать SimpleTagger в пакете?если нет
  • Может кто-нибудь указать мне ссылочный код, в котором теги последовательностей были выполнены в пакетном режиме с использованием Java-API.

Где-то я нашел ссылку на "http://mallet.cs.umass.edu/index.php/Command_line_tutorial", но ссылка, кажется, не работает.

1 Ответ

0 голосов
/ 05 ноября 2018

После некоторого исследования я узнал, что было невозможно легко использовать cc.mallet.fst.SimpleTagger для пакетной оценки.Вместо этого я обнаружил, что cc.mallet.examples.TrainCRF - это удобный код (который использует SimpleTagger).Код принимает входные и тестовые наборы данных (в формате тегов последовательности Маллета, экземпляры, разделенные одной строкой) в качестве входных аргументов, и все.

Я использовал установку mallet-2.0.8 , доступную на странице Mallet.

Остерегайтесь НЕ настраивать модели в зависимости от производительности тестового набора.Вам следует избегать этого и, возможно, не проверять производительность на тестовом наборе, пока вы не настроите модель на тренировочном наборе в достаточной степени.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...