Стэнфордский тегер - скорость мечения - PullRequest
2 голосов
/ 14 июля 2010

относительно Стэнфордского тегера, я предоставил свой собственный корпус с меткой для обучения модели Стэнфордского тегера. Однако я понял, что скорость тегирования моей модели для теггера намного меньше, чем стандартная модель тега wsjleft3. Что может способствовать этому? И как мне улучшить скорость моей модели? (Я добавил 3 или 4 пользовательских тега в дополнение к наборам тегов банка Пенна)

1 Ответ

4 голосов
/ 14 июля 2010

Хотя добавление дополнительных функций (в арке) в целом делает его немного медленнее (поскольку извлечение функций является одной из основных затрат времени выполнения), два больших фактора, определяющих скорость:

  • Количество тегов контекста, используемых в особенности: left3words использует предыдущий и второй предыдущий тег (2) и так довольно быстро, двунаправленный использует 4 (по два с каждой стороны) и поэтому очень медленно. Tagger, который использует только 1 или 0 контекстных тегов намного быстрее еще раз.
  • Размер набора тегов в целом и, в частности, размер набора тегов открытого класса, которые можно применять к неизвестным словам. (Но добавление 3 или 4 не должно иметь никакого значения - это проблематично, если у вас есть набор тегов с сотнями тегов.)
...