Как я могу сократить время выполнения Stanford parser? - PullRequest
0 голосов
/ 25 мая 2011

Доброе утро,

Я использую часть речи Стэнфорда для своего приложения, и мне нужно проанализировать много текстовых файлов (можно перейти к 20 файлам). Однако я заметил, что Стэнфорд занимает много времени (иногда 30 минут или больше), проблема в том, что Стэнфорд автоматически создает синтаксическое дерево, даже когда оно мне не нужно. Кто-нибудь сталкивался с этой проблемой раньше? Что я могу сделать, чтобы сократить время разбора в Стэнфорде?

Любая помощь приветствуется, Привет.

1 Ответ

1 голос
/ 02 июня 2011

Если вам нужна только часть речи, а не синтаксический анализ деревьев, вы должны запустить (речевую модель) часть речевого тега, например Stanford POS Tagger , что на несколько порядков быстрее). См. Stanford Parser FAQ . (Если вы хотите быстро пометить, используйте модель Pang Tag * Stanford left3words-wsj-0-18.tagger.)

...