Stanford NER - Извлечение нескольких слов - PullRequest
1 голос
/ 18 апреля 2011

Как я могу пометить словосочетания в Стэнфордском NER?В настоящее время он помечает Federal Reserve Bank of New York как

<wi num="11" entity="ORGANIZATION">Federal</wi> <wi num="12" entity="ORGANIZATION">Reserve</wi> <wi num="13" entity="ORGANIZATION">Bank</wi> <wi num="14" entity="ORGANIZATION">of</wi> <wi num="15" entity="ORGANIZATION">New</wi> <wi num="16" entity="ORGANIZATION">York</wi>

Я хочу, чтобы он был распознан как

<wi num="11" entity="ORGANIZATION">Federal Reserve Bank of New York</wi>

Возможно ли это?

1 Ответ

2 голосов
/ 19 апреля 2011

Нечто подобное есть, да.Если вы установите флаг

-outputFormat inlineXML

, тогда вы получите:

<ORGANIZATION>Federal Reserve Bank of New York</ORGANIZATION>

(Обратите внимание, что это на самом деле не меняет работу Stanford NER, а только форматирование вывода. ЕслиВам не нравится какой-либо из предоставленных форматов вывода, довольно просто написать свой.)

...