Lucene Tokenizer с LookAhead - PullRequest
       14

Lucene Tokenizer с LookAhead

3 голосов
/ 28 сентября 2011

Может ли кто-нибудь указать мне правильное направление для реализации токенизатора Lucene с LookAhead?

Я использую стебель снежного кома и хочу иметь возможность получать фразы из названий городов и предотвращать их использование, так что «Лос-Анджелес» будет установлен как один токен, в отличие от двух токенов «Лос» и «Анджелес».

Мне также нужно сохранить токены, которые не соответствуют ни одному названию города, так какодно слово.

есть идеи?

TIA

1 Ответ

1 голос
/ 30 сентября 2011

Здесь - это суть того, что я написал, что делает то, что вы хотите.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...