рег экс группа и подгруппа - PullRequest
0 голосов
/ 25 июня 2011

Можно ли использовать регулярное выражение для захвата всей фразы, а также каждого слова в объединенной фразе?

Так для:

smith jones

Для возврата:

smith,jones,smithjones

кроме того, из-за других ограничений (solr PatternTokenizer) я могу использовать только одну группировку.

1 Ответ

1 голос
/ 25 июня 2011

Не похоже, что вы сможете сделать это без дополнительной работы. С PatternTokenizerFactory вы ограничены «соответствующей» частью регулярного выражения, поэтому вы не можете выполнять замены.

Почему бы не создать свой собственный токенайзер, который использует поток токенов, созданный PatternTokenizer, а затем создает объединенную строку, которую он возвращает в конце?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...