Не похоже, что вы сможете сделать это без дополнительной работы. С PatternTokenizerFactory вы ограничены «соответствующей» частью регулярного выражения, поэтому вы не можете выполнять замены.
Почему бы не создать свой собственный токенайзер, который использует поток токенов, созданный PatternTokenizer, а затем создает объединенную строку, которую он возвращает в конце?