Java Regex - извлечение хештегов из строки - PullRequest
5 голосов
/ 13 февраля 2011

Необходимо извлечь строки хештега из исходной строки в Java.Любые идеи / примеры?

Спасибо, Шри

1 Ответ

9 голосов
/ 13 февраля 2011

Вот что я использую (он также обрабатывает теги UTF-8, а не только ASCII):

private static final Pattern TAG_PATTERN = 
   Pattern.compile("(?:^|\\s|[\\p{Punct}&&[^/]])(#[\\p{L}0-9-_]+)");

Кстати, вы сможете получить хэштеги от твитов (include_entities=true)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...