Как игнорировать все слова, содержащие акценты (не английские слова)? - PullRequest
0 голосов
/ 10 сентября 2011

Я создаю Java-приложение, где у меня есть параграф, из которого я хочу получить слова.Я хочу написать регулярное выражение для захвата только английских слов и игнорировать любые слова с акцентами внутри них (содержащие 1 или более неанглийских букв).

Пример: berøres af eller er afgørende для TEAM

Должен ли я использовать \ p {M} или что?

1 Ответ

2 голосов
/ 10 сентября 2011

Это будет соответствовать всем словам, содержащим буквы AZ.

(?:^|\s)[a-zA-Z]+(?=\s|$)

Некоторые разновидности регулярного выражения будут соответствовать \b на символах с акцентом.Из-за этого вам необходимо добавить пунктуацию в предпросмотр, если это требуется.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...