Регулярное выражение для поиска имен с заголовком - PullRequest
1 голос
/ 18 апреля 2019

Я создаю веб-паука для получения информации с определенного веб-сайта.Имена на веб-сайте имеют формат «SMITH, JOHN ANTHONY» или «SMITH JR, JOHN ANTHONY».

Используемое мной регулярное выражение: [A-Z]+, [A-Z]+ [A-Z]+.Я хотел бы, чтобы регулярное выражение также подбирало «JR», если имя отформатировано таким образом.Обязательное предложение о том, что я новичок в Regex и что это мой первый пост в Stack Overflow.

[A-Z]+, [A-Z]+ [A-Z]+

1 Ответ

0 голосов
/ 18 апреля 2019

Вы можете использовать необязательную группу (?: [A-Z]+)? для соответствия пробелу и 1+ раз по AZ:

[A-Z]+(?: [A-Z]+)?, [A-Z]+ [A-Z]+

Демонстрация по регулярному выражению regex101

Вы можете использовать словограницы \b добавляются и добавляются, чтобы первое и последнее совпадение не входило в большее слово.

\b[A-Z]+(?: [A-Z]+)?, [A-Z]+ [A-Z]+\b
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...