Нужно регулярное выражение python, которое может проверять имена с помощью специальных символов (дефисы, апострофы и т. Д.) - PullRequest
0 голосов
/ 22 декабря 2018

Я пытаюсь создать регулярное выражение python, которое может соответствовать любому имени.Я перебираю веб-страницу и ищу тег <h1> и помещаю имя между ними.Имена могут включать Джеймс Дин, Джеймс-Дин, Брайан О'Куин, Джейм Джо-Харден и т. Д.

Это было первое регулярное выражение, с которым я работал, но ононе ловит все имена

<h1>[A-Z]{1}[a-z]+\s[A-Z]{1}[']?[A-Z]?[-]?[A-Z]?[a-z]+

1 Ответ

0 голосов
/ 22 декабря 2018

Может быть это:

<h1>(([-'\w]+\s?)+)<h1>

Объяснение:

- соответствует самому себе, \ w соответствует буквам и цифрам, а плюс - захватить одно или несколько из этих случаев.Кроме того, необязательный пробел после этого для поддержки составных имен.
Наконец, последний + plus гарантирует, что вы можете повторить структуру, которую я только что описал.
Надеюсь, что это поможет.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...