недопустимое выражение в python re.search, хотя оно работает на PHP и других сопоставителях регулярных выражений - PullRequest
0 голосов
/ 26 мая 2010

date = re.search (r '([\ x \ d \ w -. \ S, () & \ "] + |)

Я переносу код из PHP в Python и использую этот фрагмент выражения regex в re.match, который не работает, выдавая ошибку Python:

raise error, v # invalid expression

Он работает на preg_match PHP, а также http://www.gskinner.com/RegExr, есть идеи, почему это происходит? Спасибо!

1 Ответ

3 голосов
/ 26 мая 2010
\x

сам по себе недопустим (как в PHP, так и в Python, но, возможно, PHP просто игнорирует его, в то время как Python генерирует исключение). Попробуйте удалить его, а также переместить - в конец класса символов:

date = re.search(r'<td>([\d\w.\s,()&\"-]+|)<br><font',page_data)

Но во всех случаях вы не будете очень довольны, если попытаетесь разобрать HTML с помощью регулярных выражений.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...