регулярное выражение для извлечения текста - PullRequest
0 голосов
/ 27 мая 2019

регулярное выражение для поиска текста

string = '<a href="/naruto/700">Naruto 700</a> : Naruto Uzumaki!!</td>'

вывод, который я желаю

[("/naruto/700", "Naruto 700", "Naruto Uzumaki!!")]

регулярное выражение, которое я использую re.compile(r'"(.*?)">(.*?)<*:(.*?)<')

результат, который я получаю [('/naruto/700', 'Naruto 700</a> ', ' Naruto Uzumaki!!')]

я не хочу повторять это снова, чтобы разделить его

как мне удалить тег </a> здесь.

спасибо

Ответы [ 2 ]

1 голос
/ 27 мая 2019

используйте это:

\"(.*?)\">(.*?)<.*:(.*?)<
1 голос
/ 27 мая 2019

Просто используя

r'\<a href\=\"(.*?)\"\>(.*?)\<\/a\> \: (.*?)\<\/td\>'

Демо: https://regex101.com/r/TyGKaQ/1

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...