У меня есть требование, при котором я должен извлечь содержимое внутри тега <raw>
. Например, мне нужно извлечь abcd
и efgh
из этого фрагмента HTML:
<html><body><raw somestuff>abcd</raw><raw somesuff>efgh</raw></body></html>
Я использовал этот код в своем питоне
re.match(r'.*raw.*(.*)/raw.*', DATA)
Но это не возвращает никакой подстроки. Я не очень хорош в регулярных выражениях. Так что исправление этого или нового решения мне очень поможет.
Я не должен использовать внешние библиотеки (из-за некоторых ограничений в моей компании).