Я вырезал тег, но может ли кто-нибудь помочь мне, как вынуть номер из тега ниже?
<span class="comments">7</span>
как вынуть из него 7?
print(tag.get('[0-9].+)', None))
Почему это не работает?
Другой метод, использующий SimplifiedDo c:)
from simplified_scrapy import SimplifiedDoc,utils html = ''' <span class="comments">7</span> ''' doc = SimplifiedDoc(html) print (doc.span.text)
Результат:
7
Использование регулярного выражения
span = "<span class='comments'>7983</span>"
import re number = re.findall(r"[0-9]+",span) print(number[0])
Вывод:
'7983'