См. Это для извлечения текста между тегами BeautifulSoup
или попробуйте этот
soup.p.next_sibling.strip()
- вы получаете
непосредственно с soup.p
* (это зависит от того, является ли он первым
в дереве разбора)
- , затем используйте
next_sibling
для объекта тега, который возвращается soup.p
, так как нужный текст вложен на том же уровне синтаксический анализ дерева как .strip()
это просто метод Python str для удаления начальных и конечных пробелов
в интерпретаторе, это выглядит примерно так:
In [4]: soup.p
Out[4]: <p>tag contains</p>
In [5]: type(soup.p)
Out[5]: bs4.element.Tag
In [6]: soup.p.next_sibling
Out[6]: u'\n Text inside in your tag \n '
In [7]: type(soup.p.next_sibling)
Out[7]: bs4.element.NavigableString
In [8]: soup.p.next_sibling.strip()
Out[8]: u'Text inside in your tag'
In [9]: type(soup.p.next_sibling.strip())
Out[9]: unicode