Часть HTML структурирована, как показано ниже. Я хочу получить от нее «звание» и «время». Я могу получить их отдельно, например:
from bs4 import BeautifulSoup
pages = '<div class="content"> \
<a href="Org"> \
<h3 class="title"> \
Dep. Manager</h3> \
</a> \
<div class="contributor"></div> \
<p>John</p> \
<time class="time"> \
<span class="timestamp">May 02 2016</span> \
</time> \
</div>'
soup = BeautifulSoup(pages, "lxml")
soup.prettify()
s = soup.find_all(class_ = "title")[0]
t = soup.find_all('span', class_ = "timestamp")[0].text.strip()
pp_title = s.text.strip()
print t
print (pp_title)
Он возвращает мне то, что хотел.
Dep. Manager
May 02 2016
Для «времени» я хочу получить другой способ, как «время»Всегда ниже «заголовка». Я попробовал эту строку, чтобы получить «время», оно не работает.
print (s.parent.next_sibling.next_sibling)
Как правильно получить «время» из отношения к «названию»? спасибо.