Я использую BeautifulSoup для разбора HTML.Допустим, у меня есть следующий HTML-код в BeautifulSoup, называемый супом:
<td class="1">test1</td>
<td>test2</td>
<td class="3"><a href="/">test3</a></td>
<td><div class="test4"><a class="test4" href="/">test4</a></div></td>
<td><div class="test4"><a class="test4" href="/">test4</a></div></td>
Я могу получить все теговые элементы 'td' с помощью:
soup.findAll("td")
Но как мне найти только 'тд теги, которые окружают div, которые имеют класс test4?Или эти теги «a» окружают test4?
Я знаю, что могу найти теги с атрибутами, такими как:
soup.findAll("a", {"class":"test4"})
Но мне нужно объединить это с первоначальным поиском 'td'так что я выбрасываю все теги 'td', которые не окружают теги 'a' или 'div'.
Идеи?Спасибо!