Я пытаюсь очистить html для ссылок в определенном классе, называемом «список категорий». Каждая ссылка находится в теге h4 (я игнорирую его родительский тег h3):
<ul class="category-list">
<li class="category-item">
<h3>
<a href="/derdubor/c/alarm_og_sikkerhet/">
Alarm og sikkerhet
</a>
</h3>
<ul>
<li>
<h4>
<a href="/derdubor/c/alarm_og_sikkerhet/brannsikring/">
<span class="category-has-customers">
Brannsikring
</span>
(1)
</a>
</h4>
</li>
</ul>
</li>
...
Мой код для очистки html следующий:
r = request.urlopen(str_top_url)
soup = BeautifulSoup(r.read(),'html.parser')
tag_category_list = soup.find('ul', class_ = 'category-list')
tag_items = tag_category_list.find_all('h4')
for tag_item in tag_items.find_all('a'):
print(tag_item.get('href'))
Я получаю сообщение об ошибке:
"ResultSet object has no attribute '%s'. You're probably treating a list of items like a single item..."
Чтение руководства BeautifulSoup по crummy, этоПохоже, вы можете использовать те же методы, принадлежащие классу BeautifulSoup для объекта тега?Кажется, я не могу понять, что я делаю не так ...
Я попробовал множество ответов на нее на stackoverflow.Но безрезультатно ...
С уважением, МХ