Я хочу создать список, который содержит пару ключ-значение.С ключами <thead>
.Для значений, которые я хочу получить для всех элементов <th>
, кроме элементов <th>
, в которых есть <a href='url'>
, вместо этого я хочу получить URL.
В настоящее время я могу толькополучить текст от всех предметов.Но как мне получить '/ someurl' вместо Макулерада и Детальера?
<table class="table table-bordered table-hover table-striped zero-margin-top">
<thead>
<tr>
<th>Volymsenhet</th>
<th>Pris</th>
<th>Valuta</th>
<th>Handelsplats</th>
<th>url1</th>
<th>url2</th>
</tr>
</thead>
<tbody>
<tr class="iprinactive">
<td>Antal</td>
<td>5,40</td>
<td>SEK</td>
<td>NASDAQ STOCKHOLM AB</td>
<td><a href="/someurl">Makulerad</a></td>
<td>
<a href="/someurl">Detaljer</a>
</td>
</tr>
</tbody>
</table>
Мой код:
raw_html = simple_get('https://example.com/')
soup = BeautifulSoup(raw_html, 'html.parser')
table = soup.find("table", attrs={"class":"table"})
head = [th.get_text() for th in table.find("tr").find_all("th")]
datasets = []
for row in table.find_all("tr")[1:]:
dataset = dict(zip(head,(td.get_text() for td in row.find_all("td"))))
datasets.append(dataset)