<a href="/browse.php?cat=67" class="bb_a">2057: Discovery<br><span>(2057: Discovery channel)</span></a>
<a href="/browse.php?cat=36" class="bb_a">The 4400<br><span>(The 4400)</span></a>
<a href="/browse.php?cat=47" class="bb_a">Aqua<br><span>(Aquaman)</span></a>
Как мне разобрать вышеприведенную строку?
Я хочу получить URL-адреса и имена в списке, подобном следующему:
[["2057", "The 4400", "Aquaman"],
["/browse.php?cat=67", "/browse.php?cat=36", "/browse.php?cat=47"]]
Используя приведенный ниже код, я уже могу разобрать URL
i = 0
for incident in soup.findAll('a'):
if ("browse.php?" in soup('a')[i]['href']):
print (soup('a')[i]['href'])
print soup('a')[i]['class']
i = i + 1;