После того, как вы нашли все теги <h2>
, используя то, что вы сделали, вы можете получить соответствующий тег <ul>
, используя find_next()
или .next_sibling
.Затем просто переберите все теги <li>
.
Код:
for date_tag in results_table.find_all('h2'):
date = date_tag.text
for item in date_tag.find_next('ul').find_all('li'):
print(date, item.a['href'], item.span['class'][0], item.get_text(',', strip=True), sep=',')
Вывод:
May 18, 2018,/somedirectoryname/anothername/009,some,another value,long description
May 18, 2018,/somedirectoryname/anothername/008,some,another value,long description
March 9, 2018,/somedirectoryname/anothername/007,some,another value,long description
March 9, 2018,/somedirectoryname/anothername/006,some,another value,long description
March 9, 2018,/somedirectoryname/anothername/005,some,another value,long description
March 9, 2018,/somedirectoryname/anothername/004,some,another value,long description
December 1, 2017,/somedirectoryname/anothername/003,some,another value,long description
December 1, 2017,/somedirectoryname/anothername/002,some,another value,long description
December 1, 2017,/somedirectoryname/anothername/001,some,another value,long description