Вы можете фильтровать данные с помощью if x:
, а позже вы можете делать разные вещи с помощью item
for item in soup.find_all("dl", {"class": "description-list list-with-badges"}):
x = item.find_all("strong")
if x:
print('strong:', x[0].get_text(strip=True))
print('text:', item.get_text(strip=True, separator='|'))
print('list:', item.get_text(strip=True, separator='|').split('|'))
Результат
strong: Attorney
text: Attorney|Ali Shahrestani, Esq.|2007|- Current
list: ['Attorney', 'Ali Shahrestani, Esq.', '2007', '- Current']
Или вы можете попробовать использовать другие уникальные значения - ie.
<strong itemprop='jobTitle'>
и использовать другую функцию - ie parent
data = soup.find('strong', {'itemprop': 'jobTitle'}).parent.parent
print('text:', data.get_text(strip=True, separator='|'))
print('list:', data.get_text(strip=True, separator='|').split('|'))
Результат:
text: Attorney|Ali Shahrestani, Esq.|2007|- Current
list: ['Attorney', 'Ali Shahrestani, Esq.', '2007', '- Current']
Полный пример
import requests
from bs4 import BeautifulSoup as BS
url = 'https://lawyers.justia.com/lawyer/ali-shahrestani-esq-198352'
r = requests.get(url)
soup = BS(r.text, 'html.parser')
for item in soup.find_all("dl", {"class": "description-list list-with-badges"}):
x = item.find_all("strong")
if x:
print('strong:', x[0].get_text(strip=True))
print('text:', item.get_text(strip=True, separator='|'))
print('list:', item.get_text(strip=True, separator='|').split('|'))
print('---')
item = soup.find('strong', {'itemprop': 'jobTitle'}).parent.parent
print('text:', item.get_text(strip=True, separator='|'))
print('list:', item.get_text(strip=True, separator='|').split('|'))