У меня есть какой-то html, который выглядит как словарь:
Веб-сайт производителя: веб-сайт,
Штаб-квартира: местонахождение и т. Д.
Каждая часть содержится всвой собственный div (так что findAll, имя класса div).
Существует ли элегантный и простой способ извлечь такой код в словарь? Или нужно перебрать каждый элемент div, найти оба текстовых элемента и предположить, что первый текстовый элемент является ключом словаря, а второе значение является значением того же элемента dict.
Пример кода сайта:
car = '''
<div class="info flexbox">
<div class="infoEntity">
<span class="manufacturer website">
<a class="link" href="http://www.ford.com" rel="nofollow noreferrer" target="_blank">
www.ford.com
</a>
</span>
</div>
<div class="infoEntity">
<label>
Headquarters
</label>
<span class="value">
Dearbord, MI
</span>
</div>
<div class="infoEntity">
<label>
Model
</label>
<span class="value">
Mustang
</span>
</div>
'''
car_soup = BeautifulSoup(car, 'lxml')
print(car_soup.prettify())
elements = car_soup.findAll('div', class_ = 'infoEntity')
for x in elements:
print(x) ###and then we start iterating over x, with beautiful soup, to find value of each element.
Требуемый вывод - это
expected result result = {'manufacturer website':"ford.com", 'Headquarters': 'Dearborn, Mi', 'Model':'Mustang'}
PS Я уже несколько раз делал не элегантный способ, просто удивляюсь, что я что-то упустил, и есть лилучший способ сделать это. Заранее спасибо!