Как извлечь все элементы из таблицы HTML с BeautifulSoup4? - PullRequest
0 голосов
/ 14 сентября 2018

Вот HTML-код, являющийся частью более крупного веб-сайта, который я собираю: https://pastebin.com/LZ3mJKv0

В основном я хочу, чтобы мой вывод был:

Breed: Shih Tzu
Price: $850
Gender: Male
Nickname: Wade
Age: 16 Weeks Old
Color/Markings: red and white
Size at Maturity: Small

и т. Д., И т. Д. Я попытался найти все теги tr, все теги td и найти все теги b, но ни один из них не дал вывод, который я ищу, или выдал ошибку.

Заранее благодарю за ответы!

1 Ответ

0 голосов
/ 14 сентября 2018

Вы можете использовать понимание вложенного списка:

from bs4 import BeautifulSoup as soup
d = soup(content, 'html.parser')
new_results = [[c.text.replace('\n', '') for c in i.find_all('td')] for i in d.find_all('tr')]
for i in new_results:
  print(' '.join(i))

Вывод:

Breed: Shih Tzu
Price: $850
Gender: Male Male
Nickname: Wade
Age: 16 Weeks Old
Color/Markings: red and white
Size at Maturity: Small
Availability Date: 08/01/2018
Shipping Area: Pick Up Only
Payment Method: Credit Cards, Cash
...