Вы можете изменить синтаксический анализатор библиотеки с lxml
на html.parser
, и вы найдете все необходимые данные внутри элемента table
.
Затем вы можете применить метод find_all()
ко всем<tr>
таблицы и изучить данные
Пример кода:
from bs4 import BeautifulSoup
import requests
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.109 Safari/537.36'}
r = requests.get('http://indianindustriesdirectory.com/viewCompanyDetails.asp?compid=3855',headers=headers)
soup = BeautifulSoup(r.text,'html.parser')
table = soup.find('table',{"width":"99%","cellpadding":"0","cellspacing":"0","border":"0"})
trs = table.find_all('tr')
for tr in trs:
print(tr.get_text())