Я пытаюсь разобрать таблицу по ссылке. я попробовал:
from bs4 import BeautifulSoup import requests url = 'http://www.stats.gov.cn/tjsj/zxfb/201810/t20181015_1627579.html' page = requests.get(url) soup = BeautifulSoup(page.text, 'html.parser') for table in soup.find_all(class_='MsoNormalTable'): print(table)
Но не могу получить. Итак, вы можете мне помочь, как мне разобрать таблицу с помощью python.
Не могли бы вы просто сделать это? Я не могу читать язык, но это может быть правильно.
headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36'} url = 'http://www.stats.gov.cn/tjsj/zxfb/201810/t20181015_1627579.html' page = requests.get(url, headers=headers) soup = BeautifulSoup(page.text, 'lxml') middleTable = soup.find('table', class_='MsoNormalTable') rows = middleTable.findAll('tr') for eachRow in rows: print(eachRow.text)
вы можете попробовать:
soup.find_all("table", {"class": "MsoNormalTable"})
необходимо указать тег и для доступа через атрибут его нужно передать в словарь