Вместо просмотра HTML-кода вы можете заметить, что страница запрашивает всю информацию на экране с помощью отдельного запроса, который возвращает все необходимые данные в формате JSON. Это можно преобразовать в словарь Python, используя функцию запросов .json()
.
Ниже показано, как возвращаемый JSON можно использовать для извлечения полей Case No
, Subject
и Sector
:
from urllib3.exceptions import InsecureRequestWarning
import requests
requests.packages.urllib3.disable_warnings(category=InsecureRequestWarning)
r = requests.get('https://wbwcfe.worldbank.org/icsidext/service.svc/getbulkcasesbystatusid/json?id=cd28', verify=False)
data = r.json()
for case in data['GetBulkCasesByStatusIdResult']:
print(f"Case No.: {case['caseno']}\nSubject: {case['subject']}\nSector: {case['econsector']}\n")
Предоставление выходных данных в виде:
Case No.: CONC/18/1
Subject: Water services and electric power concession
Sector: Electric Power & Other Energy
Case No.: ARB/17/40
Subject: Hydrocarbon concession
Sector: Oil, Gas & Mining
Case No.: ARB/17/39
Subject: Hydrocarbon concession
Sector: Oil, Gas & Mining
URL-адрес был найден с помощью сетевых инструментов браузера при загрузке URL-адреса, указанного в вопросе.
Я рекомендую вам распечатать data
и изучить все доступные вам поля.