Я пытался очистить API URL. Я получаю ответ в формате XML. Я был знаком с ответом JSON's, но для меня это было ново. Мне было интересно, как мы можем go вперед и извлечь данные из ответа XML, используя Scrapy или Request. Какие типы выражений используются для определения определенных значений, например <FirmName>, <FirmId>. (go по ссылкам ниже для проверки данных)
API URL
XML
JSON's
Scrapy
Request
<FirmName>
<FirmId>
Ссылка: https://www.ricsfirms.com/umbraco/api/surveyorSearchApi/results?location=United%20Kingdom&firmName=&lon=-5.2235136&lat=50.2307777&boxId=14821&country=GB&page=1
Попробуйте следующее, поскольку оно возвращает JSON:
import requests r = requests.get('https://www.ricsfirms.com/umbraco/api/surveyorSearchApi/results?location=United%20Kingdom&firmName=&lon=-5.2235136&lat=50.2307777&boxId=14821&country=GB&page=1') data = r.json() for office in data['resultOffices']: print(office['firmId']) print(office['firmName']) print('---')