Как идентифицировать этот узел с помощью Xpath с помощью Google Sheets IMPORTXML () - PullRequest
0 голосов
/ 06 ноября 2019

Я пытаюсь использовать IMPORTXML() в своем Google Sheet для извлечения данных из определенного узла по этому URL . Узел, на который я нацеливаюсь, выглядит следующим образом.

<div data-elm-id="asset_2820933_address" class="styles__address-container--2l39p styles__u-mr-1--3qZyj">
  <h4 data-elm-id="asset_2820933_address_content_1" class="styles__asset-font-big--vQU7K">
    246 LOWER VIEW ROAD
  </h4>
  <label data-elm-id="asset_2820933_address_content_2" class="styles__asset-font-small--2JgrX">
    Strasburg, VA 22657, Warren County
  </label>
</div>

Моя цель - извлечь две строки, представляющие адрес.

246 LOWER VIEW ROADСтрасбург, Вирджиния 22657, округ Уоррен

Однако, когда я это делаю, я получаю сообщение об ошибке.

Мои X-пути выглядят следующим образом:

//h4[starts-with(@class,"styles__asset-font-big")]
//label[starts-with(@class,"styles__asset-font-small")]

Итакмоя полная формула Google Sheets выглядит следующим образом:

IMPORTXML ("https://www.auction.com/residential/VA/active_lt/auction_date_order,resi_sort_v2_st/y_nbs/bank-owned,newly-foreclosed,foreclosures_at/", '// h4 [начинается с (@class," styles__asset-font-big ")] | // label [начинается с (@class, "styles__asset-font-small")] ')

Возможно ли это вообще? Или как-то блокируется этот сайт? Если это возможно, что? я делаю не так?

...