Я не могу очистить этот веб-сайт с помощью Google Sheets IMPORTXML. Очистка заблокирована? - PullRequest
1 голос
/ 08 апреля 2019

Я пытаюсь очистить этот сайт , используя функцию ImportXML в Google Sheets, и хотя я могу получить информацию из тега "head", я ничего не могу получить из тега "body".

Например, функция для получения заголовка должна быть

=importxml("link","//html/body/div[3]/div/div[1]/div/h3/a")

Но я получаю #N/A "Imported content is empty". Я попытался очистить все под тегом "body", но безуспешно. Просто «/ body» не возвращает ошибку, но дает пустую ячейку. Мне интересно, заблокированы ли здесь записи на листы Google. Заранее спасибо.

1 Ответ

0 голосов
/ 08 апреля 2019

Вы можете скрести только то, что видите на этом изображении:

0

, если это так, то вам нужно использовать эту формулу:

=ARRAY_CONSTRAIN(IMPORTDATA("http://poe.trade/search/roumedomigoniu"), 3000, 10)

и со списком QUERY и REXEXREPLACE / REGEXEXTRACT отфильтруйте то, что вам нужно, прямо из исходного кода.

...