Как удалить исходный код сайта с помощью Google Sheets / Google Apps? - PullRequest
0 голосов
/ 08 ноября 2019

Мне нужно импортировать некоторые данные, скрытые в исходном коде сайта. S

, поскольку эта конкретная информация не отображается на странице, я не могу использовать xpath. Я подумал, что будет проще импортировать весь исходный код в Google Sheets и шаг за шагом извлекать необходимые данные. Не могли бы вы предложить лучшее решение?

1 Ответ

0 голосов
/ 08 ноября 2019

Несмотря на то, что данные не видны глазу, они все равно могут быть доступны через XPath . Это происходит потому, что информация все еще может быть частью «узлов» в DOM;несмотря на то, что они скрыты от стиля. Вы можете перемещаться по этим узлам, анализируя HTML .

. Кроме этого, еще одним отличным решением является использование регулярных выражений. Вы можете использовать это решение в сочетании с выше. Я предлагаю вам использовать следующие ссылки, если вы решите пойти по этому пути:

Наконец, может быть, данные загружаются динамически с использованием Javascript. Если это так, вы не сможете получить данные, просто отправив стандартный HTTP-запрос на веб-страницу, а скорее вам придется понимать происходящие запросы и, если возможно, запрашивать их самостоятельно у GAS.

Если это не решит вашу проблему, рассмотрите пример веб-страницы, с которой вы пытаетесь получить данные, чтобы мы могли предоставить индивидуальные ответы.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...