IMPORTHTML / Проблемы извлечения таблицы - PullRequest
0 голосов
/ 30 апреля 2019

Попытка импортировать прогнозы погоды для нескольких рынков сбыта, но сайт, который я использовал, заблокировал Bot Crawl, поэтому моя функция ImportHTML не может извлечь URL.

Я нашел другой сайт, но таблица отформатирована в виде календаря, а не в виде списка. Могу ли я каким-то образом вытащить эту информацию в Google Sheets (GS)? Я получил его, чтобы получить информацию, но он выглядит как [TABLE] в GS.

Это код, который я использовал для изменения даты:

=CONCATENATE("https://www.wunderground.com/calendar/us/ca/eureka/KACV/date/",$B$3,"-",$C$3,"?cm_ven=localwx_calendar")

И код для переноса заполненной таблицы URL в GS:

=IMPORTHTML(A2, "Table", 1)

Я хочу, чтобы первая строка кода извлекала текущий год и месяц из B3 и C3 и Concatenate, а затем вторая строка кода собирает все это вместе, а затем извлекает нужную таблицу с веб-сайта, но я получаю кучу ячеек с [TABLE].

Ответы [ 2 ]

0 голосов
/ 01 мая 2019

Существует API, который возвращает json.Посмотрите документацию, чтобы увидеть, есть ли конечная точка, которая отвечает вашим потребностям.Например, на вкладке сети показано следующее для прогноза на 15 дней

https://api.weather.com/v3/wx/forecast/daily/15day?language=en-US&apiKey=6532d6454b8aa370768e63d6ba5a832e&geocode=40.95%2C-124.11&units=e&format=json

Возможно, вам придется написать собственный сценарий для обработки этого ответа или использовать инструмент, подобный ImportJSON .После небольшого исследования весьма вероятно, что вы найдете что-то подходящее.

Изучите прогноз на 15 дней JSON здесь

0 голосов
/ 30 апреля 2019

это будет невозможно. сайт, созданный по вашей формуле, контролируется JavaScript, и Google Sheets не может читать JS. Вы можете увидеть это, просто отключив JS:

0

...