как я могу выполнить парсинг веб-страниц, чтобы узнать цены на мои продукты, для которых у меня есть только таблица Google? динамически запрашивает - PullRequest
0 голосов
/ 05 мая 2020

не могли бы вы дать мне идею, как я могу получить это

Ответы [ 3 ]

1 голос
/ 05 мая 2020

На многих сайтах go слишком много, чтобы активно предотвращать очистку. Предоставление вам только тех данных, которые вы хотите, полностью подрывает их бизнес-модель. Если вы потребитель, они лишены возможности показывать вам рекламу. Если вы являетесь торговым посредником, вы можете использовать довольно простое программирование и маркетинг, чтобы снизить их цены.

Если вы не можете очистить парсинг, это может быть связано с тем, что это невозможно.

0 голосов
/ 06 мая 2020

Обходной путь. Вы можете импортировать данные с помощью следующего скрипта (кредиты Брэду Джасперу): Импорт JSON, затем запрос с формулой QUERY. Это пример с «iPhone 8» и «Playstation 4».

ijs

В столбце A вы указываете продукт для поиска. URL-адрес для получения данных JSON автоматически создается в столбце B с помощью оператора concat.

="https://wss2.cex.uk.webuy.io/v3/boxes?q="&A2

В столбце C у вас есть формула QUERY в сочетании с шагом данных ImportJSON .

=QUERY(ImportJSON(B2);"SELECT Col4,Col20 WHERE Col4 CONTAINS 'Plus' AND Col4 CONTAINS '64' AND Col4 CONTAINS 'Unlocked' LIMIT 1 label Col4'',Col20''";1)

Col4: описание товара, Col20: цена товара. Так как JSON вернет много результатов (несколько версий iPhone 8), это шаг, на котором вы можете уточнить свой поиск. Я искал в описании продукта «Плюс», «64» и «Разблокирован».

0 голосов
/ 05 мая 2020

, к сожалению, это невозможно, потому что сайт контролируется JavaScript, а Google Таблицы не могут понять / импортировать JS. вы можете проверить это, просто отключив JS для данной ссылки, и вы увидите пустую страницу:

0

...