Question

Я использую библиотеку Abot для сканирования веб-страницы. Искатель может правильно запрашивать страницы, но проблема в том, что почти весь контент загружается динамически через knockout.js. В настоящее время сканер не может запросить этот контент, в результате чего загружается только небольшая часть страницы.

Я пытался заставить программу ждать в надежде на запросы на динамическую отправку в любом случае, но это, похоже, не работает.

Я хочу, чтобы была загружена вся страница, но вместо этого загружается только основание страницы.

Что можно сделать, чтобы сканер запросил все данные?

Спасибо!

Mateus Custodio · Answer 1 · 09 июля 2019

Краткий ответ:

Это невозможно, вам нужно что-то, что может обработать JS для вас, как это делают браузеры. Я бы порекомендовал Splash от Scrapy (его можно интегрировать с любым языком через его REST API).

Но, по моему скромному мнению, если вам не нужно корпоративное решение, не используйте C # для сканирования в Интернете, в Python есть самые простые решения и более полные библиотеки, например.

C # Crawler не может загрузить динамический контент

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

C # Crawler не может загрузить динамический контент

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы