Я хочу создать Webscrapper, который будет принимать лом HTML с углового сайта - PullRequest
0 голосов
/ 09 мая 2018

Я работаю над веб-шабером, который будет записывать с углового сайта.

Я использую класс HttpClient для этой цели, но вместо получения тегов html в теге body страницы я получаю теги <ng-view> </ng-view>. Может кто-нибудь объяснить, что происходит и как я могу получить HTML-код вместо ng-view тегов?

1 Ответ

0 голосов
/ 09 мая 2018

Насколько я знаю, это будет невозможно. Все, что вы можете «почистить» - это исходная разметка, которая подается браузеру Все остальное содержимое будет получено с помощью JavaScript, который перезванивает на сервер для получения дополнительных данных.

Если вы не готовы написать полноценный, полностью функциональный движок JavaScript, я бы сказал, что начальная страница - это все, что вы получите.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...