Nodejs: я хочу удалить html с nba.com/stats, но я не получаю весь html с запросом - PullRequest
0 голосов
/ 26 марта 2019

Я пытаюсь удалить https://stats.nba.com/players/traditional/?sort=NBA_FANTASY_PTS&dir=-1&Season=2018-19&SeasonType=Regular%20Season&LastNGames=3 с помощью nodejs но я не получаю тот же HTML, который отображается на сайте, мне нужны данные из таблицы, но они присутствуют только при проверке элемента на сайте, я пробовал с запросом + cheerio, jquery, scrap-table, но они всегда записать исходный HTML.

1 Ответ

0 голосов
/ 26 марта 2019

Да, это потому, что сайт построен на Angular.Страница генерируется с помощью Javascript.Все запросы дает вам базовый HTML, но на этом он останавливается.Он не будет загружать сценарии, не будет создавать DOM.

Вам нужен более мощный инструмент: браузер без головы, такой как PhantomJS или Puppeteer .

Они будут загружать не только базовый HTML, но и скрипты и делать все как настоящий браузер.Затем вы можете извлечь полностью построенную HTML-страницу из них.

...