Как проанализировать страницу JavaScript - PullRequest
1 голос
/ 19 марта 2020

Я не могу получить Коронавируса Онтарио HTML со страницы, обслуживаемой с использованием JavaScript. Я использую Nokogiri в Ruby.

На сайте Ruby найдена страница с предупреждением / объяснением, в которой говорится, что моему браузеру нужны JavaScript.

<h1>JavaScript is required to view this site</h1> <p>Ontario.ca needs JavaScript to function properly and provide you with a fast,
stable experience. Please enable JavaScript or check your browser's settings.</p>...Outdated browsers lack safety features that keep your information secure

Я пытался парсинг страницы с использованием JSON с тем же результатом. Страница возвращается как stringIO объект, и этот .string также имеет тот же результат.

Как я могу получить эту страницу и любые другие, которые обслуживаются таким образом? Я думаю, что это повторяющаяся проблема с JavaScript обслуживаемых сайтов.

1 Ответ

1 голос
/ 23 марта 2020

Вам нужно использовать Watir gem для этого, так как он загружен через ajax. И также, кажется, у них есть API , вы также можете взглянуть на это.

...