представление веб-страницы в браузере - PullRequest
0 голосов
/ 01 февраля 2011

У меня есть некоторые идеи о том, как построить более интеллектуального веб-паука, который взаимодействует с веб-страницей и извлекает информацию способом, более похожим на то, как это делают люди.

Для этого мне нужно представлениевеб-страницы, которая похожа или идентична той, которую мы видим в наших браузерах

Другими словами, мне нужен доступ к данным о расположении, цвете и стиле всех элементов на странице, возможно, в пикселяхlevel.

Но я не хочу просто отображаемое растровое изображение, я хочу иметь возможность извлекать текст, нажимать ссылки и нажимать кнопки и т. д.

У меня такое ощущение, что модель DOM можетбыть отправной точкой, но хотелось бы получить более конкретный совет

Чтобы уточнить, я хочу программно получить доступ к веб-страницам в форме, аналогичной той, которую нам предоставляет браузер, но, например, для проверкицвет или текст в определенном месте или области пикселя.

1 Ответ

2 голосов
/ 01 февраля 2011

Возможно, вы захотите проверить Selenium (или другие способы написания сценариев в вашем браузере, например greasemonkey). Поскольку способ отображения веб-страницы во многом зависит от конкретного браузера, один из сценариев, очевидно, является наиболее точным способом получения того, что видит пользователь.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...