У меня есть некоторые идеи о том, как построить более интеллектуального веб-паука, который взаимодействует с веб-страницей и извлекает информацию способом, более похожим на то, как это делают люди.
Для этого мне нужно представлениевеб-страницы, которая похожа или идентична той, которую мы видим в наших браузерах
Другими словами, мне нужен доступ к данным о расположении, цвете и стиле всех элементов на странице, возможно, в пикселяхlevel.
Но я не хочу просто отображаемое растровое изображение, я хочу иметь возможность извлекать текст, нажимать ссылки и нажимать кнопки и т. д.
У меня такое ощущение, что модель DOM можетбыть отправной точкой, но хотелось бы получить более конкретный совет
Чтобы уточнить, я хочу программно получить доступ к веб-страницам в форме, аналогичной той, которую нам предоставляет браузер, но, например, для проверкицвет или текст в определенном месте или области пикселя.