Автоматизация браузера и межсайтовый скриптинг - PullRequest
0 голосов
/ 30 ноября 2009

Я пытаюсь написать какую-нибудь веб-автоматизацию. Сайты, которые я посещаю, не относятся к тому же домену, что и моя автоматизация, поэтому проблемы межсайтового скриптинга делают невозможным доступ к DOM на целевом веб-сайте.

Я не хочу использовать прокси-сервер или заниматься прокси-серверами целевых сайтов (как, например, Selenium). Кроссплатформенность приятно иметь, но не обязательна. Я пойду Windows, только если я вынужден.

Я понимаю, что мог бы просто написать программу для Windows, которая запускает элемент управления WebBrowser и мой собственный набор сценариев, но я не хочу, чтобы мои пользователи загружали EXE с моей веб-страницы или какие-либо переопределения реестра, чтобы отключить междоменный домен проверка. Он должен быть чрезвычайно прост в использовании, без дополнительной загрузки программного обеспечения или чего-либо еще.

Я попытался написать элемент управления ActiveX, который включает в себя элемент управления MS WebBrowser, чтобы у меня был, так сказать, «браузер в браузере». Это не сработало. Я закончил с ошибками утверждения winocc.cpp.

Какие еще варианты у меня есть? Будет ли работать апплет Java? Мне нужен браузер на основе Java ... я должен смотреть на использование JRex или Lobo?

Просто должен быть лучший способ.

1 Ответ

0 голосов
/ 30 ноября 2009

Вы можете использовать язык на стороне сервера, чтобы получить внешнюю страницу с помощью скрапа экрана. Я сделал это с помощью PHP, а также в C # .NET, но вы можете использовать практически любой серверный язык для создания веб-запроса, который возвращает весь кусок HTML с целевой страницы.

Как только у вас есть HTML, вы можете делать с ним все, что захотите, так как это всего лишь строка, которой вы собираетесь каким-то образом манипулировать, а затем писать на своей странице.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...