Как обрабатывать элементы, загруженные через элемент управления WebBrowser? - PullRequest
0 голосов
/ 19 ноября 2010

Я знаю, что можно видеть каждый элемент, загруженный браузером Internet Explorer, через протокол Application Passthrough Protocol.Я делаю это сейчас, но все, к чему у меня есть доступ, это метаданные об элементе (имя, тип контента и т. Д.).Меня спросили, можем ли мы сканировать содержимое каждого элемента.

Можно ли это сделать через интерфейс элемента управления веб-браузера?Можно ли это сделать через приложение?

Если это возможно, можете ли вы дать мне разбивку этапов, в том числе названия интерфейсов, к которым необходимо обращаться?элемент кэшируется?

Как это будет работать, если браузер удерживает элемент в памяти?Делает ли это когда-нибудь?

Обратите внимание, что я имею в виду не только документ верхнего уровня, который изначально извлекается, но и каждый элемент, который выбирается в результате загрузки документа верхнего уровнядокументы в случае рамок).Каждый .css, .js, .jpg и т. Д.

Меня также спросили, можем ли мы сделать то же самое для «исходящего сетевого трафика».Я даже не уверен, что это значит, но я предполагаю, что они имеют в виду просмотр исходящих запросов GET, заголовков и файлов cookie.

1 Ответ

0 голосов
/ 19 ноября 2010

Ответ лежит в приложении.Обработчик транзакции вызывает вашу реализацию IInternetProtocol :: Read.Это шаблон «сменного фильтра MIME», но, поскольку у меня уже есть сквозное приложение, я могу просто прослушивать вызовы Read для сканирования содержимого.Это работает для кэшированных элементов, потому что WinInet имеет дело с кэшированием ниже уровня APP.

...