Получить источник страницы из компонента веб-браузера GeckoFX - PullRequest
0 голосов
/ 26 октября 2010

HTML-код из свойства GeckoWebBrowser.Document.DocumentElement.InnerHtml отличается от HTML-файла, загруженного с сервера, поскольку он конвертируется в DOM и может существовать Javascript, который изменяет структуру документа.

Как получить реальный источник страницы?

Ответы [ 2 ]

3 голосов
/ 23 февраля 2011

Для этого есть метод:

GeckoWebBrowser.ViewSource();

или

GeckoWebBrowser.ViewSource(string url);

Открывает новое окно, в котором содержится исходный код текущей (или указанной) страницы.Если вы просто хотите текст, попробуйте:

GeckoWebBrowser.Navigate("view-source:" + url);
0 голосов
/ 11 апреля 2016

У меня есть новый способ решить вашу проблему следующим образом:

GeckoWebBrowser1.Navigate("about:blank")

Me.Delay(1) Заставьте свою функцию ждать здесь 1 секунду

GeckoWebBrowser1.Navigate("view-source:" + "YourUrl")
...