Скопируйте весь текст из веб-браузера - PullRequest
2 голосов
/ 14 апреля 2010

Можно ли соскрести весь текст с сайта, на который перешел элемент управления WebBrowser, не глядя на источник?

Ответы [ 3 ]

4 голосов
/ 09 марта 2011
string browserContents = webBrowser.Document.Body.InnerText;
4 голосов
/ 30 августа 2013

Метод Дэвида Уокера хорош, когда не требуется ни информация из заголовка, ни основная часть веб-страницы. если нужно что-то вне внутреннего текста, есть только два варианта, один из них - разобрать с помощью getElement. другой - выпустить команды (Document.ExecCommand) для веб-обозревателя, чтобы выбрать все и скопировать в буфер обмена:

wb.Document.ExecCommand("SelectAll", false, null);
wb.Document.ExecCommand("Copy", false, null);

тогда наконец строка content = clipboard.getText ();

Обратите внимание, что написание и синтаксис могут быть неверными, я вспоминаю из моей памяти

4 голосов
/ 14 апреля 2010

Вы используете свойство DocumentText или элемент управления WebBrowser.

Это свойство содержит HTML-код сайта, на который вы перешли.

Обновление: (следующие комментарии)

Если вы хотите проанализировать HTML и получить его текстовые части, я предлагаю вам использовать HTML Agility Pack .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...