Мне нужно создать индекс данных HTML-страниц, предоставляемых службе, по сути захватывая весь текст на них и помещая их в строку, чтобы перейти в систему хранения.
Если бы это было на основе графического интерфейса, япросто Ctrl + A на HTML-странице, скопируйте его, затем перейдите в Блокнот и Ctrl + V.Simples.Если я смогу сделать это с помощью старой доброй точки n 'click, то, безусловно, должен быть способ сделать это программно, но я изо всех сил пытаюсь найти что-нибудь полезное.
Документы HTML, о которых идет речь, загружаются длярендеринг в настоящее время с использованием класса System.Windows.Controls.WebBrowser, так что мне интересно, возможно ли каким-то образом получить данные оттуда?
Я собираюсь продолжать охоту, но любые указатели будут очень признательны.
Примечание. Мы не хотим получить исходный код HTML, а также не будем разбирать весь исходный код, чтобы получить текст, если только нам это не нужно.