Я пишу приложение, которое сканирует группу моих веб-страниц. Вместо того, чтобы брать весь исходный код страницы, я хотел бы взять весь контент и сохранить его и иметь возможность сохранять страницу в виде простого текста в базе данных. Контент будет использоваться в других приложениях и не будет читаться пользователями, поэтому нет необходимости, чтобы он был полностью читаемым человеком.
Сначала я думал об использовании регулярных выражений, но я не могу контролировать достоверность веб-страниц, и есть большой шанс, что никакое регулярное выражение не даст мне контент.
Если у меня есть исходный код в строке, как я могу превратить эту строку исходного кода в просто содержимое в C #?