В HTML нет такой вещи, как «просто текст». Текст, который вы видите на веб-странице, отображается в соответствии с тем, как определена разметка.
Вы можете вручную обрезать все теги HTML между тегами <body></body>
, тогда у вас будет что-то вроде всего текста на странице. Однако это может привести к ошибкам.
Большинство решений, которые вы найдете в Интернете, выберут регулярное выражение (что-то вроде Regex.Replace(str, "<(.|\n)*?>", string.Empty);
), но если вы воспользуетесь этим, вы, вероятно, однажды выстрелите себе в ногу.