Я только начинаю с HTTPClient , и я хочу взять веб-страницу и извлечь из нее необработанный текст минус всякую HTML-разметку.
Может ли HTTPClient это сделать?Если так, то как?Или есть другая библиотека, на которую я должен смотреть?
, например, если страница содержит
<body><p>para1 test info</p><div><p>more stuff here</p></div>
Я бы хотел, чтобы она вывела
para1 test info more stuff here