html не является c. Это может измениться со временем. Если вы сделаете запрос get на URL сайта, вы получите начальное значение html для этого сайта. Но в браузерах есть такая вещь, называемая javascript, которая может со временем изменять HTML страницы. На самом деле это довольно часто: - сайт сначала загружается с некоторыми javascript - javascript (разработанным создателем сайта), чем работает и делает вещи - содержимое динамически изменяется, вызывая некоторый API с помощью этого javascript
Вы не можете очистить этот контент путем HTML очистки базового URL.
Если вы спросите меня, как бы я это сделал, в любом случае, ищите HTTP-запросы сайта, где он получает содержание. Посмотрите на этот API и используйте этот API самостоятельно. Получить данные и сохранить их на некоторых моих серверах. Затем на клиенте я вызываю API моего сервера, чтобы получить эти данные. Также я не совсем уверен, что это законно.
Но, насколько я понял по твоим последним вопросам, ты не хочешь этого делать.
Если вам действительно нужно сделать это на клиенте, вы можете использовать WKWebView
, загрузить страницу, подождать, пока появится содержимое, и затем получить текущую HTML страницы, выполнив что-то вот так:
webView.evaluateJavaScript("document.documentElement.outerHTML.toString()",
completionHandler: { (html: Any?, error: Error?) in
print(html)
})
Посмотрите этот ответ , чтобы узнать больше об этом.
Я надеюсь, что это решит все ваши проблемы, потому что я думаю, что у меня нет гораздо больше времени, чтобы помочь вам: D