используя Kanna для анализа html из url.tried swfitsoup, но та же проблема.
func getContentFromHtml(urlString : String) -> String{ let url = URL(string: urlString)! var result = "" do { let doc = try HTML(url: url, encoding: .utf8) for description in doc.xpath("//meta[@property=\"og:description\"]") { if let contentDescription = description["content"] { result = contentDescription } } } catch let error { print(error.localizedDescription) } return result }
Я получаю 34 URL от Google RSS (https://news.google.com/rss?hl=ko&gl=KR&ceid=KR: ko ) через l oop и перейдите к этому методу.
, но с некоторыми URL-адресами он не преобразует URL в html с кодом ошибки
, например, https://news.google.com/__i/rss/rd/articles/CBMiMWh0dHBzOi8vd3d3Lnl0bi5jby5rci9fbG4vMDEwM18yMDIwMDMyNTIxNTk0Mzg0NzXSAUNodHRwczovL20ueXRuLmNvLmtyL25ld3Nfdmlldy5hbXAucGhwP3BhcmFtPTAxMDNfMjAyMDAzMjUyMTU5NDM4NDc1?oc=5
этот URL-адрес от rss вызывает ошибку.
The operation couldn’t be completed. (Kanna.ParseError error 1.) or EncodingMismatch
, но эти URL-адреса удобны для доступа.
Как это исправить?