Неожиданная строка состояния: <! DOCTYPE HTML PUBLIC "- // W3C // DTD HTML 4.01 // EN" "http://www.w3.org/TR/html4/strict.dtd"> - PullRequest
0 голосов
/ 06 мая 2019

Я хотел получить и проанализировать конкретный веб-сайт: http://trafo2.fesb.hr/index.html с помощью Android и Kotlin Проблема создает HTML 4.01 (ISO 8879), где любой из методов (Jsoup, okhttp. Url.readText ...) выдает ту же ошибку,

Я перепробовал почти все, что нашел в интернете, плюс тысячи моих идей, ни одна из которых не сработала.Я пытался с Jsoup, Okhttp, URL ..

Это всего лишь несколько неудачных попыток (пробовал одна за другой, извините за беспорядок) ...

         try {
        val url =URL( "http://trafo2.fesb.hr/index.html")
       /*val con =Jsoup.connect("http://trafo2.fesb.hr/index.html").followRedirects(true)
     val resp = con.execute().method(Connection.Method.GET)*/
 //  val completeFile = resp.body()
      //  val doc = resp.parse()


       // val doc = Jsoup.parse(URL("http://trafo2.fesb.hr/index.html"), 2000)
       // val doc  = Jsoup.connect("http://trafo2.fesb.hr/index.html").get()
        //val doc = Jsoup.parse(Jsoup.connect("http://trafo2.fesb.hr/index.html").ignoreHttpErrors(true).get().html())
       /* val urlConnection = url.openConnection() as HttpURLConnection
        val text = urlConnection.inputStream.bufferedReader().readText()*/

        val okHtttClient = OkHttpClient()
        val request = Request.Builder().url(url).build()

        val response = okHtttClient.newCall(request).execute()

Это будет много значитьесли кто-то пытается получить доступ к URL, указанному выше, потому что я все еще не уверен, почему я получаю эту ошибку.Заранее спасибо.

...