Если вы имеете в виду, что вам нужен способ узнать, является ли файл HTML перед его фактической загрузкой, то вы можете использовать запрос HEAD.Это запросит только заголовки, так что вы можете проверить, равен ли он text/html
, прежде чем загружать файл.Используемый вами метод на самом деле не работает, потому что вы загружаете файл и анализируете его как HTML перед проверкой , что приведет к исключению для файлов, отличных от HTML.
Connection connection = Jsoup.connect(linkInfo.getLink())
.method(Connection.Method.HEAD)
.validateTLSCertificates(false)
.followRedirects(false)
.userAgent(USER_AGENT);
Connection.Response head = connection.execute();
if (!head.contentType().contains("text/html")) return;
Document html = Jsoup.connect(head.url())
.validateTLSCertificates(false)
.followRedirects(false)
.userAgent(USER_AGENT)
.get();