Получение URL путем сканирования, тип содержимого которого не является text / html - PullRequest
0 голосов
/ 11 июля 2011

Я могу получить все те URL, чей контент / тип - text / html, но если я хочу те URL, чей контент / тип не text / html.Тогда как мы можем это проверить.Что касается строки, мы можем использовать метод contains, но он не имеет ничего общего с notcontains .. Любые предложения будут оценены. А также

The key variable contains:

Content-Type=[text/html; charset=ISO-8859-1]

Это код ниже, чтобы проверитьдля text / html, и я попытался также для содержимого типа, которые не являются text / html, но он также распечатывает те, чей тип содержимого также является text / html.каждый тип контента, как для pdf, это application / pdf

if (key.contains("application/pdf")

и так же для xml ... Но любой другой метод, кроме этого ...

Ответы [ 2 ]

1 голос
/ 11 июля 2011

Поможет ли это?

 if (!connection.getContentType.startsWith("text/html"))
0 голосов
/ 11 июля 2011

Что не так с использованием:

if (key.contains("text/html") || key.contains("text/xhtml")) {
  //Do stuff
} else if (key.contains("application/pdf") {
  //Do other stuff
} else {
  //All other cases
}

Поскольку тип содержимого в других форматах может отличаться в зависимости от каждого типа, вам, вероятно, нужны явные случаи для каждого типа содержимого.Если встречается универсальный тип контента, то универсального метода (else) должно быть достаточно no? Стратегический шаблон может быть вам полезен здесь.

Мои извинения, если я неправильно понял вашу проблему.Можете ли вы привести пример распечатки того, какие различные значения key проходят во время теста?(10-я строка вашего кода)

...