Я использую Java API Selenium 2 для взаимодействия с веб-страницами.Мой вопрос: как я могу определить тип содержимого адресатов ссылок?
По сути, это фон: перед тем, как щелкнуть ссылку, я хочу быть уверен, что ответ является HTML-файлом.Если нет, мне нужно разобраться с этим по-другому.Итак, допустим, есть ссылка для скачивания PDF-файла.Приложение должно непосредственно читать содержимое этого URL, а не открывать его в браузере.
Цель состоит в том, чтобы иметь приложение, которое автоматически знает, является ли текущее местоположение HTML, PDF, XML или любым другим, чтобы использовать соответствующеепарсеры для извлечения полезной информации из документов.
Обновление
Добавленная награда: вознаградит ее лучшим решением, которое позволит мне получить тип контента для данногоURL.