HEAD-запросы против получения только `<head>` веб-страницы - PullRequest
0 голосов
/ 04 марта 2012

Я пишу некоторый код очистки ссылок, где я надеялся получить только раздел <head> данной веб-страницы.Очевидно, я не совсем понял, что такое запрос HEAD, так как я думал, что он должен был делать именно это.Вместо этого он просто возвращает заголовки HTTP.

Есть ли способ получить только раздел <head> данной страницы, без получения всего документа?

1 Ответ

2 голосов
/ 04 марта 2012

Нет, это не предусмотрено в протоколе HTTP (который вообще не знает о HTML). Вам нужно будет сделать правильный GET или POST, использовать HTML-парсер для извлечения нужных вам данных.

Единственное, что вы можете сделать, чтобы ограничить то, что вы получите, - это использовать заголовок Range, но это будет лишь догадка о том, сколько данных вы запрашиваете.

...