cURL - извлекает данные только если html-страница (ссылка) - PullRequest
0 голосов
/ 01 апреля 2011

Я создаю веб-сайт оптимизатора CSS, в этом я предложу вариант, когда пользователь отправляет URL-адрес веб-сайта, а на внутреннем сервере сервер будет анализировать все теги anchors и link в этом домене. Таким образом, это позволит сайту объединять + сжимать css, который может быть уникальным на всех страницах.

Поскольку все, что нужно моему веб-сайту, это anchor (html) и <link>, что я должен делать, чтобы избежать получения ссылок, которые non-html (like .doc, .pdf) и т. Д.

Ответы [ 2 ]

1 голос
/ 01 апреля 2011

Я не думаю, что вы можете ответить только о расширении целей.Чистые URL-адреса не всегда имеют расширения в конце, контент может быть сгенерирован.

Вы, вероятно, должны сделать HTTP HEAD для каждого URL, а затем проверить возвращаемый тип контента.

0 голосов
/ 01 апреля 2011

Как насчет проверки типа MIME связанной ссылки с mime_content_type()?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...