Допустимый тип содержимого для документов XML, HTML и XHTML - PullRequest
108 голосов
/ 03 июня 2010

Каковы правильные типы содержимого для документов XML, HTML и XHTML?

Мне нужно написать простой сканер, который выбирает только файлы такого типа.

В настоящее время http://example.net/index.html может служить, например, файлом JPEG из-за mod_rewrite, поэтому мне нужно проверить тип содержимого из заголовка ответа и сравнить его со списком разрешенных типов содержимого.

Где взять такой список?

1 Ответ

181 голосов
/ 03 июня 2010

HTML: text/html, полный стоп.

XHTML: application/xhtml+xml или только в случае соблюдения рекомендаций по совместимости HTML text/html. См. W3 Типы носителей Примечание .

XML: text/xml, application/xml ( RFC 2376 ).

Существует также много других типов носителей, основанных на XML, например application/rss+xml или image/svg+xml. Можно с уверенностью сказать, что любое нераспознанное, но зарегистрированное окончание +xml основано на XML. См. Список IANA для зарегистрированных типов носителей, заканчивающихся на +xml.

(Для незарегистрированных типов x- все ставки сняты, но вы надеетесь, что +xml будет соблюдаться.)

...