Почему Юникод допускается в именах тегов? - PullRequest
0 голосов
/ 03 февраля 2019

На этой веб-странице, одной из тысяч, которые я сканирую, я нашел имя тега с Unicode 0x97.

Используется

<!?~V[if lt IE 7]>
which contains 0xc2 0x96

Согласно конвертеру Unicode c2 96

1007 *

1 Ответ

0 голосов
/ 03 февраля 2019

На основании

<meta http-equiv="Content-Type" content="text/html; charset=windows-1251" />

Я бы сказал, что кодировка не в Unicode, а windows-1251 .

Строка, о которой вы спрашиваете, гласит:

<!—rating forum -->

Этот "странный" символ - em dash .Мой опыт работы с ними заключается в том, что они обычно являются результатом ввода -- (двойной дефис) в Microsoft Office Word, который затем автоматически корректирует его до тире.

Это недопустимый HTML, но он работаетв браузере, потому что браузеры, как правило, стараются исправить испорченный HTML как можно лучше.В этом случае у вас есть элемент, который начинается с <!, этого достаточно, чтобы догадаться, что, хотя он и не является действительным <!--, он все же, вероятно, является началом встроенного комментария.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...