Я делаю HTML-разбор с использованием регулярных выражений (да, я знаю, никогда не разбираю HTML с регулярными выражениями, но я просто извлекаю его, и я, к сожалению, тоже не могуиспользовать любые внешние библиотеки).Я использую регулярное выражение из книги рецептов регулярных выражений, и оно отлично работает, за исключением того, что я только что столкнулся с этой проблемой:
В строке Bob Saget <bobs@aol.com>
мое регулярное выражение совпадает с адресом электронной почты как тегом.
Итак, мой вопрос: является ли знак @
допустимым символом XML или HTML tag ?(Я не спрашиваю, действительно ли это допустимо в атрибуте; я знаю, что это так). Если это не так, я смогу успешно исключить его в своем регулярном выражении.
Я не уверенгде это посмотреть.Я посмотрел здесь и думаю, что это говорит о том, что в XML знак at не разрешен в теге;однако я был бы признателен за конкретное доказательство.