У меня есть огромный HTML с несколькими специальными символами в формах
или "�
.
Некоторые из них не правы, потому что им не хватает начального & .
Я бы хотел найти такие неправильные пространственные символы . Я знаю, что могу искать все нужные специальные символы с помощью следующего регулярного выражения:
\&(?:[a-z]+|#x?\d+);\
Но мне понадобится регулярное выражение, полезное для поиска неправильных (без начального &).
Вы можете мне помочь?
Заранее спасибо
Edit:
Как и предполагалось, я выложу пример. Мой HTML содержит следующее утверждение:
<![CDATA[<nolink>blablabla blablabla</nolink>]]>quot;
где у нас есть 2 специальных символа HTML:
Я заинтересован в нахождении второго элемента, потому что он неправильный (с начальной буквой &).
Таким образом, вывод запрошенного регулярного выражения должен быть: quot;