Используя шаблон регулярного выражения Java, я хочу соответствовать символу &.Но он не должен совпадать с &, < и т. Д. (Кодировка HTML).
&
&
<
Попробуйте это:
&(?![A-Za-z]+;|#[0-9]+;)
Это соответствует &, за которым не следуют ни одна или несколько букв ASCII и ; или символ хеша, за которыми следуют одна или несколько цифр ASCII и символ "";.»
;
Я не думаю, что Regex - правильный путь для решения этой проблемы. Ведите список всех кодировок HTML, которые вы хотите удалить. Предварительно обработайте текст и удалите все подобные вхождения, а затем проверьте «&».