При использовании регулярных выражений Java требуется сопоставлять только &, но не & & etc - PullRequest
1 голос
/ 16 февраля 2011

Используя шаблон регулярного выражения Java, я хочу соответствовать символу &.Но он не должен совпадать с &, < и т. Д. (Кодировка HTML).

Ответы [ 2 ]

4 голосов
/ 16 февраля 2011

Попробуйте это:

&(?![A-Za-z]+;|#[0-9]+;)

Это соответствует &, за которым не следуют ни одна или несколько букв ASCII и ; или символ хеша, за которыми следуют одна или несколько цифр ASCII и символ "";.»

2 голосов
/ 16 февраля 2011

Я не думаю, что Regex - правильный путь для решения этой проблемы. Ведите список всех кодировок HTML, которые вы хотите удалить. Предварительно обработайте текст и удалите все подобные вхождения, а затем проверьте «&».

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...