Не-ASCII символы не фильтруются через регулярное выражение в Java - PullRequest
0 голосов
/ 18 октября 2019

Я использую регулярное выражение [^ \ x00- \ x7F] для фильтрации любых символов, отличных от ascii, в моем приложении Java. Он фильтрует большинство символов, но недавно обнаружил проблему, когда он позволяет управляющему символу, называемому «Начало охраняемой области», см. Ссылку (https://www.codetable.net/name/start-of-guarded-area) для прохождения и отображения как - в моих файлах xml. Хотя этосимвол не является ascii, т.е. находится вне диапазона (0-127), может кто-нибудь пролить свет на то, почему он не фильтруется, и если есть какие-либо другие символы, которые могут не фильтроваться, как это. Обратите внимание, что я использую парсер xstream дляРазбор текста. Любые предложения будут оценены. Спасибо!

...