Я нашел несколько ссылок на отфильтровывание регулярных выражений не на английском языке, но нет из них в Java, за исключением того факта, что они все ссылаются на несколько различных проблем, чем чтоЯ пытаюсь решить:
- Заменить все неанглийские символы пробелом.
- Создать метод, который возвращает
true
, если строка содержит любой неанглийский символ.
Под «английским текстом» я подразумеваю не только фактические буквы и цифры, но и знаки препинания.
Пока что я смог прийти к цели №1 очень просто:
String.replaceAll("\\W", " ")
На самом деле, все так просто, что я подозреваю, что что-то упустил ... Вы замечаете какие-либо предостережения в вышеприведенном?
Что касается цели №2, я мог бы просто1021 * строка после выше replaceAll()
, затем проверьте, не пусто ли оно.Но ... Есть ли более эффективный способ сделать это?