Я ищу регулярное выражение в Java, которое соответствует всем пробельным символам в строке. «\ s» соответствует только некоторым, оно не соответствует
и аналогичным пробелам, отличным от ascii. Я ищу регулярное выражение, которое соответствует всем (общим) символам пробела, которые могут встречаться в строке Java.
[Изменить]
Чтобы уточнить: я не имею в виду последовательность строк "
", я имею в виду символ unicode синкодера U + 00A0, который часто представлен как "
", например, в HTML и во всех других символах Юникода с похожим символом пробела, например "NARROW NO-BREAK SPACE" (U + 202F), Word joiner, закодированный в Unicode 3.2 и выше как U + 2060, "ZERO WIDTH NO-BREAK SPACE" (U + FEFF) и любой другой символ, который можно считать белым пространство.
[Ответ]
Для моей цели, то есть перехвата всех пробельных символов, Unicode + традиционное, следующее выражение делает работу:
[\p{Z}\s]
Ответ содержится в комментариях ниже, но поскольку он немного скрыт, я повторяю его здесь.