Regex, заменяющий 'символ раздела' в Java - PullRequest
1 голос
/ 19 августа 2010

Я выполняю серию подстановок регулярных выражений (то есть вызовов String.replaceAll), чтобы преобразовать все специальные символы в текстовом файле в специальные символы, разбираемые в XML. Например:

string_out = string_out.replaceAll("&", "&");

Я наткнулся на камень преткновения, заменив «персонажа сечения», то есть этого небольшого закорючения: §

Для начала я занимаюсь редактированием в vi, поэтому не могу даже вставить туда персонажа, поскольку он не является членом стандартной или расширенной ascii. Я также не вижу возможности указать его с помощью шестнадцатеричного кода в регулярном выражении, по той же причине.

Как бы вы указали этот символ для замены регулярного выражения? Или, если вы просто хотите зайти и сказать мне, что где-то уже спрятана функция для преобразования символов, которую я делаю вручную, это тоже круто.

Ответы [ 2 ]

4 голосов
/ 19 августа 2010
Unicode: §
Hex:     0xA7
html:    §
name:    section sign

Вы можете найти его в приложении latin-1 .

0 голосов
/ 19 августа 2010

Вы не можете просто использовать кодовую точку Unicode?

...