Как извлечь все токены {} из строки, используя .Net RegEx? - PullRequest
2 голосов
/ 29 января 2009

Мне нужно извлечь токены, помеченные фигурными скобками из заданной строки.

Я пытался использовать Expresso для создания чего-то, что будет анализировать ...

-------------------------------------------------------------
"{Token1}asdasasd{Token2}asd asdacscadase dfb db {Token3}"
-------------------------------------------------------------

и производим "Token1", "Token2", "Token3"

Я пытался использовать ..

-------------------------------------------------------------
({.+})
-------------------------------------------------------------

... но это, казалось, соответствовало всему выражению.

Есть мысли?

Ответы [ 4 ]

6 голосов
/ 29 января 2009

Попробуйте

\{(.*?)\}
The \{ will escape the "{" (which has meaning in a RegEx).
The \} likewise escapes the closing } backet.
The .*? will take minimal data, instead of just .* 
which is "greedy" and takes everything it can.
If you have assurance that your tokens will (or need to) 
be of a specific format, you can replace .* with an appropriate 
character class. For example, in the likely case you 
want only words, you can use (\w*) in place of the (.*?) 
This has the advantage that closing } characters are not 
part of the class being matched in the inner expression, 
so you don't need the ? modifier). 
2 голосов
/ 29 января 2009

Другое решение:

(?<=\{)([^\}]+)(?=\})

При этом используется предвидение и просмотр сзади, поэтому скобки вообще не используются.

2 голосов
/ 29 января 2009

Попробуйте:

\{([^}]*)\}

Это ограничит поиск внутри волнистых скобок, чтобы остановиться на закрывающей скобке.

1 голос
/ 29 января 2009

Фигурные скобки имеют особое значение в регулярных выражениях, поэтому вы должны избегать их. Используйте \{ и \}, чтобы соответствовать им.

...