Подберите C # Unicode Identifier, используя Regex - PullRequest
5 голосов
/ 09 декабря 2010

Как правильно сопоставить идентификатор C #, в частности имя свойства или поля, с использованием шаблонов .Net Regex?

Фон. Раньше я использовал ASCII-ориентированный @ "[_ a-zA-Z] [_ a-zA-Z0-9] *", но теперь прописные и строчные символы юникода допустимы, например "AboöДЖem". Как мне включить их в шаблон?

Спасибо, Max

Ответы [ 3 ]

8 голосов
/ 19 октября 2012

Вот версия, которая учитывает запрещенные начальные цифры:

^(?:((?!\d)\w+(?:\.(?!\d)\w+)*)\.)?((?!\d)\w+)$

А вот несколько тестов в PowerShell:

[regex]$regex = '(?x:
    ^                        # Start of string
    (?:
        (                    # Namespace
            (?!\d)\w+        #   Top-level namespace
            (?:\.(?!\d)\w+)* #   Subsequent namespaces
        )
        \.                   # End of namespaces period
    )?                       # Namespace is optional
    ((?!\d)\w+)              # Class name
    $                        # End of string
)'
@(
    'System.Data.Doohickey'
    '_1System.Data.Doohickey'
    'System.String'
    'System.Data.SqlClient.SqlConnection'
    'DoohickeyClass'
    'Stackoverflow.Q4400348.AboöДЖem'
    '1System.Data.Doohickey' # numbers not allowed at start of namespace
    'System.Data.1Doohickey' # numbers not allowed at start of class
    'global::DoohickeyClass' # "global::" not part of actual namespace
) | %{
    ($isMatch, $namespace, $class) = ($false, $null, $null)
    if ($_ -match $regex) {
        ($isMatch, $namespace, $class) = ($true, $Matches[1], $Matches[2])
    }
    new-object PSObject -prop @{
        'IsMatch'   = $isMatch
        'Name'      = $_
        'Namespace' = $namespace
        'Class'     = $class
    }
} | ft IsMatch, Name, Namespace, Class -auto
5 голосов
/ 09 декабря 2010

Согласно http://msdn.microsoft.com/en-us/library/aa664670.aspx, и игнорированию ключевых слов и unicode-escape-sequence stuff,

@?[_\p{Lu}\p{Ll}\p{Lt}\p{Lm}\p{Lo}\p{Nl}][\p{Lu}\p{Ll}\p{Lt}\p{Lm}\p{Lo}\p{Nl}\p{Mn}\p{Mc}\p{Nd}\p{Pc}\p{Cf}]*
0 голосов
/ 09 декабря 2010

Будет ли эта проблема, решаемая предопределенными классами в регулярном выражении \ w, соответствовать öД.

...