Если вас интересуют только определенные части исходного файла, вы можете установить filter=true
в ваших options {...} разделах.Это позволит вам определять только те токены, которые вас интересуют, а то, что вы не определяете, игнорируется лексером.
Обратите внимание, что это работает только с грамматикой лексера, а не в комбинированном (или парсере)) грамматики.
Небольшая демонстрация:
lexer grammar CSharpClassLexer;
options {
language=CSharp2;
filter=true;
}
@namespace { Demo }
Comment
: '//' ~('\r' | '\n')*
| '/*' .* '*/'
;
String
: '"' ('\\' . | ~('"' | '\\' | '\r' | '\n'))* '"'
| '@' '"' ('"' '"' | ~'"')* '"'
;
Class
: 'class' Space+ Identifier
{Console.WriteLine("Found class: " + $Identifier.text);}
;
Space
: ' ' | '\t' | '\r' | '\n'
;
Identifier
: ('a'..'z' | 'A'..'Z' | '_') ('a'..'z' | 'A'..'Z' | '_' | '0'..'9')*
;
Важно, чтобы вы оставили там Identifier
, потому что вы не хотите, чтобы Xclass Foo
маркировался как: ['X', 'class', 'Foo']
.С Identifier
там, Xclass
станет полным идентификатором.
Грамматика может быть проверена со следующим классом:
using System;
using Antlr.Runtime;
namespace Demo
{
class MainClass
{
public static void Main (string[] args)
{
string source =
@"class TestClass
{
int a = 42;
string _class = ""inside a string literal: class FooBar {}..."";
class Nested {
/* class NotAClass {} */
// class X { }
class DoubleNested {
string str = @""
multi line string
class Bar {}
"";
}
}
}";
Console.WriteLine("source=\n" + source + "\n-------------------------");
ANTLRStringStream Input = new ANTLRStringStream(source);
CSharpClassLexer Lexer = new CSharpClassLexer(Input);
CommonTokenStream Tokens = new CommonTokenStream(Lexer);
Tokens.GetTokens();
}
}
}
, который производит следующий вывод:
source=
class TestClass
{
int a = 42;
string _class = "inside a string literal: class FooBar {}...";
class Nested {
/* class NotAClass {} */
// class X { }
class DoubleNested {
string str = @"
multi line string
class Bar {}
";
}
}
}
-------------------------
Found class: TestClass
Found class: Nested
Found class: DoubleNested
Обратите внимание, что это всего лишь небольшая демонстрация, я не уверен, обработал ли я правильные строковые литералы в грамматике (я не знаком с C #), но эта демонстрация должна дать вам начало.
Удачи!