RTL-чтение - только представление, в то время как в памяти (и это то, что считается для лексера ANTLR4) символы хранятся в порядке возрастания адресов памяти, как и для любого другого языка.ANTLR4 теперь полностью поддерживает Unicode, и вы сможете писать свои правила на любом языке, который поддерживается Unicode (как для имен правил грамматики, так и для содержимого лексера).