Почему ANTLR4 ведет себя по-разному при распознавании тильд? - PullRequest
0 голосов
/ 23 ноября 2018

Я использую Google OCR API для преобразования изображения в текст, как только у меня есть текст, грамматика обрабатывает этот текст.

Моя проблема в том, что мой лексер нераспознавать акценты текста, который приносит API Google, но если я копирую и вставляю текст, мой лексер распознает его.

При работе в Eclipse мой лексер не распознает акценты:

Image1

Но если я скопирую текст и вставлю его в Блокнот, мой лексер распознает акценты:

enter image description here

Это мой лексер:

enter image description here

Я думаю, что когда я копирую и вставляю текст и запускаю ANTLR4 из консоли, я форматируютекст, если это так, как я могу распознать акценты, которые приносит Google?

...