Я работал над приложением OCR, которое находит конкретную информацию в накладной. Однако проблема в том, что OCR иногда не распознает символы идеально, например, «доставка» становится «deiivery». Поскольку у меня нет большого опыта работы с регулярными выражениями, я не знаю, существует ли способ для регулярного выражения соответствовать частичным шаблонам? Например, у меня есть шаблон, который ищет «доставку», а затем принимает цифры за этим.
(?i:delivery)[\s\.:-]*([\d]*)[\w]?
однако в случае, если «доставка» становится «deiivery», регулярное выражение не выполняется. Это происходит и с другими словами / тегами. Есть ли какой-нибудь токен регулярного выражения, который позволяет мне сопоставлять текст, даже если ввод подходит только частично? Регулярное выражение выполняется в приложении Java. Я узнал о
.hitEnd()
но AFAIK это работает только для частичного совпадения «начало» («aa» распознается с регулярным выражением «aabb»), а не частичное «полное» совпадение («aba» не будет распознаваться с регулярным выражением «aaa»).