Я долго искал, но пока не нашел ничего, что отвечало бы моим потребностям.( Это было полезно, но не убедительно )
Из двух разных источников я получаю две разные строки.Я хочу проверить, содержится ли более короткий в более крупном.Однако, поскольку эти строки являются корневыми в документе OCR, могут быть очевидные различия.
Пример:
String textToSearch = "Recognized Headline";
String documentText = "This is the document text, spanning multiple pages" .
"..." .
"..." .
"This the row with my Recognizect Head1ine embedded" .
"..." . ^^^^^^^^^^^^^^^^^^^^
"..." .
"End of the document";
Как надежно найти мою строку на странице, не используя автономныйУстановка Lucene / Solr?(Или, может быть, я просто не нашел учебник / руководство ).Должна быть какая-то библиотека, которая может это сделать, верно?