Я использовал этот PDF tutorialspoint.com / uipath / uipath_tutorial.pdf .. Где я пытаюсь найти текст «часть соревнований», который имеет x = 55,6 мм, y = 168,8 ширины = 210,0 мм и высота = 297,0. Но я получаю пустое значение
Я проверил ваш метод с этими входами:
System.out.println("Extracting like Venkatachalam Neelakantan from uipath_tutorial.pdf\n");
float MM_TO_UNITS = 1/(10*2.54f)*72;
String text = getTextUsingPositionsUsingPdf("src/test/resources/mkl/testarea/pdfbox2/extract/uipath_tutorial.pdf",
0, 55.6 * MM_TO_UNITS, 168.8 * MM_TO_UNITS, 210.0 * MM_TO_UNITS, 297.0 * MM_TO_UNITS);
System.out.printf("\n---\nResult:\n%s\n", text);
( ExtractText test testUiPathTutorial
)
и получил результат
part of contents of this e-book in any manner without written consent
te the contents of our website and tutorials as timely and as precisely as
, the contents may contain inaccuracies or errors. Tutorials Point (I) Pvt.
guarantee regarding the accuracy, timeliness or completeness of our
tents including this tutorial. If you discover any errors on our website or
ease notify us at contact@tutorialspoint.com
i
Предполагая, что вы на самом деле искали «часть содержимого», а не «часть контестов», просто отсутствует «a»; вероятно, при измерении вы искали начало видимой буквы, но фактическое происхождение глифа немного раньше. Если вы выберете чуть меньше x , например, 54,6 мм, вы также получите «а».
Очевидно, неудивительно, что вы получаете больше, чем «часть содержимого», учитывая ширину и высоту вашего прямоугольника.
Если вас интересует постоянная MM_TO_UNITS
, взгляните на этот ответ .