извлечение текста, давая несколько дополнительных символов - PullRequest
0 голосов
/ 18 февраля 2020

Я должен поместить некоторый текст в произвольные места PDF, поэтому мой подход для достижения этой цели:

PDF 1 будет иметь такой текст, как

                    My Name is <field 1> 

PDF 2 будет иметь текст как

                    My Name is ........

Я прочитаю PDF 1 и выясню координаты, а затем запишу данные об этих координатах в PDF 2. Теперь проблема заключается в том, что когда я читаю и другие поля, получаю вывод: -

<_ f_i_e_l_d_1 _>

<поле 2>

<,, f ,, i, e, l, d ,, 3 ,,>

итак, я не мог понять, почему я получаю эти ненужные символы, однако неожиданная вещь находится на той же странице, в некоторых случаях одним и тем же фрагментом кода я получаю правильный вывод.

код, который я использую: textPositions.getUnicode()

...