При синтаксическом анализе do c, docx с использованием Apache POI, некоторые слова разделяются на отдельные символы. - PullRequest
0 голосов
/ 28 мая 2020

Слово WEBSITE разбивается на три элемента строки символов 'WEBSI', 'T', 'E', , хотя они имеют одинаковые стили. как это исправить, чтобы он не разбивался.

Аналогично для всего заголовка:

element: FIRST PAGE OF GRANTS.GOV WEBSI element : Элемент T: Элемент E: Первый раздел:
элемент: Элемент запроса f: или элемент: Элемент A: элемент pplication (RFA): Элемент объявления: CAFTA-DR Элемент En: элемент программы виртуального сотрудничества: Управление программой малых грантов для элемента Pub: l элемент: i c Участие

образец файла docx можно скачать отсюда

снимок экрана образца файла docx

...