Я использую Apache PDFBox и перебираю страницу за страницей для извлечения текста.Но в то же время я должен удалить зачеркнутый текст, который находится между.
Я попытался: Обнаружить текст, выделенный жирным шрифтом, курсивом и перечеркнутым, используя PDFBox с VB.NET
, но в большинстве моих сценариев это не помогло.
Я также попытался: PDFBox удалить комментарий сохранить зачеркнутый
Есть ли библиотеки, которые делают это?