Компания хотела бы использовать версию Itextsharp 4.1.6
специально и не хочет покупать лицензию (версия 5/7).Итак, мы уже реализовали TextExtract из pdf, используя версию itextsharp
5.Поскольку мы понизили версию, этот метод не поддерживается в версии 4.1PL LGPL.
Итак, я посмотрел многие StackOverflow и другие сайты для ответа.Похоже, что не найдена пользовательская реализация, кроме приведенного ниже кода, который существует в версии AGPL.
PdfTextExtractor.GetTextFromPage(reader, i, new SimpleTextExtractionStrategy())
И byte[] pageContent = reader.GetPageContent(i);
дает содержимое байта, при преобразовании в строку не даетнам точный текст файла.
Так как, мы не хотим покупать версию AGPL и должны реализовать textextractor
pdf, любая идея, если какой-либо другой инструмент поддерживает это / кто-либо имеет реализацию textextractor
.
Буду признателен за любые предложения.
Редактировать: Ссылка на ответ @ jgoday: ![enter image description here](https://i.stack.imgur.com/8LHEM.png)