Если вы еще не знаете точно, какой диапазон байтов данного потока контента представляет собой абзац или таблицу, попытка добавить эту информацию после факта практически невозможна, учитывая произвольный PDF.
Если все ваши PDF-файлы взяты из данного отчета из определенного приложения, вы можете начать жульничать и вернуть все в реальность, но это все еще очень сложно.
Можете ли вы описать вашу установку более подробно?
Привет обратно.
Прежде всего, моя главная цель - как пометить теги.
Если вы берете iText в действии (2-е издание), есть целая глава на эту тему, глава 15. Примеры доступны в режиме онлайн.
Нет необходимости определять абзац или таблицу на начальном этапе. Однако это требуется.
Тогда у вас огромная проблема. iText может дать вам координаты всего текста на странице, но вы сами должны превратить эти глобусы координат и текста в абзацы.
Это, вероятно, потребует отслеживания текущей базовой линии и наблюдения, когда она меняется на X против изменений на Y. Любой вид необычного форматирования потребует особых случаев. Я ожидаю, что у вас будет много особых случаев. Нет Буэно.
Но главное беспокойство - начать помечать PDF. Можете ли вы предоставить начальный шаг / ссылку для начала.
Купите книгу или, по крайней мере, посмотрите онлайн-образцы.
еще одна вещь. это возможно через .Net?
Да. iText и iTextSharp практически идентичны с точки зрения функциональности в наши дни, хотя это было не всегда так. Я думаю, что они идентичны, но я не уверен.