Вы могли бы быть в состоянии осуществить такие вещи, если вы точно знаете, где текст должен быть заранее, и можете получить расположение текста по мере его извлечения.
Если вы заранее не знаете, где находятся строки и ячейки, вам придется угадывать, исходя из расположения текста.Это будет нелегко.
Как правило, извлечение данных из PDF не рекомендуется.В PDF-файлах отсутствует понятие «таблицы» (если только создатель PDF-файлов не использует этот «метод маркированного содержимого», что все еще встречается редко).PDF-файлы содержат линии, глифы и изображения (куча пикселей).Из этой информации очень сложно извлечь форматирование ... а иногда это практически невозможно.
Я не знаю, даст ли PDFBox местоположение извлеченного текста, а iTextSharp -.