Я бы предположил, что это действительно только гипотетически возможно. То есть, это звучит так, как будто программное обеспечение должно делать это, но реальность сильно отличается. Поскольку вы правильно заявляете, что DOC и PDF - это очень разные форматы, и единственный способ создать точный перевод DOC в формате PDF в формате PDF - это распечатать его и записать вывод, как это делают многие создатели PDF.
POI и другое программное обеспечение, такое как Aspose.Words, позволит вам прочитать структуру DOC, а iText позволит вам создать PDF, но обязательно найдется миллион маленьких слабостей и крайних случаев в обоих, что означает, что любой реализация конвертера наверняка будет нетривиальной. Вдобавок ко всему, я могу сказать, что iText плохо поддерживает разбиение строк в таблицах. В проекте, над которым я работал, мы должны были визуализировать ячейки таблицы с разбивкой строк как своего рода «изображение вне экрана», а затем вставить изображение в одну ячейку таблицы. Достаточно приятный взлом в конце концов, но вам будет очень трудно воспроизвести некоторые из более богатых функций, которые поддерживает DOC, прежде чем вы даже начнете думать о встроенных объектах OLE, элементах управления ActiveX, автофигурах, языках справа налево, и т. д. И давайте не будем забывать, что каждая версия Word вводит новые функции в DOC и исправляет некоторые вещи, которые неправильны в старых версиях.
Для достаточно простых документов вы можете достичь разумного результата при небольших усилиях. Я никогда не делал этого, и я не хотел бы попробовать, потому что я знаю, что результаты будут посредственными, когда сложность исходного документа поднимется за пределы абзацев и заголовков. Что бы вы ни пытались сделать, я бы посоветовал вам сначала искать другой путь.