Вы можете использовать iText, если исходный PDF в основном текстовый. Изображения и тому подобное довольно трудно обрабатывать при разборе. Если это только текст, это всего лишь 10 строк кода. См. Примеры в руководстве по iText.
Для записи файлов слов есть только Apache POI. Это может быть немного сложно понять, но для такой простой задачи это не должно быть проблемой.