pdf2text дает вам именно то, что говорит: он извлекает текст из файла PDF, он не преобразует его в html-разметку .Возможно, вам понадобится утилита командной строки или онлайн-сервис для этого.
Есть командная строка linux pdftohtml tool
Poppler это еще один вариант, он содержит утилиту pdftohtml
или есть jPedal , если вы готовы рассмотреть java-приложение
Существует также целый ряд коммерческих приложенийэто сделает это, но я предполагаю, что вы хотите "бесплатно"