pdftohtml работает отлично: быстро, стабильно, но результат html в лучшем случае безобразен. Я довольно долго использовал его для веб-сайта, на котором много резюме.
Однако это хорошее решение для извлечения текстового контента.
Я бы попробовал scribd API
http://www.scribd.com/developers/api
или API документа приложений Google. GOogle отлично справляется с отображением и преобразованием PDF-файлов