Как преобразовать файл PDF, который содержит только таблицы, в эквивалентный формат XML?
Если PDF не содержит тегового содержимого, в PDF нет таблиц «структур», только текст. Я написал сообщение в блоге, объясняющее это на http://www.jpedal.org/PDFblog/2009/04/pdf-text/