как разобрать много PDF-файлов - PullRequest
2 голосов
/ 01 февраля 2010

У меня есть тонна PDF-файлов, которые я хочу иметь возможность разбирать предложение за предложением. Существует ли инструмент для MySQL (или какой-либо другой системы баз данных) для преобразования PDF-файлов в mysql и последующего чтения предложений по одному? Есть ли другой инструмент для этого? Я представлял себе загрузку всех PDF-файлов в БД, и тогда чтение было бы самым быстрым способом, но я не знаю ...

1 Ответ

3 голосов
/ 02 февраля 2010

try pdftotext . Затем вставьте его в БД.

...