Я пытаюсь прочитать PDF с php, так как текст появляется на странице, а не необработанный текст
Я пробовал pdfparser и получаю тот же результат, что и этот код:
<?
include('class.pdf2text.php');
$cfile = "mydoc.pdf";
$a = new PDF2Text();
$a->setFilename($cfile);
$a->decodePDF();
$res = $a->output();
echo $res;
?>
PDF выглядит примерно так (упрощенный пример):
Рейтинг: 2% Возраст: 14
Значение: 230 000 единиц: 1
Однако pdf2test и pdfparser вытягивают текст таким образом
Частота: Возраст: Значение: Единица измерения: 2230000114
Я попытался создать правила, основанные на порядке чисел (из 4 # первое - это скорость, второе значение, третьи # единицы и четвертый возраст). Но вложения с данными, которые я получаю, не одинаковы, данные имеют тенденцию «плавать» повсюду, или иногда ничего не происходит
Вот почему я хочу прочитать PDF, скажи, что вижу его