Читайте PDF с php построчно, так как текст появляется на странице - PullRequest
1 голос
/ 18 июня 2019

Я пытаюсь прочитать PDF с php, так как текст появляется на странице, а не необработанный текст

Я пробовал pdfparser и получаю тот же результат, что и этот код:

<?
    include('class.pdf2text.php');

$cfile = "mydoc.pdf";       

$a = new PDF2Text();
$a->setFilename($cfile); 
$a->decodePDF();
$res = $a->output(); 

echo $res;
  ?>

PDF выглядит примерно так (упрощенный пример):

Рейтинг: 2% Возраст: 14

Значение: 230 000 единиц: 1

Однако pdf2test и pdfparser вытягивают текст таким образом

Частота: Возраст: Значение: Единица измерения: 2230000114

Я попытался создать правила, основанные на порядке чисел (из 4 # первое - это скорость, второе значение, третьи # единицы и четвертый возраст). Но вложения с данными, которые я получаю, не одинаковы, данные имеют тенденцию «плавать» повсюду, или иногда ничего не происходит

Вот почему я хочу прочитать PDF, скажи, что вижу его

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...