Laravel - PDF: невозможно кодировать текст из PDF в текст - PullRequest
0 голосов
/ 08 марта 2019

Я пытаюсь загрузить файл PDF и хочу преобразовать его из PDF в текст. Некоторые файлы могут конвертировать и получать текст из PDF с очарованием, но некоторые из них имеют проблемы, как показано на скриншотах. Есть два разных примера (хотя это показывает, что 3, но 2 одинаковы). Верхний и второй одинаковы, что, я думаю, неправильно закодировано (не уверен), а третий - только половина информации. из PDF. Основной контент, который мне нужен, это после того, как он остановится.

Как я могу это исправить?

enter image description here

use App\FilePdf;
use Spatie\PdfToText\Pdf;


$name=$file->getClientOriginalName();
$file->move(public_path().'/pdftotext/', $name);
$path = public_path('/pdftotext/'. $name);
$reader = new \Asika\Pdf2text;
$output = $reader->decode($path);
$data[] = $name;
$output = str_replace(array("\n", "\r"), '', trim($output));

dd($output);

Или, если есть альтернативное решение этой проблемы, пожалуйста, предложите.

Спасибо и ценим ваше время.

...