У меня есть арабский c pdf Мне нужен инструмент или класс для преобразования его в текстовый файл,
Я пробовал PDF2Text & XPDF
результат: слова инвертированы
23/01/2020 1 4242 - 1 - 1 - 4001 7 - 10 - 4004 4341 ددع رارقلا: 4341 يف خرؤملا: 3 - 10 - 4004 يندم فلم ددع 4242 - 1 - 1 - 4001 يلاولا يلع. دض نسحلا نب سيسحا دمحم. ةيبرغملا ةكلمملا هدحو هلل دمحلا كلملا ةلالج مساب خيراتب: 3 - 10 - 4004 لوألا مسقلا ةيندملا ةفرغلا نإ ىلعألا سلجملا نم هصن يتآلا رارقلا تردصأ ةينلعلا ...
<?php
namespace App\Controller;
use XPDF\PdfToText;
use Monolog\Handler\NullHandler;
use Symfony\Bridge\Monolog\Logger;
use Symfony\Component\Routing\Annotation\Route;
use Symfony\Bundle\FrameworkBundle\Controller\Controller;
class Pdf2textController extends Controller
{
/**
* @Route("/pdf", name="pdf2text")
*/
public function index()
{
$pdfFilePath = $this->getParameter('kernel.project_dir') . '/public/documentsPDF/ـ-تحفيظ-ـ-حيازة-ـ-التصرف-–-شراء-ـ-استغلال-الملك_3.pdf';
// Create a logger
$logger = new Logger('MyLogger');
$logger->pushHandler(new NullHandler());
$pdfToText = PdfToText::create(array(
'pdftotext.binaries' => 'C:\Program Files\Xpdf\pdftotext.exe',
'pdftotext.timeout' => 30, // timeout for the underlying process
), $logger);
$text = $pdfToText->getText($pdfFilePath);
return $this->render('pdf2text/index.html.twig', [
'controller_name' => 'Pdf2textController',
'text' => $text
]);
}
}
Может ли один помочь, пожалуйста
?