арабский c pdf в текст с помощью Symfony4 - PullRequest
0 голосов
/ 08 февраля 2020

У меня есть арабский c pdf Мне нужен инструмент или класс для преобразования его в текстовый файл,

Я пробовал PDF2Text & XPDF

результат: слова инвертированы

23/01/2020 1 4242 - 1 - 1 - 4001 7 - 10 - 4004 4341 ددع رارقلا: 4341 يف خرؤملا: 3 - 10 - 4004 يندم فلم ددع 4242 - 1 - 1 - 4001 يلاولا يلع. دض نسحلا نب سيسحا دمحم. ةيبرغملا ةكلمملا هدحو هلل دمحلا كلملا ةلالج مساب خيراتب: 3 - 10 - 4004 لوألا مسقلا ةيندملا ةفرغلا نإ ىلعألا سلجملا نم هصن يتآلا رارقلا تردصأ ةينلعلا ...

<?php

namespace App\Controller;


use XPDF\PdfToText;
use Monolog\Handler\NullHandler;
use Symfony\Bridge\Monolog\Logger;
use Symfony\Component\Routing\Annotation\Route;
use Symfony\Bundle\FrameworkBundle\Controller\Controller;

class Pdf2textController extends Controller
{
    /**
     * @Route("/pdf", name="pdf2text")
     */
    public function index()
    {
        $pdfFilePath = $this->getParameter('kernel.project_dir') . '/public/documentsPDF/ـ-تحفيظ-ـ-حيازة-ـ-التصرف-–-شراء-ـ-استغلال-الملك_3.pdf';
        // Create a logger
        $logger = new Logger('MyLogger');
        $logger->pushHandler(new NullHandler());

        $pdfToText = PdfToText::create(array(
            'pdftotext.binaries' => 'C:\Program Files\Xpdf\pdftotext.exe',
            'pdftotext.timeout' => 30, // timeout for the underlying process
        ), $logger);


        $text = $pdfToText->getText($pdfFilePath);

        return $this->render('pdf2text/index.html.twig', [
            'controller_name' => 'Pdf2textController',
            'text' => $text
        ]);
    }
}

Может ли один помочь, пожалуйста

?
...