как открыть файл .docx, .doc, .pdf с помощью php и прочитать первые 50 символов первой строки - PullRequest
0 голосов
/ 19 июня 2019

Я хочу знать, как открыть файл с расширением .docx, .doc, .pdf с помощью php, а затем прочитать первую строку из 50 символов.

Код:

****include_once 'inc/docx.php';
include_once 'inc/PdfParser.php'; ****   

            if ($imageFileType == 'pdf') {
                    $pdfObj = new PdfParser();
                    $resumeText = $pdfObj->parseFile($target_file);
                    // $resumeText = $pdfObj->getText();
                } else {
                    $docObj = new DocxConversion($target_file);
                    $resumeText = $docObj->convertToText();

                }




           $fileInfo = explode(PHP_EOL, $resumeText);
                $records = [];
                foreach ($fileInfo as $row) {
                    // if($row == '') continue;
                    // $parts = explode(',12', $row);
                    $parts = preg_split('/(?<=[.?!])\s+(?=[a-z])/i', $row);
                    foreach ($parts as $part) {
                        if ($part == '') {
                            continue;
                        }
                    // echo $part.'<br><br>';
                        $part = strtolower($part);

как открыть файл .docx, .doc, .pdf с помощью php и прочитать первые 50 символов первой строки

1 Ответ

0 голосов
/ 19 июня 2019

Я думаю, вы должны использовать эту библиотеку PHPOffice / PHPWord , которая позволяет вам читать все типы документов, которые вы упоминаете.

Вероятно, вам следует сначала проверить тип документа, а затем использовать другую функцию для извлечения текста и получения первых 50 символов.

Уже успешно использовал эту библиотеку.

...