Получить количество слов для первой строки в файле doc / docx / pdf - PullRequest
0 голосов
/ 22 октября 2019

Для моей задачи я должен получить общее количество слов загруженного файла .doc, .docx или .pdf. Затем я должен найти количество слов в первой строке документа и удалить его из общей суммы (поскольку это, вероятно, будет заголовок).

Я использую doccounter чтобы найти общее количество слов в документе как таковое:

include "class.doccounter.php";

$doc = new DocCounter();
$doc->setFile("file.ext");

print_r($doc->getInfo());
echo ($doc->getInfo()->wordCount);

Осталось только найти количество слов в первой строке загруженного файла. Любые решения, включая дополнительные библиотеки или нативные реализации, приветствуются! Спасибо!

Редактировать - Решение (Кредит Rustyjim ):

$doc = new DocCounter();
$doc->setFile("file.pdf");
$text = $doc->getInfo()->toText; // Edited doccounter to return text as string
$array = explode("\n", $text); // every cell contains a new line of the text
echo $array[0]; // First line

1 Ответ

0 голосов
/ 23 октября 2019

Может быть, вы можете использовать разнесение на новые строки, как:

$array = explode("\n", $doc);

Затем используйте первый элемент массива для подсчета символов:

echo strlen($array[0]);

Надеюсь, что поможет

...