Для моей задачи я должен получить общее количество слов загруженного файла .doc, .docx или .pdf. Затем я должен найти количество слов в первой строке документа и удалить его из общей суммы (поскольку это, вероятно, будет заголовок).
Я использую doccounter чтобы найти общее количество слов в документе как таковое:
include "class.doccounter.php";
$doc = new DocCounter();
$doc->setFile("file.ext");
print_r($doc->getInfo());
echo ($doc->getInfo()->wordCount);
Осталось только найти количество слов в первой строке загруженного файла. Любые решения, включая дополнительные библиотеки или нативные реализации, приветствуются! Спасибо!
Редактировать - Решение (Кредит Rustyjim ):
$doc = new DocCounter();
$doc->setFile("file.pdf");
$text = $doc->getInfo()->toText; // Edited doccounter to return text as string
$array = explode("\n", $text); // every cell contains a new line of the text
echo $array[0]; // First line