Для поиска в PDF вам понадобится программа типа pdftotext, которая преобразует содержимое из PDF в текст. Для документов Word может быть доступна симуляция (из-за всех стилей и шифрований в файлах Word).
Пример для поиска в PDF (скопирован из одного из моих сценариев (это фрагмент, а не весь код, но он должен дать вам некоторое понимание), где я извлекаю ключевые слова и сохраняю совпадения в массиве результатов PDF). :
foreach($keywords as $keyword)
{
$keyword = strtolower($keyword);
$file = ABSOLUTE_PATH_SITE."_uploaded/files/Transcripties/".$pdfFiles[$i];
$content = addslashes(shell_exec('/usr/bin/pdftotext \''.$file.'\' -'));
$result = substr_count(strtolower($content), $keyword);
if($result > 0)
{
if(!in_array($pdfFiles[$i], $matchesOnPDF))
{
array_push($matchesOnPDF, array(
"matches" => $result,
"type" => "PDF",
"pdfFile" => $pdfFiles[$i]));
}
}
}