Зависит от структуры конкретного PDF.
Если PDF-файл состоит из изображений (отсканированных страниц), вам необходимо распознать каждое изображение и создать полнотекстовый индекс внутри PDF-файла. (Чтобы увидеть, основано ли его изображение, откройте его с помощью блокнота и найдите теги obj, заполненные случайными символами). Есть несколько утилит и приложений, которые выполняют эту работу для вас, CVision PDF Compressor - это та, которую я использовал раньше.
Если PDF-файл является стандартным PDF, то вы сможете открыть его, как и любой другой текстовый файл, и выполнить поиск по словам.
Здесь - это страница, которая детализирует некоторые структуры PDF. Это ТАК сообщение для того же.