Если вы заранее знаете, что хотите найти (например, вы получаете сотни PDF-файлов в день и вам нужно будет найти файлы с определенными строками «известный до получения»), то вы можете сделать текстовую версию на приеме, создать индексировать записи для файла PDF, а затем выбросить текст.
Если вы не знаете условий поиска заранее, жизнь становится намного медленнее :( Существует программа под названием Поиск PDF, которая утверждает, что выполняет полнотекстовый поиск в файлах PDF. Мне не нужно было ее использовать, поэтому я не могу сказать, как это, но это здесь: http://www.getpdf.com/.
Надеюсь, это поможет