Да, PDF-файл может содержать текст на одной странице, но не на остальных. Вы вполне можете иметь 500-страничный PDF-файл, содержащий изображения на первых 499 страницах, но содержащий текст на последней странице.
Если вы не хотите открывать файл PDF самостоятельно и сканировать его на наличие текстовых / текстовых операций, вам потребуется использовать существующую стороннюю библиотеку PDF, которая позволяет извлекать текст из PDF.
Также см. Ответ Ферруччо на связанный вопрос , который должен использовать интерфейс IFilter, специально созданный для индексации поиска и извлечения текста.