Я знаю несколько инструментов / библиотек, которые могут это сделать, но я хочу знать, возможно ли это, просто открыв файл в виде текстового файла и ища ключевое слово.
Вы можете сделать это примерно в 4 строках Python с пакетом slate:
slate
>>> import slate >>> with open('file.pdf, 'rb') as f: ... doc = slate.PDF(f, 'password') >>> 'keyword' in doc.text() True