Как проверить, что PDF сканируется или может извлекаться нормально без распознавания текста? (Python)