Ваша проблема не проблема, я думаю .Когда вы открываете файл в двоичном режиме как 8-разрядный без знака, вы указываете чтение файла, 8-битное время, представленное как число от 0 до 255. В зависимости от того, как вы читаете его, вы можете получить его какARRAY или LIST.
Текстовый файл - это набор чисел, использующий представление символов ASCII.Для более сложного текста используется представление Unicode, но оно ближе к традиционному двоичному формату, чем к текстовому.
Если вы попытаетесь прочитать файл PDF, вам придется следовать формату файла для получения значимых данных из него.На сайте Wotsit есть библиотека форматов файлов.
Судя по вашему вопросу, это звучит так, как будто вы только изучаете программирование.Я не рекомендую работать с PDF-файлами, когда вы только учитесь.