Каково поведение str.isalnum () для файлов, открытых в двоичном режиме?Это зависит от локали ()? - PullRequest
0 голосов
/ 20 октября 2018

Я хочу написать программу на python2.7, чтобы открыть файл в двоичном режиме и собрать все буквенно-цифровые символы / байты на основе значений таблицы ASCII.Я хочу, чтобы эта программа работала для любого расширения файла, поэтому я открываю файлы в двоичном режиме.Я не использую какую-либо конкретную кодировку, поскольку не хочу ошибки кодека.

def get_alnum_from_file(filename):
    res = set()
    with open(filename, "rb") as myfile:
        text = myfile.read()
            for ch in text:
                if ch.isalnum():
                    res.add(ch)
    return res           

Это сработало для всех входов, с которыми я работал.Однако существует ли крайний случай, когда ch.isalnum () будет возвращать true для символов, не являющихся az AZ 0-9?

Например, если встречаются такие символы, как á, é, í, ó, ú;вернется ли он верным в некоторых случаях?В документации говорится, что isalnum () зависит от локали, но я не уверен, считается ли это, если символы являются двоичными.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...