Это потому, что поток на самом деле в кодировке UTF-8. Если бы он был в кодировке ASCII, строки были бы идентичны.
При чтении в формате ASCII байтовые комбинации, представляющие символы вне кодового набора 0-127, будут читаться как отдельные символы и будут выглядеть как мусор.
При чтении в формате UTF-8 байтовые комбинации будут декодированы в правильные символы, каждая многобайтовая комбинация заканчивается как один символ.
(Примечание: строки не кодируются, это кодированный поток. Вы декодируете поток из ASCII или UTF-8 в строку символов Unicode.)