Если вы получаете фактические пробелы между каждым символом, возможно, в вашем коде есть анти-шаблон '(символы i через j из someText) в виде строки' [1]. Это разделит строку на список символов, а затем вернет ее обратно в строку с текущим разделителем текста, вставленным между каждым символом. Правильный (то есть быстрый и безопасный) способ получения подстроки заключается в следующем: 'text i th j of someText' (p179-181).
OTOH, если вы получаете невидимых символов между каждым символом [2], тогда да, это будет проблема кодирования, обычно чтение файла в кодировке UTF16 с использованием MacRoman или другой однобайтовой кодировки , Если ваш файл имеет допустимую метку порядка байтов, тогда любой текстовый редактор, разбирающийся с Unicode, должен прочитать его, используя правильную кодировку.
[1] p179 утверждает, что эта идиома небезопасна, но забывает предоставить практическую демонстрацию проблем, которые она вызывает. [3]
[2] IIRC в примере на p501 предполагалось использовать прямоугольные символы для представления невидимых символов, т. Е. «⃞H⃞e⃞l⃞l⃞o», а не «H e l l o», но не совсем так, поэтому может быть неправильно истолковано как означающее видимые пространства. [3]
[3] Не стесняйтесь сообщать об ошибках в Apress.