Комментарий «Что вы используете для просмотра ввода, что для просмотра вывода?»это то, что вы должны действовать.
Что заставило вас прийти к выводу, что «содержание» выходных данных включает эти знаки евро и тм?Строки в текстовых файлах также имеют кодировку, и первое, о чем вы должны подумать, это убедиться, что инструмент, который вы используете для просмотра, действительно правильно обрабатывает эту кодировку.
Странные токены, перед которыми часто предают utf8 закодированных файлов, просматриваемых с помощью примитивного инструмента, такого как блокнот, который использует схему кодирования один байт на символ, часто iso-8859-1.Ошибка не в файле, а в выборе инструмента просмотра.
Другими словами: файлы содержат только байты.Даже если они имеют суффикс ".txt".Даже если эти байты представляют «просто строки», все равно происходит кодирование / декодирование, и что каждый отдельный инструмент в цепочке от создания / записи байтов до просмотра / чтения байтов должен знать, какое кодирование использовалось.Инструменты очень часто слепо принимают кодировку машины по умолчанию, и в наши дни, когда utf-8 определенно набирает обороты, это предположение часто ошибочно.(Особенно на машинах Windows.)