Сомневаясь в правильности кодировки UTF-8, вы всегда можете перекодировать ее либо с помощью хорошего текстового редактора, либо с помощью специального инструмента, такого как iconv:
iconv -f UTF-8 -t UTF-8 yourfile > youfile2
Если ваш файл действительноНеправильно, iconv также даст вам некоторую информацию о проблеме.
Но, другой способ, который вы могли бы изучить, - это установка новых шрифтов для дальневосточных языков…
Действительно, не зная действительных байтовПри использовании в вашем файле трудно сказать, почему их заменяют символом замены U (U + FFFD).Таким образом, вы можете захотеть опубликовать шестнадцатеричный дамп частей вашего файла, которые не работают.