Я преобразовал TXT-файл из ASCII в UTF-8, используя UltraEdit.Тем не менее, я не уверен, как проверить, если это в формате UTF-8 в среде Windows.
Спасибо!
Откройте файл в блокноте. Нажмите «Сохранить как ...». В поле со списком «Кодировка:» вы увидите текущий формат файла.
Откройте файл с помощью Notepad ++ и откройте меню «Кодировка», вы можете проверить текущую кодировку и / или преобразовать в набор доступных кодировок.
Текстовые файлы в Windows не имеют формата.Существует неофициальное соглашение, что если файл начинается с кодовой точки BOM в формате UTF-8 , то это UTF-8, но это соглашение не поддерживается повсеместно.Это будет 3-байтовая последовательность "\xef\xbf\xbe", то есть ￾ в наборе символов Latin-1.
"\xef\xbf\xbe"
￾
Откройте его в шестнадцатеричном редакторе и убедитесь, что первые три байта являются UTF8 BOM (EF BB BF)
EF BB BF
Если вы используете Windows 10 и имеете подсистему Windows для Linux (WSL), это легко сделать, набрав «file» из оболочки.
Например:
$ file code.cpp code.cpp: C source, UTF-8 Unicode (with BOM) text, with CRLF line terminators