Файл (1), классифицирующий нулевые байты как файл данных - PullRequest
0 голосов
/ 19 сентября 2018

У меня есть некоторое поведение из функции командной строки файла.По-видимому, он классифицирует нулевые байты как файлы данных, хотя, насколько мне известно, и то, что я могу найти в Интернете, нулевые байты являются частью UTF-8.Ниже приведен пример моей проблемы.

printf "Hello\00, World!" > test.txt file test.txt Output: test.txt: data

Почему это не классифицируется как UTF-8?

1 Ответ

0 голосов
/ 19 сентября 2018

Он классифицируется как общие данные из-за байта 0, который не отображается в обычном читаемом человеком тексте.И если вы уберете это, потому что все, что у него есть, это печатные символы ASCII, это будет классифицировано как это, а не UTF-8.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...