Как прочитать кодировку файла - PullRequest
0 голосов
/ 01 ноября 2018

Я не уверен, как мне найти кодировку файла. Я пытаюсь загрузить файл CSV только с помощью utf-8 и определить, есть ли какие-либо символы, отличные от utf-8, и я хочу показать сообщение об ошибке.

Я использую папский персор для разбора.

Как мне прочитать кодировку файла в java или в js.

var fileElement = element.find('.csv-upload');
var file = fileElement[0].files[0]
var parseConfig = {
        skipEmptyLines: true,
        header: true,
        encoding:'UTF-8',
        trimHeaders: true,
        complete: function (content) {
          scope.onFileRead(content, fileElement[0]);
        }
      };

      if (scope.rowsToParse) {
        parseConfig.preview = scope.rowsToParse;
      }

      if (file) {
        Papa.parse(file, parseConfig);
      }

1 Ответ

0 голосов
/ 01 ноября 2018

Файл CSV не будет содержать никакой информации о кодировке. Это просто последовательность байтов.

Необходимо заранее знать, содержит ли файл символы, отличные от UTF8, и какую кодировку файла следует использовать при его чтении.

Если вы используете Java (не уверен, что это так, потому что у вас есть тег Spring), вы можете использовать одну из библиотек, предложенных здесь, чтобы попытаться определить тип файла.

Существует ли библиотека java, эквивалентная команде file в unix

Может быть, есть что-то похожее для Javascript.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...