Двоичный формат Java не сильно уменьшает размер файла - PullRequest
0 голосов
/ 30 января 2019

У меня есть несколько больших файлов CSV (~ 100 МБ каждый), которые, как я думал, я бы преобразовал в двоичный формат для экономии места на диске.Я читаю файл CSV построчно и преобразовываю каждую строку из строки в массив байтов и сохраняю этот массив в файл следующим образом:

    BufferedReader in = new BufferedReader(new FileReader(pathToFile));
    FileOutputStream out = new FileOutputStream(path);   
    String line;
    byte[] storeLine;
    while ((line = in.readLine()) != null) {

        storeLine = line.getBytes();
        out.write(storeLine);
        out.flush();
    }
    out.close();

Когда я запускаю это, я обнаруживаю, что заново сконструированныйбинарный файл не намного меньше, чем CSV-файл.Это нормально при записи строк в двоичный файл или я могу что-то сделать, чтобы оптимизировать это?

Пример: CSV-файл - 99851 КБ, двоичный файл - 99646 КБ

...