Хранить числа как двоичные файлы - PullRequest
3 голосов
/ 28 ноября 2011

У меня есть числа, записанные в виде кодов ASCII в моем файле.Например, «9» хранится как два байта 57, то есть всего 8 бит.

Я хочу оптимизировать хранение, просто сохраняя эти числа в виде двоичных значений, например, числа от 0 до 9, которые должны быть сохранены с использованием только 4 бит,

Любая помощь?!

Ответы [ 4 ]

1 голос
/ 28 ноября 2011

Вы могли бы написать их в двоичном виде

import java.io.ByteArrayInputStream;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;


public class Bin {
    public static void main(String[] args) throws IOException {
        FileOutputStream fos = new  FileOutputStream("\\test.bin");
        String digits="12345";
        char[] chars = digits.toCharArray();
        for ( int i = 0 ; i < chars.length ; i+= 2 ) {
            byte b1 = (byte) (chars[i] - (byte) '0');
            byte b2 = (byte) (i < chars.length-1 ? chars[i+1] - (byte) '0' : 0xf);
            fos.write((byte) ((b1 << 4) | b2 ));
        }
        fos.close();
        FileInputStream fis = new FileInputStream("\\test.bin");
        StringBuffer result = new StringBuffer();
        byte[] buf = new byte[100];
        int read = fis.read(buf);
        ByteArrayInputStream bais = new ByteArrayInputStream(buf);
        for ( int i = 0 ; i < read ; i++ ) {
            byte both = (byte) bais.read();
            byte b1 = (byte) ((both >> 4 ) & 0xf);
            byte b2 = (byte) (both  & 0xf) ;
            result.append( Character.forDigit(b1, 10));
            if ( b2 != 0xf ) {
                result.append(Character.forDigit(b2,10));
            }
        }
        System.out.println(result.toString());
    }
}

Но я сомневаюсь, что это будет очень полезно

1 голос
/ 28 ноября 2011

Я бы придерживался стандарта DataOutputStream, который может записывать примитивные типы в вывод переносимым способом .

Имеется writeLong, writeInt. С помощью этих методов вы можете записать свои данные, а затем загрузить их с DataInputStream s readLong и readInt.

Если это недостаточно компактно, вы можете сжать его позже с помощью любой библиотеки сжатия.

1 голос
/ 28 ноября 2011

А как насчет этого?0 => 0000 1 => 0001 2 => 0010 3 => 0011 4 => 0100 5 => 0101 6 => 0110 7 => 0111 8 => 1000 9 => 1001

0 голосов
/ 28 ноября 2011

Если вы напишите символ, это займет 1 байт для каждого символа.Вы должны написать двоичные или логические данные.Вы можете представить 5 => 0101, но если вы напишите 0101 как символ, это займет 4 байта, а если вы напишите двоичный или логический, это займет биты.

...