Почему эти два файла хэшируются с одинаковым значением, когда я использую MemoryStream? - PullRequest
6 голосов
/ 11 ноября 2009

Я пишу подпрограмму c #, которая создает хэши из файлов jpg. Если я передаю байтовый массив моему объекту SHA512, я получаю ожидаемое поведение, однако, если я передаю поток памяти, два файла всегда хешируются с одинаковым значением.

Пример 1:

        SHA512 mySHA512 = SHA512.Create();

        Image img1 = Image.FromFile(@"d:\img1.jpg");
        Image img2 = Image.FromFile(@"d:\img2.jpg");
        MemoryStream ms1 = new MemoryStream();
        MemoryStream ms2 = new MemoryStream();

        img1.Save(ms1, ImageFormat.Jpeg);
        byte[] buf1 = ms1.GetBuffer();
        byte[] hash1 = mySHA512.ComputeHash(buf1);

        img2.Save(ms2, ImageFormat.Jpeg);
        byte[] buf2 = ms2.GetBuffer();
        byte[] hash2 = mySHA512.ComputeHash(buf2);

        if (Convert.ToBase64String(hash1) == Convert.ToBase64String(hash2))
            MessageBox.Show("Hashed the same");
        else
            MessageBox.Show("Different hashes");

Это производит "Разные хеши". Но одна из перегрузок метода ComputeHash принимает объект потока, и я бы лучше использовал это. Когда я делаю:

        SHA512 mySHA512 = SHA512.Create();

        Image img1 = Image.FromFile(@"d:\img1.jpg");
        Image img2 = Image.FromFile(@"d:\img2.jpg");
        MemoryStream ms1 = new MemoryStream();
        MemoryStream ms2 = new MemoryStream();

        img1.Save(ms1, ImageFormat.Jpeg);
        byte[] hash1 = mySHA512.ComputeHash(ms1);

        img2.Save(ms2, ImageFormat.Jpeg);
        byte[] hash2 = mySHA512.ComputeHash(ms2);

        if (Convert.ToBase64String(hash1) == Convert.ToBase64String(hash2))
            MessageBox.Show("Hashed the same");
        else
            MessageBox.Show("Different hashes");

Это производит "Hashed то же самое".

Что здесь происходит, что мне не хватает?

1 Ответ

16 голосов
/ 11 ноября 2009

Вы не перематываете свои MemoryStreams, поэтому хеш вычисляется из пустой последовательности байтов. Используйте

ms1.Position = 0;
ms2.Position = 0;

после звонка Save.

Еще одно замечание: не используйте GetBuffer таким образом. Используйте ToArray, который даст вам байтовый массив того же размера, что и длина потока - GetBuffer возвращает необработанный буфер, который (обычно) будет иметь некоторые отступы, которые вы не захотите использовать случайно. Вы можете использовать GetBuffer, если затем убедитесь, что используете только соответствующую его часть, конечно, - это позволяет избежать создания новой копии данных.

...