Как найти MD5-хэш ISO-файла с помощью Python? - PullRequest
3 голосов
/ 18 июля 2011

Я пишу простой инструмент, который позволяет мне быстро проверять значения MD5 хэшей загруженных ISO-файлов. Вот мой алгоритм:

import sys
import hashlib

def main():
    filename = sys.argv[1] # Takes the ISO 'file' as an argument in the command line
    testFile = open(filename, "r") # Opens and reads the ISO 'file'

    # Use hashlib here to find MD5 hash of the ISO 'file'. This is where I'm having problems
    hashedMd5 = hashlib.md5(testFile).hexdigest()

    realMd5 = input("Enter the valid MD5 hash: ") # Promt the user for the valid MD5 hash

    if (realMd5 == hashedMd5): # Check if valid
        print("GOOD!")
    else:
        print("BAD!!")

main()

Моя проблема в 9-й строке, когда я пытаюсь взять MD5-хеш файла. Я получаю ошибку типа: требуется объект, поддерживающий буфер API. Может ли кто-нибудь пролить свет на то, как заставить эту функцию работать?

Ответы [ 2 ]

8 голосов
/ 18 июля 2011

Объект, созданный hashlib.md5, не принимает файловый объект.Вам нужно передать данные по частям за раз, а затем запросить хэш-дайджест.

import hashlib

testFile = open(filename, "rb")
hash = hashlib.md5()

while True:
    piece = testFile.read(1024)

    if piece:
        hash.update(piece)
    else: # we're at end of file
        hex_hash = hash.hexdigest()
        break

print hex_hash # will produce what you're looking for
3 голосов
/ 18 июля 2011

Вам нужно прочитать файл:

import sys
import hashlib

def main():
    filename = sys.argv[1] # Takes the ISO 'file' as an argument in the command line
    testFile = open(filename, "rb") # Opens and reads the ISO 'file'

    # Use hashlib here to find MD5 hash of the ISO 'file'. This is where I'm having problems
    m = hashlib.md5()
    while True:
        data = testFile.read(4*1024*1024)
        if not data: break
        m.update(data)
    hashedMd5 = m.hexdigest()
    realMd5 = input("Enter the valid MD5 hash: ") # Promt the user for the valid MD5 hash

    if (realMd5 == hashedMd5): # Check if valid
        print("GOOD!")
    else:
        print("BAD!!")

main()

И вам, вероятно, нужно открыть файл в двоичном формате ("rb") и прочитать блоки данных в виде кусков. Возможно, файл ISO слишком велик для размещения в памяти.

...