Извлеките хэш SHA1 из торрент-файла - PullRequest
22 голосов
/ 04 апреля 2010

Я искал ответ на этот вопрос, но мне только кажется, что я могу найти программное обеспечение, которое делает это для вас. Кто-нибудь знает, как сделать это в Python?

Ответы [ 3 ]

29 голосов
/ 04 апреля 2010

Я написал фрагмент кода Python, который проверяет хэши загруженных файлов в сравнении с тем, что находится в .torrent файле . Предполагая, что вы хотите проверить загрузку на наличие повреждений, это может оказаться полезным.

Вам необходим пакет bencode , чтобы использовать это. Bencode - это формат сериализации, используемый в .torrent-файлах. Он может составлять списки, словари, строки и числа, как в JSON.

Код принимает хэши, содержащиеся в строке info['pieces']:

torrent_file = open(sys.argv[1], "rb")
metainfo = bencode.bdecode(torrent_file.read())
info = metainfo['info']
pieces = StringIO.StringIO(info['pieces'])

Эта строка содержит последовательность из 20 байтов хэшей (по одному на каждый фрагмент). Затем эти хэши сравниваются с хэшем фрагментов файла (ов) на диске.

Единственная сложная часть этого кода - обработка многофайловых торрентов, поскольку один торрент кусок может охватывать более одного файла (внутренне BitTorrent рассматривает многофайловые загрузки как один непрерывный файл) . Я использую функцию генератора pieces_generator(), чтобы абстрагироваться от этого.

Вы можете прочитать спецификацию BitTorrent , чтобы понять это более подробно.

Полный код ниже:

import sys, os, hashlib, StringIO, bencode

def pieces_generator(info):
    """Yield pieces from download file(s)."""
    piece_length = info['piece length']
    if 'files' in info: # yield pieces from a multi-file torrent
        piece = ""
        for file_info in info['files']:
            path = os.sep.join([info['name']] + file_info['path'])
            print path
            sfile = open(path.decode('UTF-8'), "rb")
            while True:
                piece += sfile.read(piece_length-len(piece))
                if len(piece) != piece_length:
                    sfile.close()
                    break
                yield piece
                piece = ""
        if piece != "":
            yield piece
    else: # yield pieces from a single file torrent
        path = info['name']
        print path
        sfile = open(path.decode('UTF-8'), "rb")
        while True:
            piece = sfile.read(piece_length)
            if not piece:
                sfile.close()
                return
            yield piece

def corruption_failure():
    """Display error message and exit"""
    print("download corrupted")
    exit(1)

def main():
    # Open torrent file
    torrent_file = open(sys.argv[1], "rb")
    metainfo = bencode.bdecode(torrent_file.read())
    info = metainfo['info']
    pieces = StringIO.StringIO(info['pieces'])
    # Iterate through pieces
    for piece in pieces_generator(info):
        # Compare piece hash with expected hash
        piece_hash = hashlib.sha1(piece).digest()
        if (piece_hash != pieces.read(20)):
            corruption_failure()
    # ensure we've read all pieces 
    if pieces.read():
        corruption_failure()

if __name__ == "__main__":
    main()
17 голосов
/ 13 ноября 2010

Вот как я извлек значение HASH из торрент-файла:

#!/usr/bin/python

import sys, os, hashlib, StringIO
import bencode



def main():
    # Open torrent file
    torrent_file = open(sys.argv[1], "rb")
    metainfo = bencode.bdecode(torrent_file.read())
    info = metainfo['info']
    print hashlib.sha1(bencode.bencode(info)).hexdigest()    

if __name__ == "__main__":
    main()

Это то же самое, что и команда:

transmissioncli -i test.torrent 2>/dev/null | grep "^hash:" | awk '{print $2}'

Надеюсь, это поможет:)

0 голосов
/ 04 апреля 2010

В соответствии с этим , вы сможете найти md5sums файлов путем поиска части данных, которая выглядит следующим образом:

d[...]6:md5sum32:[hash is here][...]e

(SHA не является частью спецификации)

...