Асинхронное программирование для вычисления хэшей файлов - PullRequest
0 голосов
/ 20 июня 2019

Я пытаюсь вычислить хэш для файлов, чтобы проверить, были ли внесены какие-либо изменения. у меня есть Gui и некоторые другие наблюдатели, работающие в цикле Итак, я решил вычислить хэш файлов [md5 / Sha1, который когда-либо быстрее] асинхронно.

Синхронный код:

import hashlib
import time


chunk_size = 4 * 1024

def getHash(filename):
    md5_hash = hashlib.md5()
    with open(filename, "rb") as f:
        for byte_block in iter(lambda: f.read(chunk_size), b""):
            md5_hash.update(byte_block)
        print("getHash : " + md5_hash.hexdigest())

start = time.time()
getHash("C:\\Users\\xxx\\video1.mkv")
getHash("C:\\Users\\xxx\\video2.mkv")
getHash("C:\\Users\\xxx\\video3.mkv")
end = time.time()

print(end - start)

Вывод синхронного кода: 2.4000535011291504

Асинхронный код:

import hashlib
import aiofiles
import asyncio
import time


chunk_size = 4 * 1024

async def get_hash_async(file_path: str):
    async with aiofiles.open(file_path, "rb") as fd:
        md5_hash = hashlib.md5()
        while True:
            chunk = await fd.read(chunk_size)
            if not chunk:
                break
            md5_hash.update(chunk)
        print("get_hash_async : " + md5_hash.hexdigest())

async def check():
    start = time.time()
    t1 = get_hash_async("C:\\Users\\xxx\\video1.mkv")
    t2 = get_hash_async("C:\\Users\\xxx\\video2.mkv")
    t3 = get_hash_async("C:\\Users\\xxx\\video3.mkv")
    await asyncio.gather(t1,t2,t3)
    end = time.time()
    print(end - start)

loop = asyncio.get_event_loop()
loop.run_until_complete(check())

Вывод асинхронного кода: 27.957366943359375

я правильно делаю? или необходимо внести какие-либо изменения для повышения производительности кода?

Заранее спасибо.

...