Попытка запустить этот код .
Ошибка строки № 312:
hashCode = coeffA[i] * shingleID + coeffB[i] % nextPrime
OverflowError: repeated bytes are too long
# For each shingle in the document...
for shingleID in shingleIDSet:
# Evaluate the hash function.
hashCode = (coeffA[i] * shingleID + coeffB[i]) % nextPrime
# Track the lowest hash code seen.
if hashCode < minHashCode:
minHashCode = hashCode
Не изменил этот код вообще, просто преобразовал его из Python 2 в 3.