Позвольте мне начать с небольшого фона.
Этим утром один из наших пользователей сообщил, что установочный файл Testuff был объявлен зараженным антивирусом CA. Уверенный, что это был ложный положительный результат, я заглянул в Интернет и обнаружил, что пользователи другой программы (SpyBot) сообщили об этой же проблеме.
А сейчас, по актуальному вопросу.
Предполагая, что антивирус ищет определенную двоичную сигнатуру в файле, я хотел бы найти совпадающие последовательности в обоих файлах и, надеюсь, найти способ настроить скрипт установки, чтобы эта последовательность не появлялась.
Я попробовал следующее в Python, но он уже давно запущен, и мне было интересно, есть ли лучший или более быстрый способ.
from difflib import SequenceMatcher
spybot = open("spybotsd160.exe", "rb").read()
testuff = open("TestuffSetup.exe", "rb").read()
s = SequenceMatcher(None, spybot, testuff)
print s.find_longest_match(0, len(spybot), 0, len(testuff))
Есть ли лучшая библиотека для Python или для другого языка, которая может это сделать?
Также приветствуется совершенно другой способ решения проблемы.