Энтропия в двоичных файлах - какова цель? - PullRequest
1 голос
/ 06 июня 2011

Я читал теорию Шеннона для энтропии и как реализовать такой алгоритм для двоичного файла (довольно просто)

Но я не могу понять, какова цель вычисления энтропии a.exe или любой двоичный файл

Я могу понять вычисление энтропии телекоммуникационного сообщения (наихудший случай: каждый символ имеет одинаковую вероятность), но я не могу понять цель для двоичного файла.

Кто-нибудь может мне это объяснить?

Ответы [ 2 ]

4 голосов
/ 06 июня 2011

Предположим, некоторая информация или динамическая система или распределение. Энтропия - это мера беспорядка в этой информации / системе / распределении. Если энтропия растет, то и беспорядок растет. Если энтропия равна 0, это означает, что нет беспорядка, это распределение является постоянным.

Применяя это ко всем файлам, я могу предположить, что, если беспорядок в нем большой, файл будет сложнее сжать. И файлы с низкой энтропией (основная часть символов в этом файле совпадает) сжимаются лучше. Как правило, я предполагаю, что файлы с низкой энтропией будут легче обрабатывать.

1 голос
/ 23 августа 2014

В наши дни, чаще всего приложение, вычисляющее энтропию в двоичных файлах, связано с антивирусными программами. Антивирус использует Entropy для того, чтобы угадать, сжат файл / распакован или нет. Также вы можете получить довольно хорошую идею, если двоичный файл зашифрован или нет, зная уровень энтропии.

...