Обратный инжиниринг форматов файлов с использованием методов AI - PullRequest
2 голосов
/ 04 декабря 2009

Это расширение вопроса: Инструменты, помогающие перепроектировать двоичные форматы файлов

Существуют ли общедоступные инструменты, использующие методы кластеризации и / или интеллектуального анализа данных для обратного проектирования форматов файлов?

Например, с помощью инструмента у вас будет набор файлов, имеющих одинаковый формат, и выход инструмента будет иметь общую структуру?

1 Ответ

5 голосов
/ 05 декабря 2009

Если у кого-то был действительно эффективный формат двоичного кодирования (например, ZIP-файлы), то содержание информации в каждом бите велико. По сути, это будет выглядеть как идеальное случайное число.

Вы ничего не можете сделать из этого без дополнительных знаний.

Если двоичное кодирование неэффективно, теоретически у вас есть слабый шанс увидеть структуру. Но это все еще звучит очень сложно; как ты вообще начинаешь гадать, где границы полей?

Типы машинного обучения ИИ скажут вам, что вы ничего не сможете изучить, если вы уже «почти» не знаете этого. Зачастую они преуспевают, кодируя проблему с помощью токенов-проблем, о которых вы, по крайней мере, можете подумать.

Я не думаю, что вы можете сделать это без предоставления дополнительной информации. Знаете ли вы что-нибудь о форматах файлов? Размеры поля всегда меньше чем N бит? Только строки ASCII кодируются или наоборот?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...