Если у кого-то был действительно эффективный формат двоичного кодирования (например, ZIP-файлы), то содержание информации в каждом бите велико. По сути, это будет выглядеть как идеальное случайное число.
Вы ничего не можете сделать из этого без дополнительных знаний.
Если двоичное кодирование неэффективно, теоретически у вас есть слабый шанс увидеть структуру. Но это все еще звучит очень сложно; как ты вообще начинаешь гадать, где границы полей?
Типы машинного обучения ИИ скажут вам, что вы ничего не сможете изучить, если вы уже «почти» не знаете этого. Зачастую они преуспевают, кодируя проблему с помощью токенов-проблем, о которых вы, по крайней мере, можете подумать.
Я не думаю, что вы можете сделать это без предоставления дополнительной информации. Знаете ли вы что-нибудь о форматах файлов? Размеры поля всегда меньше чем N бит? Только строки ASCII кодируются или наоборот?