Не похоже на обычную кодировку.Почти любая кодировка сохраняет символы ASCII в некоторой форме.
Так что я вижу несколько возможностей:
- Файл в сжатом текстовом / XML-файле
- Файл взашифрованный текстовый / xml файл
- Это двоичный формат файла
- Он запутан
Теперь, если мы посмотрим на это, мы увидим последовательности с повторяющимися символами, такими как "UUU"и "ëë" встречаются довольно часто.Поскольку зашифрованные данные выглядят абсолютно случайными, это делает второй вариант маловероятным.
Что заставляет вас думать, что это должен быть файл XML?А поскольку файл является двоичным, вы можете разместить начало файла в шестнадцатеричном виде вместо текста.
Глядя на ваш шестнадцатеричный дамп, я почти уверен, что он не зашифрован.И последовательности типа «01 00» типичны для несжатого двоичного формата.Так что это мое лучшее предположение.
Написание парсера только из файла примера довольно сложно.Первое, что я попробую, - это поиск спецификации формата в сети.
Если вы попытаетесь выяснить формат файла, вы можете либо начать реверсирование приложения, создавая их (это довольно сложно, если программа скомпилирована всборка, и довольно легко для байт-кода, такого как использование Java или .net).
Или вы начинаете с простого файла.Внесите в нее минимальные изменения и сравните различия в файле.Это большая работа, и это возможно только для довольно простых форматов файлов.
Я не смог найти спецификацию при небольшом поиске.И, кажется, есть только одна реализация.Вы можете попробовать связаться с компанией, которая его создала, но я почему-то сомневаюсь, что они помогут.Так что, я думаю, вам нужно перепроектировать формат самостоятельно.Это, наверное, не легко и совсем немного работы.Хорошо выглядишь.