неизвестное кодирование данных - PullRequest
1 голос
/ 13 июня 2010

Когда я работал со старым приложением с существующей базой данных, которая находится в ms-access, она содержит странную кодировку данных, такую ​​как 48001700030E0F465075465A56525E1100121D04121B565A58 в качестве адреса электронной почты

Что это за кодировка данных?я пробовал base64, но кажется, что это так.Может кто-нибудь с предыдущим опытом работы с ms-access мог бы сказать мне, что это может быть за кодировка.

edit:

больше образцов

  1. 54001700030E0F46507546474550481C1D09090D04461B565A19 платыF
  2. 40001700030E0F4650755F564E545F06025D100E0C

Эти образцы, безусловно, сообщения электронной почты и для веб-адрес выглядит следующим образом

  1. 440505045D070D54585C5B50585D581C1701004F025A58
  2. 440505045D121147544C5B584D4B5D17015D100E4F5C5B

Это программа доступа vb + ms, если это может помочь, и я думаю, что это стандартная кодировка

edit (2) ::

при просмотре кодировки веб-URL кажется, что 0505045D может быть для http: //

edit (3) ::

1 найдена комбинация

52021301161209755354595AvaluationF561D170B030E1341461B56585A == paresh @falmingoexports.com

Ответы [ 2 ]

1 голос
/ 13 июня 2010

Строки кажутся шестнадцатеричными представлениями некоторых двоичных данных.

Первые две цифры - это длина строки - десятичная, а не шестнадцатеричная - поэтому не вся строка является шестнадцатеричной.

38 001700030E0F465075 4545 5646 5415 5C10 1C0C 
40 001700030E0F465075 5F56 4E54 5F06 025D 100E 0C 
46 001700030E0F465075 5D56 5150 591D 1B00 0712 4F56 5A58 
48 001700030E0F465075 465A 5652 5E11 0012 1D04 121B 565A 58
54 001700030E0F465075 4647 4550 481C 1D09 090D 0446 1B56 5A19 5E5F 
^  ^
|  |
|  +---- constant part, 9 bytes, maybe mailto: or same domain name of
|        reversed email addresses (com.example@foo)
|
+---- length of the reset in decimal, not hexadecimal

Я не вижу четких указаний на расположение знака at и точки перед доменом верхнего уровня. Кажется, это указание против простых моно-буквенных замен, таких как ROT13 .

 paresh@falmingoexports.com

 Length

    26 characters

 Histogram

 1x

 h   @   f   l   i   n   g   x   t   .   c

 3x o
 2x p  2x a  2x m  2x r  2x e  2x s

 ASCII values in hexadecimal representation

    70 61 72 65 73 68 40 66 61 6C
    6D 69 6E 67 6F 65 78 70 6F 72
    74 73 2E 63 6F 6D

 The length of 52 hexadecimal symbols matches length of the
 encoded string.

 52 02 13 01 16 12 09 75 53 54 59
    5A 5E 5F 56 1D 17 0B 03 0E 13
    41 46 1B 56 58 5A

 Histogram

 1x

 01  02  03  09  0B  0E  12  16  17  1B
 1D  41  46  53  54  58  59  5E  5F  75

 2x 13   2x 56   2x 5A

Гистограммы не совпадают - поэтому это исключает моно-буквенные замены, за которыми может последовать перестановка строки.

1 голос
/ 13 июня 2010

Кажется, что это байты, закодированные как шестнадцатеричные. Но что означают эти байты, я не знаю. Расшифровка его в ASCII мало что показывает:

H  \x00\x17\x00\x03\x0e\x0fFPu  FZVR^  \x11\x00\x12\x1d\x04\x12\x1bVZX
T  \x00\x17\x00\x03\x0e\x0fFPu  FGEPH  \x1c\x1d\t\t\r\x04F\x1bVZ\x19^_
@  \x00\x17\x00\x03\x0e\x0fFPu  _VNT_  \x06\x02]\x10\x0e\x0c
8  \x00\x17\x00\x03\x0e\x0fFPu  EEVFT  \x15\\\x10\x1c\x0c
F  \x00\x17\x00\x03\x0e\x0fFPu  ]VQPY  \x1d\x1b\x00\x07\x12OVZX

Вещи, которые я заметил, могут помочь взломать код:

  • От 2-го до 10-го байта отображаются постоянными \x00\x17\x00\x03\x0e\x0fFPu.
  • Первый байт имеет длину BCD (замечен Даниэль Брюкнер!)
  • 16-е байты и далее отображаются в некотором двоичном формате, который либо кодирует данные, либо, возможно, указывает на данные.
  • Два из них заканчиваются на: \x12?VZX.
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...