Встраивание скрытых закодированных битов в простой текстовый файл - PullRequest
1 голос
/ 14 января 2012

Я разрабатываю систему для обработки простых текстовых файлов, одна из ее функций будет заключаться в том, чтобы перемещать обработанные файлы на сервер архивации после их полной обработки в системе. Что я хочу сделать, так это пометить текстовый файл, как только он будет полностью обработан системой, то есть системная печать подтверждения или маркера. Причина в том, что я хочу, чтобы эта же система могла позже анализировать текстовый файл и искать этот скрытый маркер, чтобы он мог идентифицировать его как обработанный в прошлом. В то же время я хочу, чтобы этот маркер игнорировался любой другой системой, которая может обрабатывать этот файл

Я думал о том, чтобы иметь уникальный ключ, который только эта система использует, имеет доступ и создает процедуру для хеширования и сальто ключа и помещает его в текстовый файл, прежде чем он будет перемещен в конечный пункт назначения. Мне любопытно о любых других методах создания скрытой печати или маркера. Итак, подведем итог:

  1. Могу ли я создать набор или строку закодированных битов и поместить их в текстовый файл?
  2. Могут ли эти биты быть скрыты в текстовом файле, чтобы они игнорировались любой другой системой, которая может обрабатывать этот текстовый файл?

Буду признателен за любые идеи и отзывы.

Ответы [ 2 ]

2 голосов
/ 14 января 2012

Лично я бы не стал изменять исходное содержимое. Файл ASCII text (насколько мне известно) не может быть подписан таким образом, чтобы все приложения не видели подпись.

Вместо этого я бы взял md5 из файла, поддерживающего «обработанный» отдельно от тех, которые еще не были «обработаны».

Map<MD5, FileName> - структура для рассмотрения. Вы должны быть в состоянии написать код для извлечения по MD5 или имени файла.

Надеюсь, это поможет.

0 голосов
/ 15 января 2012

Сокрытие данных внутри другого файла называется стеганографией.Это можно сделать с помощью файлов ASCII, но обычно это проще сделать с файлами данных или изображений.

В вашем конкретном случае лучше использовать параллельный регистр или метаданные обработанных файловпоместиться.Использование хорошего хеша, MD5 или лучше, хорошо, если вы не ожидаете злонамеренных преднамеренных атак.В этом случае вам нужно будет использовать HMAC-MD5 или HMAC-SHA-256.Злоумышленник может легко вычислить правильное значение хеш-функции для измененного файла.

...