Файлы подписи для поиска документов - PullRequest
2 голосов
/ 08 октября 2008

Мне было интересно, знаете ли вы где-нибудь, где я могу найти информацию о том, как создать файл подписи для поиска документов.
Вы знаете, есть ли какой-нибудь код, который я могу использовать или посмотреть?
Я должен создать файл подписи в C ++ на платформе Linux.

ОБНОВЛЕНИЕ: Извините, я благодарен за помощь, но я ссылался на файлы подписей не как способ проверки документов, а как способ индексации документов.


http://en.wikipedia.org/wiki/Signature_files


Любая помощь будет принята с благодарностью.

Спасибо

Ответы [ 4 ]

2 голосов
/ 08 октября 2008

Во-первых, давайте уточним некоторые термины.

Цифровая подпись должна быть эквивалентна собственноручной подписи (более подробное описание и обзор см. В http://en.wikipedia.org/wiki/Digital_signature).

Когда цифровая подпись применяется к документу, вы получаете более высокий уровень гарантии подлинности документа (у вас есть лучшее представление, был ли документ подделан или нет).

Ответы Адама и Роберта относятся к методам проверки целостности документа (что документ остается неизменным). Хотя цифровая подпись также обеспечивает это, контрольная сумма (хэш) не обеспечивает подлинность.

Так что важно, чтобы мы установили потребности вашего «файла подписи». Я предполагаю, что вы говорите о цифровых подписях, а не о контрольных суммах, поскольку другие ответы касаются контрольных сумм.

Вы захотите составить отдельную подпись PKCS # 7 (жаргон - подпись стандартного формата, которая не содержит данных, поэтому она может храниться отдельно). Для этого я рекомендую использовать стандартную библиотеку, такую ​​как OpenSSL (которая является переносимой).

0 голосов
/ 27 октября 2008

Вы можете посмотреть на Semantic Hacker или Yahoo Term Extraction .

0 голосов
/ 08 октября 2008

По аналогии с предложением Адама, если вы работаете с очень большим количеством документов, было бы неплохо проверить SHA1 и sha1sum. Меньше коллизий и немного более продвинутое шифрование.

0 голосов
/ 08 октября 2008

md5sum может быть тем, что вы ищете. Исходный код для генерации подписей md5 доступен, если вы используете Google.

Из Википедии:

Потому что практически любое изменение в файле вызовет его MD5 хэш также изменение, MD5 хэш обычно используется проверить целостность файлов (то есть, чтобы убедиться, что файл не имеет изменен в результате передачи файла, ошибка диска, вмешательство и т. д.). Программа md5sum установлена ​​по умолчанию в большинстве Unix, Linux и Unix-подобных операционные системы или совместимость слои. Варианты BSD (включая Mac OS X) иметь аналогичную утилиту под названием md5. Версии для Microsoft Windows делают есть.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...