Может быть, этот вопрос кажется немного странным, но он имеет очень практический вариант использования.
Предположим, что мы выбрали произвольный раздел файла PDF для создания контрольной суммы, такой как выделенный текст (выделенный текст) на следующем снимке экрана:
И затем мы генерируем контрольную сумму из выделенного текста, используя хэш-функцию.Мы доставляем (а не отправляем) весь файл PDF вместе с этой контрольной суммой получателю, так что этот получатель НЕ знает, какой раздел файла PDF был выбран и хеширован. И этот получатель хочет проверить эту контрольную сумму.Таким образом, они должны точно знать, какой раздел файла PDF был выбран и хеширован.Итак, нам нужно найти решение, с помощью которого этот получатель может найти точное положение выделенного и хешированного текста.
Поскольку хеш-функция необратима , вопрос в том, что:
Как этот приемник может найти точно выбранный и хешированный текст в файле PDF?
Например, возможно ли определить точное местоположение и положение выделенного и хешированного текста в файле PDF?(Это очень чувствительно, поскольку даже неправильный символ или пробел может привести к сбою проверки контрольной суммы.)
Есть ли надежный подход для этой задачи?
Примечание 1: Если вопрос недостаточно ясен, пожалуйста, дайте мне знать, чтобы объяснить его более подробно.
Важно: Обратите внимание, что из-за ограниченного пространства,мы можем хранить только значение контрольной суммы плюс некоторые ограниченные данные, которые показывают положение выделенного текста, а это означает, что мы не можем хранить весь выделенный текст .
вариант использования: мы намерены проверить целостность выбранных текстов в документе с помощью верификатора.Контрольная сумма вместе с информацией, относящейся к хешированному тексту, будет храниться в блокчейне, поэтому из-за ограничений хранения в блокчейне (это дорого) мы не можем хранить весь выделенный и хешированный текст в блокчейне, вместо этого мы храним тольконекоторая полезная информация, которая обращается к точному положению выделенного и хешированного текста.Верификатор имеет доступ ко всему документу, однако они не знают, какой раздел документа был хэширован.Они должны знать это, чтобы проверить контрольную сумму.
Предположим, ex.у проверяющего есть сертификат (бумага), он должен доказать, что является владельцем сертификата. Он сканирует сертификат (лучше оцифровывать его в любой формат).Эмитент сертификата выбрал некоторые чувствительные части сертификата (например, информация о владельце и т. Д.) И хэшировал их отдельно в каждом выбранном разделе для генерации контрольной суммы.Когда проверяющий (владелец) доставляет сертификат верификатору, он должен проверить все контрольные суммы.на этом этапе он должен знать, какие части сертификата были хэшированы.Итак, нам нужно прикрепить полезные данные к контрольным суммам, по которым верификатор может находить хешированные разделы.
Обратите также внимание, что выбранный текст не записывается, но также и выбирается для создания контрольной суммы.однако верификатор должен знать содержание этого текста для проверки контрольной суммы.проблема в том, что из-за ограничений хранения данных в блокчейне мы не можем хранить весь хэшированный текст, но мы можем также хранить только некоторую полезную информацию, которая относится к точной позиции хэшированного текста.
Обновление: Этот вопрос относится к ( БЕСПЛАТНО инструменту для просмотра координат в PDF ), где с помощью инструмента мы сможем найти точные (x, y) координаты выделенного текста.Я еще не уверен, что этот инструмент можно использовать для моего вопроса.