Любой способ создать PDF, чтобы текст не мог быть скопирован / извлечен обратно? - PullRequest
1 голос
/ 16 ноября 2009

Я пытаюсь помочь создать каталог окрестностей и хочу отговорить кого-то от сбора контактной информации (особенно адресов электронной почты).

Есть ли какой-нибудь простой способ предотвратить копирование и вставку этого текста из PDF-файла?

Обновление Цель этого состоит в том, чтобы сделать PDF не проще для сбора адресов электронной почты, чем текущий бумажный каталог, и сделать каталог PDF таким же полезным, как и бумажный каталог. Онлайновый каталог pdf будет иметь такие преимущества, как постоянная актуальность и экономия некоторых расходов на печать (или передача этих расходов людям, которые хотят распечатать документ).

Ответы [ 5 ]

4 голосов
/ 16 ноября 2009

Если данные должны быть читаемыми, что, как я полагаю, является вашей целью, вы никоим образом не можете помешать выделенному человеку взять и использовать его. Преобразование в изображение усложнит задачу, но любой, у кого есть хорошее распознавание текста или команда дешевой иностранной рабочей силы, может получить из этого все, что захочет. Если данные являются сверхчувствительными, и вы беспокоитесь об этом, вам действительно следует пересмотреть ценность публикации.

3 голосов
/ 16 ноября 2009

Использование изображения вместо текста значительно затрудняет автоматический захват данных из PDF.

Часть одной из моих предыдущих работ включала переформатирование данных в PDF-файлы в (определенный) более структурированный формат документа, и когда мы получили PDF-файлы, текст которых был изображениями - не говоря уже о размытых или трудно читаемых изображениях, - распознавание изобилует неправильными буквами, и мы должны были бы войти вручную и исправить почти все.

2 голосов
/ 16 ноября 2009

Другие ответы - хорошее начало. Однако я выяснил, как именно заблокировать PDF-файл, чтобы предотвратить копирование.

Вы можете использовать бесплатный PDF-драйвер Primo PDF и изменить настройки безопасности: http://www.primopdf.com/help/tip_secure_pdf.aspx

Чтобы добавить защиту паролем в свой PDF, читайте дальше, чтобы узнать, как вы можете сделать это бесплатно с PrimoPDF.

  1. Загрузите и установите бесплатный драйвер PDF: http://www.primopdf.com/download.aspx
  2. Открыть файл для конвертации в PDF
  3. Открыть диалоговое окно «Печать» (или нажать Ctrl + P)
  4. В списке принтеров выберите PrimoPDF
  5. Нажмите Печать
  6. В диалоговом окне PrimoPDF нажмите кнопку Изменить рядом с меткой безопасности, чтобы открыть диалоговое окно безопасности.
  7. Введите ваш открытый пароль дважды.
  8. При желании введите пароль для доступа и выберите функцию, которую хотите ограничить.
  9. Нажмите ОК.
  10. Нажмите Создать PDF.

Заключительный совет. Если вы хотите применить защиту ко всем создаваемым PDF-файлам, вы можете легко это сделать, правильно настроив PrimoPDF. В нижней части диалогового окна (см. Выше) просто убедитесь, что опция Всегда использовать эти настройки включена.

0 голосов
/ 16 февраля 2015

Другим возможным решением может быть следующее:

  1. Преобразование текста в векторы (некоторые инструменты с открытым исходным кодом могут сделать это), чтобы PDF-файл сохранял небольшой размер по сравнению с изображениями внутри pdf.
  2. Взломайте PDF, чтобы повредить внутренние индексы шрифтов на карте символов Юникода, чтобы скопированный текст был скопирован как мусор (поскольку приложение для чтения PDF не сможет найти правильное сопоставление изображений и их значений символов).

Отказ от ответственности: я работаю на ByteScout, поставщика PDF Extractor SDK инструмента, который можно использовать для восстановления текста из всех возможных повреждений из файлов PDF, подобных этим, на самом деле, если кто-то действительно хочет восстановить текст из PDF, тогда это можно сделать в любом случае (хотя с меньшим или большим количеством ошибок).

0 голосов
/ 16 ноября 2009

PDF позволяет заблокировать документ (исходный текст будет зашифрован, но читабелен), поэтому свойства не позволят читателю распечатать или скопировать его.

В любом случае, я бы не рекомендовал это использование, так как использование такого PDF - это боль в заднице. Лично я бы порекомендовал вам искать другие способы, чем активно злить читателей ваших документов.

PS: сбор писем из PDF практически неслыхан.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...