Предотвращение кражи данных - PullRequest
1 голос
/ 14 ноября 2010

Я знаю, что невозможно предотвратить кражу наших данных людьми, но у меня есть большая база данных, и я хочу, по крайней мере, запретить краже моей базы данных автоматическими скриптами.

Мои идеи пока:

  • использовать JavaScript или кодировать HTML = тяжелый и может быть легко декодирован
  • recaptcha для поиска = ни за что, пользователи просто покинут мой сайт
  • вставка случайных данных и тегов в HTML сайта, чтобы избежать регулярных выражений rip = good?

Любые идеи приветствуются.

Ответы [ 3 ]

2 голосов
/ 14 ноября 2010

Почему люди хотят украсть вашу базу данных?Почему это важно, если они делают?Если вы попросите их не быть достаточными?

Разъясните вашу политику и убедитесь, что юридический отдел вашей компании проверил формулировку.Не допускайте несанкционированной синдикации, давая понять, что она не разрешена и что вы предпримете правовые меры для ее предотвращения.

Или, что еще лучше, поощряйте авторизованную синдикацию.Люди будут проводить несанкционированную синдикацию только в том случае, если у них нет разумного способа сделать это санкционированным образом.

Технические меры могут иметь определенный эффект, но будут сдерживать только тех, кто не обладает определенной компетентностью или решительностью.

1 голос
/ 14 ноября 2010

Ни одно из предложенных вами решений не будет работать. Хороший сценарист может легко обойти это. Но есть техническое решение для этого на стороне сервера приложений: установить ограничение скорости. Разрешить только один поиск с данного IP-адреса один раз каждые, скажем, 10 секунд. Это сделает медленный сбор данных с вашего сайта очень медленным.

0 голосов
/ 14 ноября 2010

Я думаю, что Alexa вставляет случайные теги в разметку, и это дало мне чертовское время, когда я пытался его майнить ... они добавили несколько дополнительных тегов в рейтинг Alexa, например <span class="a5r">35</span><span class="et4">52</span><span class="arer">16</span>, и если вы не загрузилиТаблица стилей тоже и смотрел на правила рендеринга, вы не могли понять, какое число это должно быть.

Но ... если бы я был достаточно терпелив, я мог бы "отрендерить" числа, а затемзаминировал это, но это просто не стоило это для меня.Ограничение запросов страниц до максимально возможного количества человек, вероятно, будет работать хорошо (50 / мин или что-то в этом роде).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...