URL для удаления из пользовательского ввода - PullRequest
0 голосов
/ 07 июня 2011

В настоящее время я создаю веб-сайт, на котором пользователь может добавлять текст в базу данных. Я пытаюсь написать код, который удалит все URL-адреса, которые были записаны в тексте.Он должен быть в состоянии найти все префиксы (www., "None" http://) и все суффиксы (.com, .co.uk, .de). Я понимаю, что это трудная задача, так как URL могут входить в различные вариантыСпособы, следовательно, я прошу любой совет здесь. Ниже приведены некоторые примеры того, как пользователи могут скрывать URL-адреса (пожалуйста, добавьте любой, если у вас есть какие-либо ссылки).google.co.uk

www.google.de

www. google. com

w | w | w |. | g | o | o | g | l| е |. | с | о | м

1 Ответ

1 голос
/ 07 июня 2011

Вы можете настроить регулярные выражения для поиска известных вариантов, но создание алгоритма, который улавливает любой вариант, который может добавить пользователь, невозможно.Если вы хотите вступить в эту битву, она будет продолжаться, так как люди, намеревающиеся обойти вашу систему, найдут способ.

Это не значит, что все безнадежно.Вы можете начать банить пользователей, которые делают подобные вещи.Вы также можете заставить каждого быть пользователем, чтобы иметь возможность применять.Запрет определенных IP-адресов также вариант.Это по-прежнему не остановит постоянных комаров, но 100% решение стоит дорого.

Каков контекст этого требования?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...