Как я могу избежать генерации неподходящих слов при автогенерации строк из алфавита? - PullRequest
4 голосов
/ 07 января 2010

Существует ли загружаемый словарь (по сути, просто текстовый файл), который содержит общие ругательства или другие неуместные слова на разных языках?

Предыстория: я переписываю URL Shortener (просто приложение Proof of Concept - у мира в любом случае уже достаточно сокращателей), и для этого я конвертирую числовые идентификаторы в строки, кодируя их с помощью Base36. Теперь проблема с этим подходом заключается в том, что он последовательный, поэтому незадачливые люди, которые сокращают URL, который идет после faf или fucj, могут не быть довольны своими результатами, если только они точно не ждут этого момента и не используют его для сокращения URL своего URL. любимый политик.

Итак, я хочу черный список. InsultMonger здесь не очень помогает.

Как уместно. Ты борешься как корова.

Ответы [ 2 ]

11 голосов
/ 07 января 2010

Просто удалите все гласные (и Y) из вашего потенциального алфавита, тогда у любого, кто увидит нецензурную лексику, должно быть сверхактивное воображение.

1 голос
/ 08 января 2010

Вот большой многоязычный список: http://nerdcereal.com/blog/wp-content/uploads/2007/04/multilingualswearlist.txt

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...