Я ищу список распространенных плохих слов, чтобы я мог создать фильтр.
Предпочтительно список с целыми словами, я не хочу отфильтровывать каждое слово, содержащее плохое слово (то есть фильтрация всех слов, содержащих задницу, отфильтровывает «убийство»)
Я собрал 2200 плохих слов на 12 языках: en, ar, cs, da, de, eo, es, fa, fi, fr, hi, hu, it, ja, ko, nl, no, pl, pt ru, sv, th, tlh, tr, zh.
Доступны опции MySQL dump, JSON, XML или CSV.
https://github.com/turalus/openDB
Список слов плюс скрипт для вставки в базу данных MySQL:
http://urbanoalvarez.es/blog/2008/04/04/bad-words-list/
Выезд: Без ругательств. . в настоящее время они имеют ограниченный API, но вы можете сделать http-запрос напрямую, используя их URL поиска.
http://www.noswearing.com/search.php?st=ass&submit=Search