Все системы, которые мне известны, управляют списком, несколько вручную.
Используя прокси-серверы веб-фильтрации (например, WebSense) для вдохновения, вы можете сканировать ключевые слова, содержащиеся в имени домена или в веб-контенте / метатегах в указанном месте. Тем не менее, всегда есть элементы, которые соответствуют нескольким категориям или не имеют категорий, и они требуют более глубокого анализа.
В конечном итоге вы в конечном итоге создаете свою довольно сложную логику, ведете список вручную или покупаете список у кого-то другого.