Написание собственной программы для классификации сайтов будет нелегким делом.Возможно, вам потребуется разработать систему на основе ИИ, которая будет посещать каждый сайт, чтобы собрать необходимые данные, и на основе данных и ключевых слов определить, какой это тип сайта.Это моя идея, может быть, есть лучший подход для этого.
Скорее, вы должны использовать сторонние веб-сайты.Есть много платных и бесплатных провайдеров информации о категориях сайтов.Для категоризации веб-сайтов проверьте следующие ресурсы: SimilarWeb , Webshrinker , Symantec , cyren .Надеюсь, что это поможет.