Существуют ли надежные / развернутые подходы, алгоритмы или инструменты для маркировки типа веб-сайта путем анализа некоторых его веб-страниц.
Например: форумы, блоги, сайты PressRelease, новости, E-Comm и т. Д.
Я ищу некоторые четко определенные характеристики (статические правила), по которым это можно определить.Если нет, то я надеюсь, что модель машинного обучения может помочь.
Предложения / Идеи?