Я хочу классифицировать IP-адрес как плохой, нейтральный или хороший. У меня есть 3 параметра, т.е.
- Является ли IP-адрес от облачного провайдера, такого как DigitalOcean (может быть только true или false)? если так, мы оштрафуем это.
- Является ли IP известным VPN / прокси (может быть только true или false), мы снова оштрафуем его.
- Происходит ли IP из тенистого су bnet (доверительная оценка в процентах)? Мы оштрафовали его.
Сначала я хотел использовать метод измерения веса, основанный на оценке кредитоспособности, то есть каждый из 3 условий несет по 5 баллов. Каждый отдельный параметр будет иметь процентную оценку, поэтому, если это облачный провайдер, мы даем ему 10/100, в противном случае мы можем сказать, что он дает 100/100.
Проблема в том, что этот подход приведет к ложным отрицаниям и Оптимизация общего диапазона классификации веса также будет проблемой.
Также могут возникнуть различия в диапазонах оценок. Например, в облачном провайдере может быть либо истина, либо ложь, тогда как у теневого домена могут быть индивидуальные оценки, основанные на существующих данных.
Каков будет более разумный подход к решению этой проблемы? Будет ли дерево решений достаточно хорошим или я должен выбрать KNN?